1) 布隆过滤器用于集合的建立与查询,并可以节省大量空间 2) 一致性哈希解决数据服务器负载管理问题 3) 利用并查集结构做岛问题的并行计算 4) 哈希函数可以把数据按照种类均匀分流(相同的数据一定在一块) 5) 位图解决某一范围上数字的出现情况,并可以节省大量空间 6) 利用分段统计思想,并进一步节省大量空间 7) 利用堆,外排序来做多个处理单元的结果合并 ## 4 100G的数字文件取出出现次数最多的前100个数字. 将100G利用Hash分为100个文件,将每个文件里的数据统计(相同的数据必定进入同一个文件), 取出每个文件的第一个数据,统计拿出第一个,这个就是想要的第一个数字,第一数字从那个文件中拿出, 去原来文件拿第二个统计,取出第一个,一簇循环取出100个