875 B
875 B
- 布隆过滤器用于集合的建立与查询,并可以节省大量空间
- 一致性哈希解决数据服务器负载管理问题
- 利用并查集结构做岛问题的并行计算
- 哈希函数可以把数据按照种类均匀分流(相同的数据一定在一块)
- 位图解决某一范围上数字的出现情况,并可以节省大量空间
- 利用分段统计思想,并进一步节省大量空间
- 利用堆,外排序来做多个处理单元的结果合并
4
100G的数字文件取出出现次数最多的前100个数字.
将100G利用Hash分为100个文件,将每个文件里的数据统计(相同的数据必定进入同一个文件), 取出每个文件的第一个数据,统计拿出第一个,这个就是想要的第一个数字,第一数字从那个文件中拿出, 去原来文件拿第二个统计,取出第一个,一簇循环取出100个