14 lines
875 B
Markdown
14 lines
875 B
Markdown
|
1) 布隆过滤器用于集合的建立与查询,并可以节省大量空间
|
||
|
2) 一致性哈希解决数据服务器负载管理问题
|
||
|
3) 利用并查集结构做岛问题的并行计算
|
||
|
4) 哈希函数可以把数据按照种类均匀分流(相同的数据一定在一块)
|
||
|
5) 位图解决某一范围上数字的出现情况,并可以节省大量空间
|
||
|
6) 利用分段统计思想,并进一步节省大量空间
|
||
|
7) 利用堆,外排序来做多个处理单元的结果合并
|
||
|
|
||
|
## 4
|
||
|
100G的数字文件取出出现次数最多的前100个数字.
|
||
|
|
||
|
将100G利用Hash分为100个文件,将每个文件里的数据统计(相同的数据必定进入同一个文件),
|
||
|
取出每个文件的第一个数据,统计拿出第一个,这个就是想要的第一个数字,第一数字从那个文件中拿出,
|
||
|
去原来文件拿第二个统计,取出第一个,一簇循环取出100个
|