如题:
海量日志数据查询,搜索引擎会将每次用户输入的查询字符串进行记录,假设目前已有1000万条查询字符串记录,每个查询字符串的长度是1-255个字节,去重后不足300万条记录,请你计算出重复度最高的前10个查询字符串。要求使用内存不能超过1G。
请问大家, 该怎么搞??