我们经常会收到新的文件
然后就要添加到我们已有的文件里
但新文件里会有以前已经存在的数据
现在要求一个好算法
能高速合并成一个文件,已经存在的数据行就不再重复1.txt
123
234
3452.txt
234
456合并结果文件
123
234
345
456
然后就要添加到我们已有的文件里
但新文件里会有以前已经存在的数据
现在要求一个好算法
能高速合并成一个文件,已经存在的数据行就不再重复1.txt
123
234
3452.txt
234
456合并结果文件
123
234
345
456
解决方案 »
- tab控件继承cwnd自绘//切换标签卡是什么原因造成的?
- 当窗口变大时,如何使自己绘制的图像相对窗口的位置不变
- 游戏子窗口有句柄跟标题吗
- fw.Open(_T("1.txt"),CFile::modeWrite|CFile::typeText);请问_T是什么意思
- 如何从单片机系统中通过RS232接口读入大量数据并将数据转换成Excel格式
- 关于文件操作,实现文件的创建填充使用什么函数比较好,考虑到程序的效率和安全性
- 如何用LoadLibrary和GetProcAddress动态的调用DLL?
- 请教一下个为牛人?
- 用MFC怎么获取局域网的IP
- 送上全部分数!!!如何备份注册表中一个主键以及它所包含的所有子项的内容?
- 关于SetWindowOrg()的基础问题
- ReadFile在同步方式下能不能设成超时状态?
评咱这技术恐怕难实现。
要是有oracle就好了。多开些线程读文件。用insert ... where ... not in table 插进去。读出来生成新文件
如果结果不要求有序那么只需要生成一个索引文件就成了,每个已存在的记录根据md5 or crc32等算法生成一个数,然后把这个数排序放到索引文件中,新来数据的话只要同样算一个特征值,查找是否已存在,如果不存在就加到结果的末尾,如果存在就跳过。嗯。我觉得挺好的