有个公司来我们学校搞了个程序设计大赛,里面有道题目就是低频词过滤,只学过c啊,但是想用c++ 做,一点头绪都没有,大家给点意见吧,貌似这道题目就是javacup去年的初赛试题,题目的要求如下~因为我没有c++基础,所以希望大虾能说的细点,
这个是我网上找到的人家的解法(http://my.phome.cn/alvinliu/article.asp?id=129)
但没基础,看起来吃力四了,最后哪个好心人能帮忙解释清楚点啊~
题目1: 低频词过滤 题目描述:请编写程序,从包含大量单词的文本中删除出现次数最少的单词。如果有多个单词都出现最少的次数,则将这些单词都删除。 输入数据:程序读入已被命名为corpus.txt的一个大数据量的文本文件,该文件包含英文单词和中文单词,词与词之间以一个或多个whitespace(制表符、空格符和换行符一般被统称为“白字符”(whitespace characters))分隔。(为便于调试,您可下载测试corpus.txt文件,实际运行时我们会使用不同内容的输入文件。) 输出数据:在标准输出上打印删除了corpus.txt中出现次数最少的单词之后的文本(词与词保持原来的顺序,仍以空格分隔)。
评分标准:
程序输出结果必须正确,内存使用越少越好,程序的执行时间越快越好
这个是我网上找到的人家的解法(http://my.phome.cn/alvinliu/article.asp?id=129)
但没基础,看起来吃力四了,最后哪个好心人能帮忙解释清楚点啊~
题目1: 低频词过滤 题目描述:请编写程序,从包含大量单词的文本中删除出现次数最少的单词。如果有多个单词都出现最少的次数,则将这些单词都删除。 输入数据:程序读入已被命名为corpus.txt的一个大数据量的文本文件,该文件包含英文单词和中文单词,词与词之间以一个或多个whitespace(制表符、空格符和换行符一般被统称为“白字符”(whitespace characters))分隔。(为便于调试,您可下载测试corpus.txt文件,实际运行时我们会使用不同内容的输入文件。) 输出数据:在标准输出上打印删除了corpus.txt中出现次数最少的单词之后的文本(词与词保持原来的顺序,仍以空格分隔)。
评分标准:
程序输出结果必须正确,内存使用越少越好,程序的执行时间越快越好
解决方案 »
- 高分求助关于1000数量级的排序问题,求指教
- 标题1:用独立服务器的站长常犯的错误
- 使用CTreeCtrl时,初次显示就显示一级子节点信息,不显示二级孙子节点信息
- 串口问题:接收到字符的总是比我发的少1,而最后发的那个字符则会触发新的一次中断
- 对话框窗口标题栏为何不能响应鼠标?????
- 识别一幅bmp图像中的某个关键物体
- 请教一个简单的算法(关于打字程序)
- 求助: WIN7+VS2008对话框按扭样式不符
- 定义了一个结构体CArray其中又嵌套结构体CArray,在对外层CArray进行Add时出错
- 如何在一个程序中使另一程序弹出到前台(无论它处于后台还是最小化)?
- 怎么样做到“磁性窗口”的效果啊,象Winmap一样的?
- [急!!!]请问生成一个CArray数组后,无法对其里面的元素对象进行修改是怎么回事啊?
有空借来看看,有很详细的解说。至少你提供的连接,我看看
恩,去看看先,哎,还要参加一个java的团体项目,一个月呀做的事情还真多啊~~
C++Primer第三版,用STL
每当遇到一个词,去映射中匹配,匹配失败,就加入,同时计数器置1. 匹配成功,计数器加1. 最后比较各映射项的计数器, 最小的就是最低频的呀.
每当遇到一个词,去映射中匹配,匹配失败,就加入,同时计数器置1. 匹配成功,计数器加1. 最后比较各映射项的计数器, 最小的就是最低频的呀.