有什么好的算法能快速、准确的提取文本文件中的句子,和短语?是汉语句子。 提出后按条保存到一个文本文件中。
1、句子1
2、句子2
3

解决方案 »

  1.   

    中文的正则表达式是:[\u4e00-\u9fa5]1. 下载PilotEdit 3.1, http://topic.csdn.net/u/20100327/22/0b5656cb-f2c7-49c5-931c-1bd639ace04d.html
    打开文本文件。比如如下内容:    * 对我有用[0]测试
        * 丢个板砖[0]
        * 引用
        * 举报
        * 管理
        * TOP
    2. 点排序按钮,选择“比较由正则表达式定义的字符串”,输入下面的正则表达式和目标字符串:
    正则表达式:[\u4e00-\u9fa5]+[|!\u4e00-\u9fa5]
    目标字符串:%01%\r\n3. 点“将目标字符串拷贝到剪贴板”,即可将中文内容拷贝到剪贴板:对我有用
    测试丢个板砖引用举报管理
      

  2.   

    1. 下载PilotEdit 3.1, http://topic.csdn.net/u/20100327/22/0b5656cb-f2c7-49c5-931c-1bd639ace04d.html
    打开文本文件。比如如下内容:    * 对我有用[0]测试
        * 丢个板砖[0]
        * 引用
        * 举报
        * 管理
        * TOP
    2. 点排序按钮,选择“比较由正则表达式定义的字符串”,输入下面的正则表达式和目标字符串:
    正则表达式:[\u4e00-\u9fa5]+[|!\u4e00-\u9fa5]
    目标字符串:%01\r\n3. 点“将目标字符串拷贝到剪贴板”,即可将中文内容拷贝到剪贴板:对我有用
    测试丢个板砖引用举报管理
      

  3.   

    可以采用FSO模式,先取出放到一个string数组,然后一起写入到文件.