1 语料库 中 存放 是 在 语言 实际 使用 。 中 真实 出现过 语言 材料 。    
2 语料库 是 承载 语言 知识 。  基础 资源 不等于 语言 知识 。  
不知道图片是否插入成功,很少发帖,就把图片的内容在打上去了。上面两句话是用空格格开的字符串,最前面的数字是行号,要求统计每一行中每一句话的起始位置和终止位置
比如第一行中有两句话  那就是1:1-8~10-14  这个算式的意思是  第一行:第一句话是第一个词到第八个词,第二句是从第十个词到第十四个词,因为句号也占用一个词,所以第二句的是从第十个词开始。以上只是片段,实际有好多行,每行有好多句号  请教JAVA代码~

解决方案 »

  1.   

    貌似public String[] split(" ")一键搞定,然后遍历数组就行了吧。。
      

  2.   

    1楼的说的差不多了,用Scanner.readLine()解决每行读取的问题,然后把readLine的结果用split,就分好词了。
      

  3.   

    这个确实得先用split分  但是统计出来的东西是没有句号的位置信息的   
      

  4.   

    也就是说  统计每1行中 每句话的起始位置   第二句话的位置在第一句话的位置结果上累加   单用spilt分空格会有句号