比如下面一段英文:
Startingfromamemberofanimagedatabasedesignatedthe“queryimage,”traditionalimageretrievaltechniques,forexample,searchbyvisualsimilarity,allowonetolocateadditionalinstancesofatargetcategoryresidinginthedatabase.However,inmanycases,thequeryimageor,moregenerally,thetargetcategory,residesonlyinthemindoftheuserasasetofsubjectivevisualpatterns,psychologicalimpressions,or“mentalpictures.”
切词后的效果:
Starting from a member of an image data base designated the“query image,”traditional image retrieval techniques,for example,search by visual similarity,allow one tolocate additional instance so fatarget category residing in the data base.How ever,inmany cases,the query imageor,more generally,the targetcategory,resides only in the mind of the use rasa set of subjective visual patterns,psychological impressions,or“mentalpictures.”欢迎大家讨论。

解决方案 »

  1.   

    http://bbs.zbitedu.com/redirect.php?fid=40&tid=5445&goto=nextnewset
    这里有个中文切词的
      

  2.   

    是呀、、跟人工智能差不多了、、
    上次看到一个帖子求拼音转成汉字的,应该是不可能转了、很多都是同音字就算是人,也不可能转的完全正确,
    不过你这个英文的应该比中文好转一些、、弄个词库匹配
    不过有词库,也不能完全转正确,毕竟是机器,比如database,是直接转成database呢,还是转成data base,
    这个转法也很难说的、、
      

  3.   

    分3步1、需要有词库才行
    2、需要有快速的分词算法(Trie及后缀树之流)
    3、需要有大量的统计数据,才能做到分词准确,这又是另一个领域的问题了。