如题,怎么提取网页中出现频率较高的字词,文本中也可以,不考虑网页也可以,比如
例子
   我幻想我是一只小鸟,飞在蓝蓝的天空;我幻想我是一条小鱼,游在蓝蓝的水中;我幻想我是一只蝴蝶,隐在美丽的花丛中。例子中‘我幻想我’出现的频率比较高,应提取出来。大概就是这么个过程。