我写了个解析Html文件的东西,将Html解析成标签树,但是不知道对于大型的搜索引擎是否可行,我感觉速度还可以 
在Intel2.8G,768M的机器上,解析sina首页仅仅需要0.3秒左右。 http://blog.csdn.net/RonoTian/archive/2008/06/06/2517568.aspx 欢迎来讨论