比如现在有一个新闻网页
有一级标题和新闻的主体内容如何把各种标记和广告之类的没关系的去掉,经过分析之后只留下新闻的标题,和新闻的内容。谁有这样的算法,或是什么的,能不能提供以下,我非常着急,谢谢各位了 。。