1、面向用户的网页信息提取可以根据用户的需求对复杂的网页信息进行归类整理,为信息的利用或二次利用提供方便。这些信息包括常规文本、图片、链接块、表格信息等。
2、采用C#实现网页信息自动提取。主要包括网页结构分析,网页分析模型的建立,常规文本信息的抽取、表格信息的抽取,图片和链接块的抽取等。
---------------------------------------------
上面就是做一个系统的要求,小弟想知道在实现这个系统,***所要涉及的技术****。那位大哥能给哥流程图。
谢谢!