1、面向用户的网页信息提取可以根据用户的需求对复杂的网页信息进行归类整理,为信息的利用或二次利用提供方便。这些信息包括常规文本、图片、链接块、表格信息等。
2、采用C#实现网页信息自动提取。主要包括网页结构分析,网页分析模型的建立,常规文本信息的抽取、表格信息的抽取,图片和链接块的抽取等。
---------------------------------------------
上面就是做一个系统的要求,小弟想知道在实现这个系统,***所要涉及的技术****。那位大哥能给哥流程图。
谢谢!
2、采用C#实现网页信息自动提取。主要包括网页结构分析,网页分析模型的建立,常规文本信息的抽取、表格信息的抽取,图片和链接块的抽取等。
---------------------------------------------
上面就是做一个系统的要求,小弟想知道在实现这个系统,***所要涉及的技术****。那位大哥能给哥流程图。
谢谢!
解决方案 »
- 有谁知道?在线等。。。
- WebBrower.url 怎么显示aspx文件 显示asp。net网页(aspx文件在本地)
- vs 2008的C#有inline函数吗?
- C#数据库添加数据,代码应该如何添加呢?
- 如何通过代码修改web.Config?
- 程序抛出了“正在终止线程”的异常
- 想做个类似QQ界面的程序,找不到SideBar.dll
- 如果把resx文件删除了该这样生成?
- 安装c#开发工具,应该下载下面哪个iso文件?
- 请问高手,如何用程序修改本机的网卡的物理地址?
- 求解:假如单纯从C#访问机制来说,C#调用用C++语言写的DLL效率高还是用C#的类效率高?
- C#编写C/S模式的整个文件夹上传的问题
http://www.codeproject.com/aspnet/Spideroo.asp不一定能完全满足你的需要,但是应该能给你一些启发和帮助。
http://codelib.threeus.com/CodeLib.htm