在网上看到有人说用分析网页源代码的方法,来分析字符串<table>,<tr>,<td>之类,但这不可行吧。
因为网页里的表格跟数据库的表格不是同一概念,为了排版,网页也会用到表格标记的。
这样做的话会得到很多不是我需要的表格的。
我只需要获取就象数据库里的那种有列名的数据表格,也就是数据库里的关系模型的结构。
如果用IHTMLTABLE接口的话,好象也会得到很多我不需要的表格。 不知道我表达的怎么样,大家听懂没有? -___-
请大侠们指教! ^_^
解决方案 »
- directshow stop函数
- com组件 CPoint CRect CSize 不明确的符号
- XP 下的 ::PostMessage 与win2003不一样吗?在2003上::PostMessage发送消息没错,一到XP上就有问题了,查也没要出来,只是消息一发送整运行的
- 哪个函数可以让list contrl中的记录清空??
- 在线程中使用定时器,高手帮忙看看
- 这个触发器怎么写呢
- 新鲜问题,翻遍CSDN还是要发贴才有可能解决!
- 请教一个DLL的问题,实在没法了,请高手们帮助一下
- callback函数到底是什么原理,什么情况下用他,我只知道他是以其他函数地址作为参数的?
- =====?谁能解释下面这段代码?=====
- 这个代码里面加入输出到文本文件,出错了!
- MFC 删除文件
谢谢你听懂了.^0^
不过我分析的是别人的网页,能拉人家数据库的东西的么?
"网站的网页格式一般都是固定的,分析 <table >等标签应该可行。至于会有不需要的table那就要具体分析了,找出需要table的特有特征。"要分析好多网页,这样很麻烦了.. >_<