关于网络抓取的,希望给点思路 想做个小程序,实现从网上抓取某些图书的信息,比如图片、价格。貌似这些只有几个大的网站才有比如当当但是怎么样才能从当当网下载我需要的图书的页面?http://product.dangdang.com/product.aspx?product_id=20910562比如这本书,我怎么才能得到product_id...如果有别的可行的思路,也可以。 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 我去年做过一个,抓取京东、当当、卓越亚马逊的图书信息的,如果有需要,留一个邮箱,发给你参考一下吧。主要思路就是模拟请求-》获取html-》解析但是问题就是,当要抓取的页面结构发生变化的时候,代码也要跟着变动。这个代码如果现在抓取不到数据的话, 你可以自己debug一下, 很可能是因为对方页面结构变动之后,没有正确匹配的关系。记得给给我分哦 感谢2楼,求发哈。[email protected] 正则抓取啊。写个winform模拟浏览器去访问就可以了然后把下载的html进行正则抓起。希望楼主有request的方面的知识。要看懂浏览器的请求头。其他就ok了 先了解http协议啊。用httpwatch观察http请求报文。先得有大概思想。 谢谢1楼,麻烦发个我参考下[email protected] 2位,lichaoasd、CrazyCode1981, 我把代码发到你们邮箱了,写的不太好,有什么好的想法一起交流啊 Analysor文件夹下的类,就是对外的分析图书信息的类,其他的都是分析底层结构,你们可以自行进行修改 想用C#写一个在线考试系统,无头绪,请问要怎么去写,都用什么功能?? 关于获取在窗体上单击鼠标时的位置,在线等 登录窗体调用主窗体后,如何让登录窗体关闭呢? 如何把word中的公式以图片的形式拷贝到剪切板中? 正则表达式匹配代码中的中文的问题,很难 在vs.net2005环境开发vss6.0应该如何配置?顶者有分 在C#的Winform中 怎样隐藏dataGrid控件的列,使某一列不显示 如何自动在今天更新的新闻前加小图片??求教各为高手!! DataGridView批量修改数据 DataGrid绑定的问题? 很简单的一个问题,取根目录。。。。 c# 给webBrowser 中的元素画框
[email protected]