无非是读取HTML代码,然后分析,应该不难啊。

解决方案 »

  1.   

    to lc_mtt(柠檬):能否说的明白点哦?里面有好几万的企业数据,当然想通过程序实现了,若是手工的意思,那就罢了罢了
      

  2.   

    同意楼上:
    这样的公司要么是专门为广告公司、市场调查公司服务的,要么就是做广告的公司,谨慎为好。不过从技术的角度来说,难度应该不是很大。
    做法:
    第一步:根据选择进入下一链接。
    第二步:同上,下同,直至打开有详细信息的页面。
    第三步:分析页面:由于详细信息只是Table中的文本,需要对文本进行识别,如:通信地址:,该行后面的为通信地址的内容。其他信息采集方法相同。
    第四步:保存信息。技术要点:
    1、 Web操作,基础技术,网上很多源码(包括CSDN)。
    2、 Web操作的页面分析:读出对象(Table),分析文本。总体来说,难度不是很大,加油吧。祝你成功。一路上小心。
      

  3.   

    要直接分析HTML代码应该还不是让人头疼,但现在许多的网页代码都是采用加密的哦
      

  4.   

    >2、 Web操作的页面分析:读出对象(Table),分析文本。偶现在就差不知道怎么去分析提取网页对象,比如<TD>,<A>,<DIV>等
    哪位高手盼指导一二?