一个面试的题目，无从下手，急。。。

无非是读取HTML代码，然后分析，应该不难啊。

to lc_mtt(柠檬)：能否说的明白点哦？里面有好几万的企业数据，当然想通过程序实现了，若是手工的意思，那就罢了罢了
同意楼上：
这样的公司要么是专门为广告公司、市场调查公司服务的，要么就是做广告的公司，谨慎为好。不过从技术的角度来说，难度应该不是很大。
做法：
第一步：根据选择进入下一链接。
第二步：同上，下同，直至打开有详细信息的页面。
第三步：分析页面：由于详细信息只是Table中的文本，需要对文本进行识别，如：通信地址：，该行后面的为通信地址的内容。其他信息采集方法相同。
第四步：保存信息。技术要点：
1、 Web操作，基础技术，网上很多源码（包括CSDN）。
2、 Web操作的页面分析：读出对象（Table），分析文本。总体来说，难度不是很大，加油吧。祝你成功。一路上小心。
要直接分析HTML代码应该还不是让人头疼，但现在许多的网页代码都是采用加密的哦
>2、 Web操作的页面分析：读出对象（Table），分析文本。偶现在就差不知道怎么去分析提取网页对象，比如<TD>,<A>,<DIV>等
哪位高手盼指导一二？