给你个简洁的思路。首先软件通过google或是百度之类的搜索引擎进行关键字查找。然后会得到一大批http连接。然后一个个取得相关http连接的的页面文件,用正则表达式找出合条件的email地址或是mp3下载地址,若是mp3下载地址再测试一下是否有效,然后将不重复的存入数据库。
这思路肯定有效而且可行,要求也不复杂。
要不你就得用人工智能了。就是自已写个和google的搜索引擎相似的工具。。哪估计不是一般人搞得定的。你非得做的话可以参考一下北大天网的那个ftp搜索引擎,那个项目好象是开源的,你看看能不能参与进去。

解决方案 »

  1.   

    那我的程式怎样去利用google等等之类的搜索引擎呢?
    是通过什么去对接什么呢?谢谢!
      

  2.   

    很简单,比如你在IE里用google 查"@sina.com"这个字符串,回车
    然后你会看到上面地址栏就会带一串参数,把这串参数copy下来,每次要用的时候通过你的程序发过去,就会给你返回一个页面了。
      

  3.   

    我查时看到:
    http://www.google.com/search?hl=zh-CN&[email protected]&btnG=Google%E6%90%9C%E7%B4%A2&lr=
    那我应该copy这一段"http://www.google.com/search?hl=zh-CN&q="吧,我搜索时,把要查的如“布什”,那么我就传"http://www.google.com/search?hl=zh-CN&q=布什"过去,是这样理解吗?