各位同仁,兄弟一直想用java做个简单的类似 狗狗搜索的东西;现在的难度是如何分析这些链接
过程是自己写爬虫去爬取网页;发现网页上的资源文件地址--将其下载链接存储下来;我一直在找相关的链接分析的资料(主要针对可以下载的链接分析);一直无果;求各位大神给个建议提示:
如有什么开源的包啊!可以针对下载链接的分析的文章啊!多多益善。
我的目标主要是发现 音乐 电影 PDF doc ppt 等格式的下载链接。