有个问题想和各位探讨探讨,如题,今天下午本人在写一个功能,即检测内容中的链接,如果为站外链接,则过滤掉。我个人认为想正确的实现这个功能,应该要解析出链接中的一级域名才行,于是就出现下面的问题。假设内容中有 <a href="http://abc.com.cn/pc/index.shtml">测试链接</a>链接中abc.com.cn应该理解成一级域名还是二级域名呢?
如下:
abc.com.cn理解成com.cn域名,abc是一级域名
abc.com.cn理解成cn域名,com是一级域名,abc是二级域名望高人指点!!
如下:
abc.com.cn理解成com.cn域名,abc是一级域名
abc.com.cn理解成cn域名,com是一级域名,abc是二级域名望高人指点!!
LZ, 这个问题好像不难解决吧。
你写的程序肯定是放在一个具体的站点中的,那这个站点的域名也肯定是固定的,
既然站点域名固定,那么对于一个具体的站点域名,程序员可以事先指定这个站
点的一级域名(就是说不需要判断abc.com.cn应该怎么分析,而是交由人工指定)。
你可以做个简单的判断呀
遇到
.com.cn
.net.cn
.org.cn
.gov.cn
前面的全部当作一级域名!
1、http:// 、https://、ftp:// 等开头;
2、域名非本站域名;