有个问题想和各位探讨探讨,如题,今天下午本人在写一个功能,即检测内容中的链接,如果为站外链接,则过滤掉。我个人认为想正确的实现这个功能,应该要解析出链接中的一级域名才行,于是就出现下面的问题。假设内容中有 <a href="http://abc.com.cn/pc/index.shtml">测试链接</a>链接中abc.com.cn应该理解成一级域名还是二级域名呢?
如下:
abc.com.cn理解成com.cn域名,abc是一级域名
abc.com.cn理解成cn域名,com是一级域名,abc是二级域名望高人指点!!

解决方案 »

  1.   

    链接中abc.com.cn应该理解成一级域名还是二级域名呢?
    LZ, 这个问题好像不难解决吧。
    你写的程序肯定是放在一个具体的站点中的,那这个站点的域名也肯定是固定的,
    既然站点域名固定,那么对于一个具体的站点域名,程序员可以事先指定这个站
    点的一级域名(就是说不需要判断abc.com.cn应该怎么分析,而是交由人工指定)。
      

  2.   

    肯定是理解成一级域名了
    你可以做个简单的判断呀
    遇到
    .com.cn
    .net.cn 
    .org.cn 
    .gov.cn 
    前面的全部当作一级域名!
      

  3.   

    *.com,不带WWW的为一级域名,带3W的为子域名。 http://www.shmpsoft.net.cn
      

  4.   

    正则分析链接。站外链接需要符合两点:
    1、http:// 、https://、ftp:// 等开头;
    2、域名非本站域名;