假使有一篇文章,中英文若干字混合。
文章中有‘sina.com.cn’,‘baidu.com’等不完整的网址。
如何批量,识别" .cn", ".com", ".net" 结尾,并在前面补全" http://www. "
文章是.DOC格式,必要时可以复制粘贴成.HTML格式,配合PHP代码完成。

解决方案 »

  1.   

    首先得看是几级域名,一般先判断"."的个数,经过分析再判断是否加上"www"
      

  2.   

    示例
    $s = <<< TEXT
    假使有一篇文章,中英文若干字混合。
    文章中有‘sina.com.cn’,‘baidu.com’等不完整的网址。
    如何批量,识别" .cn", ".com", ".net" 结尾,并在前面补全" http://www. "
    文章是.DOC格式,必要时可以复制粘贴成.HTML格式,配合PHP代码完成。
    TEXT;function foo($v) {
      if(in_array($v[1], array('cn', 'com', 'net')))
        return 'http://www.' . $v[0];
      return $v[0];
    }echo preg_replace_callback("/(?:\w+\.)+(\w+)/", 'foo', $s);假使有一篇文章,中英文若干字混合。
    文章中有‘http://www.sina.com.cn’,‘http://www.baidu.com’等不完整的网址。
    如何批量,识别" .cn", ".com", ".net" 结尾,并在前面补全" http://www. "
    文章是.DOC格式,必要时可以复制粘贴成.HTML格式,配合PHP代码完成。
      

  3.   

    果然成啦~~
    就是N万字复制粘贴处理,速度超慢……
    感谢xuzuning,那么多勋章好炫哦……