取url容易,取内容难字符串截取
正则找出头尾

解决方案 »

  1.   

    1、先把多节字符串处理成一个。比如空格、换行的什么的,全部替换为你自己定义的伪代码。比如[[::]][[:::]]。
    2、获得其中你需要取url的部分。找到一头一尾,取中间就行。
    3、用你现在用的办法。获取所有url并放入一个数组。
    4、循环数组。重复上面的步骤。并将获得字符串保存(存入数据库或存为文件)。
      

  2.   

    ("/\ <\!\-\-hotNews_begin\-\-\>(.*?)\ <\!\-\-hotNews_end\-\-\>/is
    这个正则有问题,改成:("/\<\!\-\-hotNews_begin\-\-\>(.*?)\<\!\-\-hotNews_end\-\-\>/is, 
    "\"和"<"间不要空格