比如现在有这样的一个列表
这是一个图书的某一章节在不同站点的标题
http://www.booksky.org/BookDetail.aspx?BookID=1049692
假设 每行标题代表一个变量,那么怎么判断才能得出这些标题是同一书籍呢?
呃 可能表述的不清楚
我qq:3390074异界重生之打造快乐人生 03 回归 03 云轩阁 2010/5/7 1:26:35 
异界重生之打造快乐人生 正文 卷九 亚里斯大陆逍遥客 03 回归 03 就上文学 2010/5/7 1:09:11 
异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 纵横书海 2010/5/7 1:02:49 
异界重生之打造快乐人生 03 回归 03 58小说 2010/5/7 1:02:29 
异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 来看书吧 2010/5/7 1:01:30 
异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 天天中文 2010/5/7 0:58:05 
异界重生之打造快乐人生 正文 03 回归 03 3G华夏 2010/5/7 0:57:15 
异界重生之打造快乐人生 VIP章节目录 03 回归 03 万书楼 2010/5/7 0:56:28 
异界重生之打造快乐人生 VIP章节目录 03 回归 03 闪文书库 2010/5/7 0:56:20 
异界重生之打造快乐人生 卷八 振翅! 03 回归 03 倚天中文 2010/5/7 0:55:46 
异界重生之打造快乐人生 03 回归 03 3Q中文 2010/5/7 0:55:03 
异界重生之打造快乐人生 卷七 崛起!奥森庄园 03 回归 03 千载中文 2010/5/7 0:54:07 
异界重生之打造快乐人生 卷九 逍遥在异界 03 回归 03 零点看书 2010/5/7 0:53:26 
异界重生之打造快乐人生 正文 卷九 亚里斯大陆逍遥客 03 回归 03 新奇点 2010/5/7 0:39:32 
异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 雪人文学 2010/5/7 0:28:26 
异界重生之打造快乐人生 【VIP章节目录】 卷九 亚里斯大陆逍遥客 03 回归 03 理想文学 2010/5/7 0:24:39 
异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 T 大家读书 2010/5/7 0:22:01 
异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 起点新版 2010/5/7 0:21:12 

解决方案 »

  1.   

    嘿嘿,这网站我每天都去阿.天地文学阿.
    不知道你想干什么呀。你那个连接不是有bookId吗?
      

  2.   

    这个不好判断亚,booksky也是按抓取的时间排的阿。
      

  3.   

    soso999的你用过么 他就是把按照章节排序的
      

  4.   

    soso999没用过,不过这两个站的数据处理应该是不同的。
    soso999可能分析了别的站的章节规则。然后定期生成自己的iframe页面。而不是仅通过标题就判断是同一章节。
    不过你也可以试试通过标题的相似度来判断。
      

  5.   

    异界重生之打造快乐人生 03 回归 03 云轩阁 2010/5/7 1:26:35 你是说这里是一个标题吧?变量explode(' ',$str)//利用空格分开。前面第一个相同,就是同一本书了。。不知你说的是不是这样
      

  6.   

    给你一个思路
    $txt = <<< TEXT
    异界重生之打造快乐人生 03 回归 03 云轩阁 2010/5/7 1:26:35 
    异界重生之打造快乐人生 正文 卷九 亚里斯大陆逍遥客 03 回归 03 就上文学 2010/5/7 1:09:11 
    异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 纵横书海 2010/5/7 1:02:49 
    异界重生之打造快乐人生 03 回归 03 58小说 2010/5/7 1:02:29 
    异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 来看书吧 2010/5/7 1:01:30 
    异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 天天中文 2010/5/7 0:58:05 
    异界重生之打造快乐人生 正文 03 回归 03 3G华夏 2010/5/7 0:57:15 
    异界重生之打造快乐人生 VIP章节目录 03 回归 03 万书楼 2010/5/7 0:56:28 
    异界重生之打造快乐人生 VIP章节目录 03 回归 03 闪文书库 2010/5/7 0:56:20 
    异界重生之打造快乐人生 卷八 振翅! 03 回归 03 倚天中文 2010/5/7 0:55:46 
    异界重生之打造快乐人生 03 回归 03 3Q中文 2010/5/7 0:55:03 
    异界重生之打造快乐人生 卷七 崛起!奥森庄园 03 回归 03 千载中文 2010/5/7 0:54:07 
    异界重生之打造快乐人生 卷九 逍遥在异界 03 回归 03 零点看书 2010/5/7 0:53:26 
    异界重生之打造快乐人生 正文 卷九 亚里斯大陆逍遥客 03 回归 03 新奇点 2010/5/7 0:39:32 
    异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 雪人文学 2010/5/7 0:28:26 
    异界重生之打造快乐人生 【VIP章节目录】 卷九 亚里斯大陆逍遥客 03 回归 03 理想文学 2010/5/7 0:24:39 
    异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 T 大家读书 2010/5/7 0:22:01 
    异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 起点新版 2010/5/7 0:21:12 
    TEXT;function foo($v) {
      return split("[ \t]+", trim($v));
    }$ar = array_map('foo', split("[\r\n]+", $txt));for($i=1; $i<count($ar); $i++) {
      $s .= ", \$ar[$i]";
    }$r = eval("return array_intersect(\$ar[0]$s);");
    print_r($r);
    结果
    Array
    (
        [0] => 异界重生之打造快乐人生
        [1] => 03
        [2] => 回归
        [3] => 03
        [5] => 2010/5/7
    )结果数组元素个数大于3,一般可判为相符