比如现在有这样的一个列表
这是一个图书的某一章节在不同站点的标题
http://www.booksky.org/BookDetail.aspx?BookID=1049692
假设 每行标题代表一个变量,那么怎么判断才能得出这些标题是同一书籍呢?
呃 可能表述的不清楚
我qq:3390074异界重生之打造快乐人生 03 回归 03 云轩阁 2010/5/7 1:26:35
异界重生之打造快乐人生 正文 卷九 亚里斯大陆逍遥客 03 回归 03 就上文学 2010/5/7 1:09:11
异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 纵横书海 2010/5/7 1:02:49
异界重生之打造快乐人生 03 回归 03 58小说 2010/5/7 1:02:29
异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 来看书吧 2010/5/7 1:01:30
异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 天天中文 2010/5/7 0:58:05
异界重生之打造快乐人生 正文 03 回归 03 3G华夏 2010/5/7 0:57:15
异界重生之打造快乐人生 VIP章节目录 03 回归 03 万书楼 2010/5/7 0:56:28
异界重生之打造快乐人生 VIP章节目录 03 回归 03 闪文书库 2010/5/7 0:56:20
异界重生之打造快乐人生 卷八 振翅! 03 回归 03 倚天中文 2010/5/7 0:55:46
异界重生之打造快乐人生 03 回归 03 3Q中文 2010/5/7 0:55:03
异界重生之打造快乐人生 卷七 崛起!奥森庄园 03 回归 03 千载中文 2010/5/7 0:54:07
异界重生之打造快乐人生 卷九 逍遥在异界 03 回归 03 零点看书 2010/5/7 0:53:26
异界重生之打造快乐人生 正文 卷九 亚里斯大陆逍遥客 03 回归 03 新奇点 2010/5/7 0:39:32
异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 雪人文学 2010/5/7 0:28:26
异界重生之打造快乐人生 【VIP章节目录】 卷九 亚里斯大陆逍遥客 03 回归 03 理想文学 2010/5/7 0:24:39
异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 T 大家读书 2010/5/7 0:22:01
异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 起点新版 2010/5/7 0:21:12
这是一个图书的某一章节在不同站点的标题
http://www.booksky.org/BookDetail.aspx?BookID=1049692
假设 每行标题代表一个变量,那么怎么判断才能得出这些标题是同一书籍呢?
呃 可能表述的不清楚
我qq:3390074异界重生之打造快乐人生 03 回归 03 云轩阁 2010/5/7 1:26:35
异界重生之打造快乐人生 正文 卷九 亚里斯大陆逍遥客 03 回归 03 就上文学 2010/5/7 1:09:11
异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 纵横书海 2010/5/7 1:02:49
异界重生之打造快乐人生 03 回归 03 58小说 2010/5/7 1:02:29
异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 来看书吧 2010/5/7 1:01:30
异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 天天中文 2010/5/7 0:58:05
异界重生之打造快乐人生 正文 03 回归 03 3G华夏 2010/5/7 0:57:15
异界重生之打造快乐人生 VIP章节目录 03 回归 03 万书楼 2010/5/7 0:56:28
异界重生之打造快乐人生 VIP章节目录 03 回归 03 闪文书库 2010/5/7 0:56:20
异界重生之打造快乐人生 卷八 振翅! 03 回归 03 倚天中文 2010/5/7 0:55:46
异界重生之打造快乐人生 03 回归 03 3Q中文 2010/5/7 0:55:03
异界重生之打造快乐人生 卷七 崛起!奥森庄园 03 回归 03 千载中文 2010/5/7 0:54:07
异界重生之打造快乐人生 卷九 逍遥在异界 03 回归 03 零点看书 2010/5/7 0:53:26
异界重生之打造快乐人生 正文 卷九 亚里斯大陆逍遥客 03 回归 03 新奇点 2010/5/7 0:39:32
异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 雪人文学 2010/5/7 0:28:26
异界重生之打造快乐人生 【VIP章节目录】 卷九 亚里斯大陆逍遥客 03 回归 03 理想文学 2010/5/7 0:24:39
异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 T 大家读书 2010/5/7 0:22:01
异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 起点新版 2010/5/7 0:21:12
不知道你想干什么呀。你那个连接不是有bookId吗?
soso999可能分析了别的站的章节规则。然后定期生成自己的iframe页面。而不是仅通过标题就判断是同一章节。
不过你也可以试试通过标题的相似度来判断。
$txt = <<< TEXT
异界重生之打造快乐人生 03 回归 03 云轩阁 2010/5/7 1:26:35
异界重生之打造快乐人生 正文 卷九 亚里斯大陆逍遥客 03 回归 03 就上文学 2010/5/7 1:09:11
异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 纵横书海 2010/5/7 1:02:49
异界重生之打造快乐人生 03 回归 03 58小说 2010/5/7 1:02:29
异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 来看书吧 2010/5/7 1:01:30
异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 天天中文 2010/5/7 0:58:05
异界重生之打造快乐人生 正文 03 回归 03 3G华夏 2010/5/7 0:57:15
异界重生之打造快乐人生 VIP章节目录 03 回归 03 万书楼 2010/5/7 0:56:28
异界重生之打造快乐人生 VIP章节目录 03 回归 03 闪文书库 2010/5/7 0:56:20
异界重生之打造快乐人生 卷八 振翅! 03 回归 03 倚天中文 2010/5/7 0:55:46
异界重生之打造快乐人生 03 回归 03 3Q中文 2010/5/7 0:55:03
异界重生之打造快乐人生 卷七 崛起!奥森庄园 03 回归 03 千载中文 2010/5/7 0:54:07
异界重生之打造快乐人生 卷九 逍遥在异界 03 回归 03 零点看书 2010/5/7 0:53:26
异界重生之打造快乐人生 正文 卷九 亚里斯大陆逍遥客 03 回归 03 新奇点 2010/5/7 0:39:32
异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 雪人文学 2010/5/7 0:28:26
异界重生之打造快乐人生 【VIP章节目录】 卷九 亚里斯大陆逍遥客 03 回归 03 理想文学 2010/5/7 0:24:39
异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 T 大家读书 2010/5/7 0:22:01
异界重生之打造快乐人生 卷九 亚里斯大陆逍遥客 03 回归 03 起点新版 2010/5/7 0:21:12
TEXT;function foo($v) {
return split("[ \t]+", trim($v));
}$ar = array_map('foo', split("[\r\n]+", $txt));for($i=1; $i<count($ar); $i++) {
$s .= ", \$ar[$i]";
}$r = eval("return array_intersect(\$ar[0]$s);");
print_r($r);
结果
Array
(
[0] => 异界重生之打造快乐人生
[1] => 03
[2] => 回归
[3] => 03
[5] => 2010/5/7
)结果数组元素个数大于3,一般可判为相符