文件A.txt内容如下
123
222
333
444
555
666
777
888
999
000文件B.txt内容如下
123
222
444
666
000不使用数据库,怎么从A.txt中把存在于B.txt的数据剔除掉,实际情况是A,B大概有一万条数据。
得到的结果是C.txt,内容如下
333
555
777
888
999
我的思路是把A,B分别读取到一个数组中,然后遍历A,如果A中某一行数据不在B中,便把该条数据写入C。
不知道这样的思路是不是对的,效率高的
123
222
333
444
555
666
777
888
999
000文件B.txt内容如下
123
222
444
666
000不使用数据库,怎么从A.txt中把存在于B.txt的数据剔除掉,实际情况是A,B大概有一万条数据。
得到的结果是C.txt,内容如下
333
555
777
888
999
我的思路是把A,B分别读取到一个数组中,然后遍历A,如果A中某一行数据不在B中,便把该条数据写入C。
不知道这样的思路是不是对的,效率高的
考虑到数据量大,你可以分断读取,例如两个文件每次各读100行。然后php有专门的合并函数 array_merge 很方便。
array_diff ( array $array1 , array $array2 [, array $ ... ] )
返回数组包括了所有在 array1 中但是不在任何其它参数数组中的值
function w($cont, $filename) {
if (is_writable($filename)) {
if (!$handle = fopen($filename, 'a')) {
echo "不能打开文件 $filename";
exit;
}
if (fwrite($handle, $cont) === FALSE) {
echo "不能写入到文件 $filename";
exit;
}
echo "成功地将 $somecontent 写入到文件$filename";
fclose($handle);
} else {
echo "文件 $filename 不可写";
}
}
$cont_a = file_get_contents("/path/filenameA");
$arrA = explode("\n", $cont_a);
$cont_b = file_get_contents("/path/filenameB");
$arrB = explode("\n", $cont_b);$arrNewB = array_diff($arrB, $arrA);
$cont_newb = implode("\n", $arrNewB);
$arrC = array_diff($arrA, $arrB);
$cont_c = implode("\n", $arrC);w($cont_newb);
w($cont_c);