去掉网页的版权信息 本帖最后由 dietime1943 于 2012-03-15 14:50:19 编辑 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 代码机器删除的话可以用整段的原代码进行替换 例如你html页面下的显示版权信息的代码为<tr> <td>版权</td> <td>XXXXXXXXXXXXXX版权所有</td></tr>使用String.replace("<tr> <td>版权</td> <td>XXXXXXXXXXXXXX版权所有</td></tr>"," ");当然这是一个很笨的办法,并且实际替换的时候 "<","/"可能还需要转义主要还是不太了解楼主你的需求,不再源代码中删除 使用代码器删除 那么是否是先使用代码机器读取这个网页文件然后在删除该部分?如果是这样的话 也简单 只要你想删除的那个部分是固定的位置 可以直接读取这个文件然后指定删除第几行的代码就可以的。不知道这样说你是否觉得有帮助。 请问你说的代码器是什么?主要是 我获取了不同网页的 html源码.但是 这些网页的底部 版权信息有多种.无法固定具体行数.这样就不能对所有的网页按照 固定的行数进行删除了,我一直有个疑问,搜索引擎为什么 都过滤掉了.网页的这些版权信息都没有收录.我想简单实现下过滤掉底部的版权信息.从多个html源码页中删除版权信息.就是这个意思 如何避免 Object 到 ArrayList(泛型)转换时的警告? setborder和setbounds有什么区别 速度如何限制? 为什么RandomAccessFile输出乱码? 请问那里有java帮助文档下啊 请问如何将整个文件内容读到一个字符串中去? JTree与本地文件系统同步问题 第2个问题 谁知道在java中用DAO怎么连接数据库? 怎样在kawa中输入中文么? (Java问题)请问链表中Node的内容怎么转成string 新手求教一道面试题,只需要写出接口和实现接口的框架就好,第一题也麻烦看下
<tr>
<td>版权</td>
<td>XXXXXXXXXXXXXX版权所有</td>
</tr>
使用String.replace("<tr>
<td>版权</td>
<td>XXXXXXXXXXXXXX版权所有</td>
</tr>"," ");
当然这是一个很笨的办法,并且实际替换的时候 "<","/"可能还需要转义主要还是不太了解楼主你的需求,不再源代码中删除 使用代码器删除 那么是否是先使用代码机器读取这个网页文件然后在删除该部分?如果是这样的话 也简单 只要你想删除的那个部分是固定的位置 可以直接读取这个文件然后指定删除第几行的代码就可以的。不知道这样说你是否觉得有帮助。
请问你说的代码器是什么?主要是 我获取了不同网页的 html源码.但是 这些网页的底部 版权信息有多种.无法固定具体行数.这样就不能对所有的网页按照 固定的行数进行删除了,我一直有个疑问,搜索引擎为什么 都过滤掉了.
网页的这些版权信息都没有收录.我想简单实现下过滤掉底部的版权信息.从多个html源码页中删除版权信息.就是这个意思