用javascript怎么提取网页中的内容 - 调试易

用javascript怎么提取网页中的内容

<script language="JScript">   function GetInfo() {      var fso, f, fd, ts, s, fi,i,st;
      var ForReading = 1;
      fso = new ActiveXObject("Scripting.FileSystemObject");
      fi = document.getinfo.selectedfile.value;
      f = fso.GetFile(fi);
      document.getinfo.filename.value = f.Name;
      document.getinfo.filepath.value = f.ParentFolder;
      document.getinfo.filesize.value = f.Size;
      document.getinfo.filedate.value = f.DateCreated;      ts = fso.OpenTextFile(fi, ForReading);
// 开始读网页名
      s = ts.ReadLine();
      s = s.toUpperCase();
      s = s.match(/<TITLE>\W*<\/TITLE>/);
      while(s == null) {
         s = ts.ReadLine();
         s = s.match(/<TITLE>\W*<\/TITLE>/);
      }
      s = "" + s;
      s = s.replace(/<TITLE>/, "");
      s = s.replace(/<\/TITLE>/, "");
      document.getinfo.title.value = s;
// 结束读网页名,写到文本输入框中// 开始提取汉字 (注:程序中没有过滤不必要的汉字,实现中要考虑过滤:表单、JAVASCRIPT、超链接中的汉字
      s = ts.ReadLine();
      st = s.toUpperCase();
      st = st.match(/<BODY[\W\w]*/);
      while(st == null) {
         s = ts.ReadLine();
         st = s.toUpperCase();
         st = st.match(/<BODY\W*/);
      }
      st = "" + st;
   //   document.getinfo.chineseinfo.value = st;
      while(!ts.AtEndOfStream) {
         s = s.match(/[\u4e00-\u9fa5]/g);
         if(s != null) for(i=0; i<s.length; i++) { st = st + s[i]; }
         s = ts.ReadLine();
      }
      document.getinfo.chineseinfo.value = st;

  }
</script>
这是我提取网页信息的
在提取内容的时候不能执行

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货