采集一个网页遇到了用
<script>window.location='http://   ';</script>跳转的问题,需要采集到<script>window.location='http://   ';</script>中的内容来采集下一个网页的内容,但网页用了<script>  </script>的标志,采集回来的内容是空的,请教一下高手,要怎么才能在程序中采回<script>  </script>中间的内容?

解决方案 »

  1.   

    用正则取到url后再请求采集
    "<script>window.location='(.*?)';</script>"
      

  2.   

    我知道是用正则,现在主要问题是有了"<script> <\script>这个标志后,它们中间的内容我不知道怎么采集到。要采集到中间的内容后才用正则取出来。
      

  3.   

    楼主,你取网页内容的时候可以不使用webcilent之类的组件直接取源码,你这种情况可以使用webbrowser控件,让webbrowser去访问页面,从webbrowser中取代码~
      

  4.   

    一楼的有意义吗?楼主的是 httpWebrequest 来采集?还是那个winform控件来采集?