用webclient
System.Net.WebClient obj = new System.Net.WebClient();
byte[] bs        obj.DownloadData(url);将bs转成string然后分析

解决方案 »

  1.   

    我也想问一下这个url如何获取,全部手工设置吗?不太可能吧?
      

  2.   

    url就是包含热点新闻的哪个网页,分析获得的内容,然后取得所要的数据
      

  3.   

    使用RSS就可以获取到新闻了,需要新浪的rss地址
      

  4.   

    比如新浪的http://news.sina.com.cn/页面的重点新闻,先得到http://news.sina.com.cn/页的源码,然后分析源代码,重点新闻的链接在
    <!--重点新闻1号位 开始-->
    之后,可以用正则取出相应的url,然后用这个url得到相应页的具体新闻内容
      

  5.   

    先得到http://news.sina.com.cn/页的源码,然后分析源代码
    ----
    如何得到源码,如果得到了源码,那还要做个一个源码分析器,来解析这个页面吗?
      

  6.   

    得到网页源码,参考下这个帖子http://community.csdn.net/Expert/topic/5411/5411610.xml?temp=.3444483像新浪这种网站,源码的格式是固定的,变的只是链接图片等内容,只要根据一定的标志性字符串,比如“<!--重点新闻1号位 开始-->”,就可以用正则提取出你想要的url,然后根据这个url再用去得到具体的新闻页面的内容
      

  7.   

    用过webclient的兄弟,说说体会
      

  8.   

    用webclient
    System.Net.WebClient obj = new System.Net.WebClient();
    byte[] bs        obj.DownloadData(url);----------------我使用webclient,downloadData(我指定的一个网页)
    down下来的是一堆数字,不知道是什么意思?
      

  9.   

    现在可以获取我指定的一个url的页面了,
    但是得到的页面全是“?”乱码。这个可能是因为原页面是繁体的原因。
    当我想指定到www.sina.com.cn,我的电脑设置了代理。每次获得的都是权限管制那个页面。
    如何绕开代理,或者出现提示输入帐号和密码的界面?对于这个“代理”,不知道大家有没有明白我的意思,因为是企业内部的电脑,不是人人都可以上网,它只允许拥有上网帐号和密码的人,和设置了代理的电脑才可以链接Interner。如果没有这些条件就出现一个默认的页面(提示你无法上网),呵呵,我好像越说越糊涂了!大概就是这个意思了。
    现在页面已经得到了,怎么来分析呀?
      

  10.   

    <%@ Import NameSpace="System.Net" %>
    <script language="VB" runat="server">
    Sub Page_Load(Sender As Object, E As EventArgs)
    '下面首先将新浪网站首页数据下载到字符串strTemp中
    Dim wc As New WebClient()
    Dim strTemp As String
    strTemp = Encoding.Default.GetString(wc.DownloadData("http://www.sina.com.cn"))
    '下面在该字符串中查找重要新闻
    Dim intStart,intEnd As Integer '两个变量分别表示开始和结束位置
    intStart = strTemp.IndexOf("<!---此部分为新浪首页要闻区内容---->",0) + 24
    intEnd = strTemp.IndexOf("<!---此部分为新浪首页要闻区内容 end---->",intStart) - 1
    strTemp = strTemp.Substring(intStart, intEnd - intStart + 1) '从中提取重要新闻
    Message.Text = strTemp '显示重要新闻
    End Sub
    </script>
    <html>
    <head><meta http-equiv="refresh" content="3"></head>
    <body>
    <h3 align="center">从新浪首页获取重要新闻</h3>
    <asp:Label id="message" runat="server" />
    </body>
    </html>请参考一下。不过时间要修改,抓取的内容也修改一下。
    建议你先看看sina首页的原代码。计算一下吧
      

  11.   

    不错,不过我看到有人使用RSS,感觉RSS可能会更开放些。