如果你对html很熟悉,这是小菜一碟。
用URLConnection建立到sina的建接,可借助IO库读到字符串变量中。如果该网页规范。可以在得到信息后将信息装入DOM,解析之。
如果该网页不规范,但有特殊,如在新闻链接内容附近有一点特殊字符<!--news-->,你就可以在字符串内容中查到该<!--news-->的位置。进一步得到其他内容得到url后,再取该新闻url的内容,方法差不多。就算你现在做好了,但sina网页布局一改,你的自动新闻也死了如果sina有web service接口,就好多了。