是的,不是从数据库里统计
我用file把网页的源文件读了出来,要统计里面的新闻条数,不知道该怎么办了如果从库里读,怎样才能把网页的新闻内容放到数据库里去呢?

解决方案 »

  1.   

    如果是rss标准的,很好统计,如果不是的话,费点力气,自己匹配标签吧。
      

  2.   

    比如我现在要统计http://zjdaily.zjol.com.cn/epaper/zjrb/html/2006-11/24/node_18.htm今天的新闻条数,放到mysql数据库中,怎么做啊?
    给我个思路和建议
    谢谢
      

  3.   

    当然是你自己分析数据(你取得的html)的结构了, 难道让别人帮你分析?
      

  4.   

    自己分析html吧随便看了一下你给的网址,估计你是要统计出下面新闻这些的数目· 胡锦涛提出推动两国经贸合作五点建议 
    · 胡锦涛开始对巴基斯坦进行国事访问 
    · 浙江农业博览会昨在杭开幕 
    · 冬衣真合身 
    · 湖州市中心建起经济适用房 
    · 坚持不懈推进反腐倡廉工作 
    · 107字短文获冰心作文奖一等奖 
    · 浙江在线成为我省舆论引导生力军 
    · 新长征路上,我们与祖国共奋进 
    · 长征图书“漂”到遵义 
    · 问题就是时代的口号 
     
     right?看了看代码,新闻页面的链接文件名都是content_***.htm,用正则匹配一下有多少个这些content_***.htm就表示该页面有多少条新闻我只是随便举个例子,正确与否看你慢慢慢慢验证了,但思路就是这样子,楼主慢慢分析吧
      

  5.   

    谢谢edwardrong(明年-今日),现在我已经做出来了,里面的确有规律,呵呵,我也是取的这个巧啊^_^,用的substr_count()统计新闻前面的“.”得到的。
    可是我不知道怎么送分,谁能告诉我啊?帮我解决了问题,送分是应该的吗^_^