你应该把 HTML格式;换成XML.

解决方案 »

  1.   

    需要设计智能分析html文档结构的功能模块,你的大脑是怎么判断,程序就怎么判断。
      

  2.   

    其实如果HTML是采用模板,格式一定的话,可以使用关键的HTML标记来区分。
      

  3.   

    编写程序读取 ">"和"<" 之间的数据
      

  4.   

    当然是得到那写文字了!最好是这样NAME=中国目前有亿万富翁1000人,百万富翁300万
                                    TYPE=综合
                                    MENU=宏观经济动态
                                    NEI=1。HTML
      

  5.   

    <?php
    $s = "<table border=0 width='100%'>
    <html><head><title>信息内容</title></head><body>
    </body></html>
    <tr width='100%'><td width='50%'><a href='1.htm'>中国目前有亿万富翁1000人,百万富翁300万</a></td><td width='10%'>1.htm</td><td width='20%'>综合</td><td width='20%'>宏观经济动态</td></tr></table>";
    $s = eregi_replace(".*(<tr.+</tr>).*","\\1",$s);
    $s = eregi_replace("<td","~~<td",$s);
    $ar = split("~~",substr(strip_tags($s),2));
    print_r($ar);
    ?>
    至于如何与名字对应,由你决定。我只负责帮你取出来。
      

  6.   

    to xuzuning(唠叨) :
    呵呵,这个替换不错~~~
      

  7.   

    找出你所有用的数据放到库里,在把公共部分做成模版就可以了!
    我是做网站数据流量分析的,经常与html打交到,我们互相学习吧!