网页信息抽取研究方向的

解决方案 »

  1.   

    关键是在前端js处理,其实java处理后台主要是提取数据...。
    像这类的js框架比较多,网上都能找的到有。
    比如dtree,jquery等....结合数据库表的设计。
      

  2.   

    正解,我的项目就是用的dtree!
      

  3.   

    如果你平时研究一下还行,但是真正自己写比较麻烦。
    包括js函数之间调用耦合性、维护性、查询速度、扩展性等有些问题不是就能够考虑到周全。多参考一些别人写的比较好的、成熟的js框架,比如梅花树就比较好。
      

  4.   


    额,大哥你误解了,我的意思是通过输入某张html网页的url,然后将该网页修改为规范格式的xml文件,再以DOM Tree的形式结果输出,并不是要设计网页并使其以dom tree格式显示