我是研究生物信息的,要自己构建生物信息二级数据库,现在需要搞一个代理程序能自动获取一级数据库(如NCBI)的Web信息资源,获取的文本文档以GBSeq XML作为中间格式保存,然后对XML文档进行批量处理,包括对文档数据的验证、解析并提交到二级数据库中,以及将文档转换成便于Web发布的HTML格式,想请教各位高手用Java怎么来实现?