web信息抽取，

大虾们，你们好！之前发过一个帖子关于web信息抽取的帖子，一位大虾用正则表达式的方法帮我解决了提取某一类网站的问题。但是我需要到网站上爬出很多网站进行提取，这样的话网站的格式都不一样，如果每类网站都写一个规则，那不是写不完？不知道还有没有其他好的方法。我想做到的是：比如一个公司发布的求职岗位。我们需要从这个网页中提取岗位的名称，要求等信息存到数据库中，形成结构化的数据。真心希望有人能提供代码！