data mining??听说过,不知道是什么样的技术,大家可以讨论一下

解决方案 »

  1.   

    片面转载:面向Web的数据挖掘     现在,很多企业迎接客户的场所已经从传统的物理上的客户接待室转移到了企业网站上虚拟的客户大厅,而客户开始认识一个企业、认识其产品的第一站也变成了企业的网站,所以,大量的客户信息在企业网站上堆积,而细心的企业管理者一定会从大量的网站上的信息中找到有价值的客户信息。怎样对Web上的数据进行复杂的应用,数据挖掘开始大显身手。充分利用有用的数据,废弃虚伪无用的数据,是数据挖掘技术的最重要的应用。     传统的数据库有一定的数据模型,可以根据模型来具体描述特定的数据,而Web上的数据没有特定的模型描述,每一站点的数据都各自独立设计,并且数据本身具有自述性和动态可变性。Web上的数据具有一定的结构性,但因自述层次的存在,从而是一种非完全结构化的数据,这也被称之为半结构化数据,Web数据挖掘技术首先要解决半结构化数据源模型和半结构化数据模型的查询与集成问题。解决Web上的异构数据的集成与查询问题,就必须要有一个模型来清晰地描述Web上的数据,还需要一种半结构化模型抽取技术,即自动地从现有数据中抽取半结构化模型的技术,面向Web的数据挖掘必须以半结构化模型和半结构化数据模型抽取技术为前提。     以XML为基础的新一代WWW环境是直接面对Web数据的,不仅可以很好地兼容原有的Web应用,而且可以更好地实现Web中的信息共享与交换。XML可看作一种半结构化的数据模型,可以很容易地将XML的文档描述与关系数据库中的属性一一对应起来,实施精确的查询与模型抽取。XML已经成为正式的规范,开发人员能够用XML的格式标记和交换数据。促进XML应用的是那些用标准的HTML无法完成的Web应用。这些应用从大的方面讲可以被分成以下四类:需要Web客户端在两个或更多异构数据库之间进行通信的应用;试图将大部分处理负载从Web服务器转到Web客户端的应用;需要Web客户端将同样的数据以不同的浏览形式提供给不同的用户的应用;需要智能Web代理根据个人用户的需要裁减信息内容的应用。显而易见,这些应用和Web的数据挖掘技术有着重要的联系,基于Web的数据挖掘必须依靠它们来实现。  
      

  2.   

    MagicJohn(默克)  再全面转载一下啊。谢啊,加加分。。