google 协同过滤算法 
google 朴素贝叶斯分类 
google 聚类算法

解决方案 »

  1.   

    是这样  作为外行人..  虽然不了解具体的算法实现问题  但对于数据量  还是有心理准备的  但我在IOS平台上看到过一个叫 人脉 的应用  就是通过详细的联系人信息和偏好 得出对应的联络方式  比如  联系人的爱好里面有 时政 联系人关系里面是 普通朋友  那么 得出来的结果就是 7天后软件会给你提示 给他发个短信 加强一下联系 短信内容: 城管打人事件的新闻.  前期可不可以用这样的方式来弥补一些数据稀疏带来的不足?
    还有 就是现在行业内有没有类似的软件在
      

  2.   

    是这样  作为外行人..  虽然不了解具体的算法实现问题  但对于数据量  还是有心理准备的  但我在IOS平台上看到过一个叫 人脉 的应用  就是通过详细的联系人信息和偏好 得出对应的联络方式  比如  联系人的爱好里面有 时政 联系人关系里面是 普通朋友  那么 得出来的结果就是 7天后软件会给你提示 给他发个短信 加强一下联系 短信内容: 城管打人事件的新闻.  前期可不可以用这样的方式来弥补一些数据稀疏带来的不足?
    还有 就是现在行业内有没有类似的软件在你理解的数据量和我说的还不完全一样。一个是如何克服数据的局部稀疏性,比如说一个购物网站,有一亿条数据——但是当你分析一个新注册的用户的行为的时候,还是存在局部数据的稀疏问题,再比如,你虽然有一万条数据,但是它们有一亿种组合(这一点都不大,2的32次方都有几十亿了),看上去你的数据很多,实际上要做聚类分析还是很困难。我说的大数据,可能要求你有绝对意义上的海量数据。
      

  3.   

    是这样  作为外行人..  虽然不了解具体的算法实现问题  但对于数据量  还是有心理准备的  但我在IOS平台上看到过一个叫 人脉 的应用  就是通过详细的联系人信息和偏好 得出对应的联络方式  比如  联系人的爱好里面有 时政 联系人关系里面是 普通朋友  那么 得出来的结果就是 7天后软件会给你提示 给他发个短信 加强一下联系 短信内容: 城管打人事件的新闻.  前期可不可以用这样的方式来弥补一些数据稀疏带来的不足?
    还有 就是现在行业内有没有类似的软件在你说的“前期可不可以用这样的方式来弥补一些数据稀疏带来的不足”这个就是补偿算法的选择,有大量的论文在研究这个,你可以找来看看。但是我说了,大数据分析必须建立在海量数据的基础上,否则只能是无根之木,无水之源。一般做的比较好的,只有那些资深的互联网企业,比如google这样的搜索引擎,facebook、twitter这样的社交媒体,amazon、ebay这样的电商巨头。
      

  4.   

    两个例子 
    1. 淘宝的 你可能感兴趣的产品 推荐  是根据你的浏览记录和购物记录来推荐
    2. 类似于新闻客户端的推荐新闻  是根据你的浏览记录和评分记录来推荐比如 你关注了时事新闻和娱乐八卦  那么系统下一个推荐给你的新闻 很可能就是郭美美和李天一
    那么 比如你买了iphone还买了一个386元的外壳  那么 销售人员的分析应该是 推荐298元的贴膜给你. 如果顺利成交,软件记录下来之后,是不是应该给出这样一个结论,  所有购买了iphone手机和386元手机壳的人,我们都应该推荐给他298的贴膜.
    当我们给出的样本更多的时候,比如  有10个购买了iphone手机的人, 有3个购买了386元的金属手机壳 4个购买了386元的橡胶壳 有2个没有购买手机壳 但购买了598元的移动电源 只有一个人没有购买任何产品.  然后顾客第二次进店消费的时候, 这9个购买了手机壳的人里面  有3个买了金属壳购买了298元的高透贴膜 3个购买了298元的磨砂贴膜 1个买了更贵的贴膜 一个买的更便宜的  还有一个因为经济原因 没有再买贴膜 而是买了其他东西.有了这几个数据,是不是就得出这样的结论: 购买金属外壳的人 更倾向于高透贴膜 消费价位在298 ?  
    我想的可能有点乱...  求点拨