google 协同过滤算法
google 朴素贝叶斯分类
google 聚类算法
google 朴素贝叶斯分类
google 聚类算法
解决方案 »
- 如何只读取groupBox1中的label,不读其他的如textBox
- 键盘钩子 鼠标钩子 都是什么意思啊?
- 这个问题怎么解决,sql+gridview
- 找不到类型或命名空间CollectionEditor,请问这是怎么回事啊?
- 水晶报表发布问题???
- 一个很困绕小弟的问题,高人进来看看哈
- 简单问题:怎样把网上的图片显示在PictureBox中
- 请大家帮帮忙。急,急急。~~~~~~~~~~~~~~~
- 一个大家都可能遇到过的页面安全问题,怎么解决?
- 晕,为什么我得的分从来没加上去过!!!!!
- 线程中 newThread = new Thread(new ThreadStart(move));,其中move函数和线程是什么样的关系?
- 影响文件拷贝的因素有哪些?
还有 就是现在行业内有没有类似的软件在
还有 就是现在行业内有没有类似的软件在你理解的数据量和我说的还不完全一样。一个是如何克服数据的局部稀疏性,比如说一个购物网站,有一亿条数据——但是当你分析一个新注册的用户的行为的时候,还是存在局部数据的稀疏问题,再比如,你虽然有一万条数据,但是它们有一亿种组合(这一点都不大,2的32次方都有几十亿了),看上去你的数据很多,实际上要做聚类分析还是很困难。我说的大数据,可能要求你有绝对意义上的海量数据。
还有 就是现在行业内有没有类似的软件在你说的“前期可不可以用这样的方式来弥补一些数据稀疏带来的不足”这个就是补偿算法的选择,有大量的论文在研究这个,你可以找来看看。但是我说了,大数据分析必须建立在海量数据的基础上,否则只能是无根之木,无水之源。一般做的比较好的,只有那些资深的互联网企业,比如google这样的搜索引擎,facebook、twitter这样的社交媒体,amazon、ebay这样的电商巨头。
1. 淘宝的 你可能感兴趣的产品 推荐 是根据你的浏览记录和购物记录来推荐
2. 类似于新闻客户端的推荐新闻 是根据你的浏览记录和评分记录来推荐比如 你关注了时事新闻和娱乐八卦 那么系统下一个推荐给你的新闻 很可能就是郭美美和李天一
那么 比如你买了iphone还买了一个386元的外壳 那么 销售人员的分析应该是 推荐298元的贴膜给你. 如果顺利成交,软件记录下来之后,是不是应该给出这样一个结论, 所有购买了iphone手机和386元手机壳的人,我们都应该推荐给他298的贴膜.
当我们给出的样本更多的时候,比如 有10个购买了iphone手机的人, 有3个购买了386元的金属手机壳 4个购买了386元的橡胶壳 有2个没有购买手机壳 但购买了598元的移动电源 只有一个人没有购买任何产品. 然后顾客第二次进店消费的时候, 这9个购买了手机壳的人里面 有3个买了金属壳购买了298元的高透贴膜 3个购买了298元的磨砂贴膜 1个买了更贵的贴膜 一个买的更便宜的 还有一个因为经济原因 没有再买贴膜 而是买了其他东西.有了这几个数据,是不是就得出这样的结论: 购买金属外壳的人 更倾向于高透贴膜 消费价位在298 ?
我想的可能有点乱... 求点拨