用户喜好分析
一、用户的喜好属性分为七大属性:  喜欢的色调,喜欢的名星,喜欢的运动,喜欢听的歌曲,喜欢吃的小吃,喜欢的车,喜欢的衣服牌子
二、七大属性的权重(整数)可以设定,七大属性权重之和为100,跟据设定的七大属性指数,与阀值在海量用户中比对,列出符合要求的用户,只要给定的属性与列表中用户属性相等,就加上对应的权重数,最后得出总数。举例:
以下是用户信息列表
姓名 色调 名星 运动 歌曲 小吃 车 衣服
张三 红 赵薇 跑步 神化 铁板烧 丰田 雅格尔
李四 蓝 赵薇 爬山 我和你 烤肉串 丰田 苹果
王五 蓝 周杰化 蓝球 七里香 来伊份 凯迪拉克 登喜路
赵六 黄 林心如 足球 七里香 坐上客 奥迪 波仕漫
……
……
……以下是设定的权重:
色调 名星 运动 歌曲 小吃 车 衣服
12 13 14 16 10 20 15
阀值为: 60
以下是给定属性,跟据这个属性来列出符合的用户:
色调 名星 运动 歌曲 小吃 车 衣服
红 赵薇 跑步 七里香 铁板烧 丰田 登喜路
运算后:
姓名 色调 名星 运动 歌曲 小吃 车 衣服 得分
张三 12 13 14 神化 10 20 雅格尔 69
李四 蓝 13 爬山 我和你 烤肉串 20 苹果 33
王五 蓝 周杰化 蓝球 16 来伊份 凯迪拉克 15 31
赵六 黄 林心如 足球 16 坐上客 奥迪 波仕漫 16符合要求的只有:张三。
程序要求:
用户数据放在数据库中,在程序运行时,要求把用户信息表里的所有用户数据加载到程序内存里(不能用数据库去做,否则太慢了),数据量在50000左右,一次要处理的给定属性及权重数大约在1万到2万之间,程序处理完所有给定值后的运行时间不能超过5秒。(大家花点时间,帮我看看,该怎么做,谢谢!)