4. 冷启动与负样本
冷启动可分为User的冷启动和Item的冷启动,如果是要对一个新内容推荐相关的其他内容,那么可以多多利用内容特征的相似度;如果是对一个新用户推荐,可以利用起社交网络的信息(比如该用户的QQ好友的喜好);或者推随机的热门内容,再评估用户的点击快速调整(实时推荐的好处出来了);最后的办法也只有给新用户一个表达自己喜好的界面了。
协同过滤是基于统计的算法,并不需要负样本的信息,但如果采取了机器学习的算法,训练的过程是需要负样本的。大部分产品设计的时候不会提供用户的负反馈入口,用户无法表达对某个内容的厌恶,也就是现实数据并不存在负样本。但是负样本其实是可被创造的,我常用的一种做法是选择热门的但没有产生用户喜好的样本,因为平台的热门内容往往有更高的曝光率,用户反复看到但没产生点击,那就潜在的表达了一种厌恶。
一直觉得推荐系统是个业界十分特殊的场景,站在了通往技术、数据、产品和商业四条岔路的交叉口。所以做推荐系统是一个锻炼程序员综合能力的好活,而事实上高深算法是推荐系统中最次要的部分,对于数据和产品敏感的技术人更容易取得成功。
链接:
AD:【邀请】大数据的老朋友,加入最活跃、最温暖的大数据QQ群!!
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-30544-2.html
你只是站在自己的位置上去看问题
老兄这话在理
请问马先生你能活几个25年