b2科目四模拟试题多少题驾考考爆了怎么补救
b2科目四模拟试题多少题 驾考考爆了怎么补救

泰迪智能科技_r语言推荐系统_协同过滤

电脑杂谈  发布时间:2017-02-04 19:24:36  来源:网络整理

r语言推荐系统_泰迪智能科技_协同过滤

可以说是全拜谷歌吹起了「大数据」这阵春风,近几年业界对于数据挖掘人才的需求持续高涨,而推荐系统一直是数据挖掘岗位的必修课。一联系到数据挖掘,总会给人高深莫测的错觉,以为推荐系统也是数学神童的专属领域。万万没想到,自己并不是数据挖掘科班出身,也谈不上数学功底有多好(本科考高数也就在生死边缘),竟然也操刀了三个业务场景不同、用户规模千差万别、甚至连地域和文化也跨度很大的推荐系统,而且评价指标和用户反馈还颇为正面。可见推荐系统没有那么曲高和寡(至少不需要去进修个数学博士,笑),我相信如果一个出色的程序员理解了推荐系统的方,那么他就能在短时间内做出一个有实效的能提升平台活跃的推荐系统。

推荐系统的本质是行为的关联

推荐系统的核心是为用户提供个性化的内容。而实现的方式不外乎根据用户的历史行为去预测未来的潜在点击。一个成功的推荐系统,一般要从两个维度体现它的价值:一是帮助用户发现没接触过但会喜欢的有新鲜感的内容;二是提升平台的点击活跃程度,让长尾内容得到更充分的曝光。

并不是所有场景都需要个性化

这是最关键但却最容易被忽视的问题。大数据风一来,推荐系统就成了许多Boss眼中包治百病的仙丹妙药,不管三七二十一,一定要在产品前期上线推荐系统。但以我的经验,推荐系统要取得成功,至少要具备以下3个先决条件:

要有足够大的数据。一个常见的误区是,社区不够活跃,上了推荐系统没准会增加活跃吧?而实际上缺乏数据就很难有精准的推荐(用户关联过于稀疏),自然也不会带来多少可观的点击。

要有用户。r语言推荐系统数据充分了、内容丰富了,并不代表推荐系统就水到渠成,还得掂量下用户喜好能不能形成产生足够的。推荐系统之所以在电商、音乐和社区等领域有成功的应用,主要因素就是这类产品的用户有足够的。目标用户越是大而全,越明显,推荐的满意度越高。不用看数据,也能猜到淘宝的推荐会比唯品会的效果好太多,因为上淘宝的用户喜好差异度会远大于唯品会。r语言推荐系统

r语言推荐系统_泰迪智能科技_协同过滤

推荐系统的步骤

1. 定义目标

凡事要有成效都必须坚持目标导向,如果一个项目的成果不能被准确衡量,那么前景注定是危险的。推荐系统长期都是为提升平台的活跃度而生的,与团队的商业价值目标是一致的,但短期内两者或许会有冲突:平台的展示位置有限,推荐系统上马后会分流掉热门内容的点击量,而商业价值往往要建立于热门内容之上。所以上马之前一定要与负责确定商业价值的人协商(也许你的CEO、也许是市场团队的头儿),在推荐系统的设计中兼顾到一部分的商业价值目标。关于推荐的评价指标,个人建议可包括下列选项:推荐系统覆盖的内容数量、推荐内容的点击率(A/B测试)、推荐系统上线前后的内容产生量(对于UGC平台)、推荐系统上线前后TOP100内容的变化,同时也要留意推荐内容区域的浏览行为数据(推荐系统本来就是个离产品很近的事),比如停留时间、点击的频次、翻页的频次。

有的平台会在推荐结果的下方提供用户的反馈按钮,但是我建议这种反馈听听就好,不必当真,主要还是看实际的数据表现。用户反馈总是会过分的积极,容易让人忘乎所以。

2. 深入业务

3. 算法选型

既然推荐系统的本质是行为的关联,那么协同过滤(这里把矩阵分解也算协同过滤的一种)都是在利用关联的信息,通常都会比基于内容的推荐效果要好。不过现实中单一的算法都很难获得很高的准确率,适当结合内容自身的属性有助于提升推荐的满意度,举个例子,服饰电商平台中Item的品牌信息对购买者就很关键(所有女人都懂的,对不?),如果能建立起一个User的品牌偏好,或者进一步讲,品牌与品牌之间的关联度,那么爆表的推荐质量简直是手到擒来。如果平台原有的行为数据就是关联很稀疏的,协同过滤就很难发挥所长,这时基于内容的推荐就有用武之地了。


本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-30544-1.html

相关阅读
    发表评论  请自觉遵守互联网相关的政策法规,严禁发布、暴力、反动的言论

    • 布燮
      布燮

      呵呵三个霉菌的狗

      • 彭利敏
        彭利敏

        加速了中国造假业的发展

    • 苏拯
      苏拯

      地球动荡的根源国太源歇斯底里了

    • 石头城
      石头城

      怎么感觉有自我安慰的感觉

    热点图片
    拼命载入中...