b2科目四模拟试题多少题驾考考爆了怎么补救
b2科目四模拟试题多少题 驾考考爆了怎么补救

网络爬虫是什么_网络爬虫原理_c#网络爬虫原理(3)

电脑杂谈  发布时间:2017-02-07 09:59:52  来源:网络整理

聚合媒体在国外的应用也非常广阔。信息在聚合媒体的数据新闻平台上的展现,可以是传统的搜索引擎的平面化展现,也可以是可视化展现。后者如日本的新闻地图网站()。日本的新闻地图项目是基于谷歌新闻做的,它采用不同的颜色将新闻类别区分开来,如红色代表“World”,代表“National”,用户可以通过勾选页面底部的分类栏进行筛选,在页面顶部可以按照国家和地区进行筛选。网站后台算法依据相关新闻信息的数量、重要性、点击量自动调整每个新闻所占面积的大小。

今日头条

另外一个很好的例子是社交新闻网站,主要以Digg、Reddit等。这种类型的网站允许用户注册、相互关注、提交新闻并对新闻进行打分。其中,得分高的新闻就会进入到流行新闻的页面。在这个过程当中,各个用户充当了新闻的把关人,而这种信息把关的方式被称之为群体把关。网络爬虫原理

但是,群体把关的意义主要在于将新闻推到流行页面(webpage ofpopular news),也就是公众面前。这个阶段之后流行信息扩散更像是传统媒体的新闻扩散方式。其实,这种基于用户过滤的新闻聚合(news aggregation)存在非常普遍,例如新浪微博上的“热门话题”、推特上的“趋势性话题”(trend)等。根据笔者对Digg上新闻扩散的分析,这种新闻聚合对于信息扩散的影响更大,对于那些传播广泛的Digg新闻,70%以上的信息接触是通过热门新闻被Digg用户看到的。

从媒体把关到群体把关是一个进步,从群体把关到计算机或算法把关则隐藏着危险。

首先,算法根据使用者所表现出来的“兴趣”进行分类和推荐信息,往往容易给用户推荐一些低质量但用户短期内喜欢的信息。

其次,不断地接触低质量的信息使得个体的新闻素养降低。过于依赖机器帮助我们进行信息把关,容易导致视角越来越局限,不再关注社会整体利益,容易走向犬儒主义。

再次,主流的新闻操作手法保障了新闻从业者面对、军事和社会力量时的独立和从容。而推荐算法从信息和用户出发,对于国家和社会整体的关注不够,这种新闻推送机制的偏向容易带来攻讦。

从未来新闻的视角来思考新闻行业的转型更加使得我们意识到回归新闻本质的重要性。

未来的新闻业,走向人机结合的时代。


本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-31049-3.html

相关阅读
    发表评论  请自觉遵守互联网相关的政策法规,严禁发布、暴力、反动的言论

    热点图片
    拼命载入中...