b2科目四模拟试题多少题驾考考爆了怎么补救
b2科目四模拟试题多少题 驾考考爆了怎么补救

【干货】想做文本情感分析?百度Senta系统知道一下!

电脑杂谈  发布时间:2020-01-10 03:01:39  来源:网络整理

文本挖掘情感分析_英文文本情感分析_文本情感分析

文本情感分析(简称情感分析)旨在辨识和提取文本中的偏好、立场、评价、观点等主观信息。具体的说,情感分析主要包含两类任务:情感偏好分类(简称情感分类)和看法抽取。情感分析是人工智能的重要研究方向,具有很大的学术价值。同时,情感分析在消费决策、舆情分析、个性化推荐等领域均有重要的应用,具有很大的商业价值。

百度在情感分析领域加强了深入的科技开发跟应用实践。近期还借助 GitHub 开放了情感分类开源项目 Senta。Senta 项目包括了基于语料的情感分类模型,还包括了基于大数据训练好的建模。为此,本文将对百度的情感分类进行介绍。

文本挖掘情感分析_文本情感分析_英文文本情感分析

图1 情感分类示例

情感分类用于辨识主观文本中的心灵倾向。本文的感情倾向包括积极、中性、消极三类。图1展示了情感分类的例子。情感分类是情感分析的核心难题,一直以来是研究的重点,同时它在客户消费习惯分析、危机舆情监控等均有重要应用。

一方面,情感是人类的一种高级智能行为,为了辨识文本的心灵倾向,需要深入的语境建模。另一方面,不同领域(如餐饮、体育)在情感的表达各不相同文本情感分析,因而必须有覆盖各个领域的数据进行建模训练。为此,我们借助基于深度学习的语料模型和数据挖掘解决上述两个问题。

英文文本情感分析_文本挖掘情感分析_文本情感分析

基于深度学习的语义模型

情感是人类智能的高级行为,人们抒发感情的语言多种多样。为了理解文本中的感情文本情感分析,需要深入的语境理解。传统的情感分类主要基于词典甚至特征项目的形式进行分类,这种方式必须繁琐的人工特征设计跟先验知识,理解停留于浅层并且扩展能力差。为了防止传统方式的局限,我们引入了近年来快速演进的深度学习技术。基于深度学习的情感分类不依赖于人工特征,它无法端到端的对输入文本进行语义理解,并基于语义表示进行情感偏好的判定。

图2展示了基于 bi-LSTM 的情感分类。总体来说,这个建模包括三层:单词语义层、句子语义层、输出层。

文本情感分析_文本挖掘情感分析_英文文本情感分析

(1)单词语义层,主要是将输入文本中的每个句子转换为连续的词义向量表示,也就是单词的 embedding。

(2)句子语义层,通过 bi-LSTM 网络结构,将句子语境的序列转换为整个语句的语义表示。

(3)输出层,基于短语语义推导情感偏好的概率。

文本挖掘情感分析_文本情感分析_英文文本情感分析

对于语句语义层,我们内部实验了各种各样的建模,包括 bi-LSTM、CNN、hierarchical LSTM、self-attention 等多种模型。我们看到在语料上,单层 bi-LSTM 能够推动较好的疗效。因此,在开源代码中,我们默认提供了 bi-LSTM 模型,同时我们还提供 CNN,BOW 等模型。

图2 基于 bi-LSTM 的情感分类模型

基于标记传播的情感数据挖掘

在不同领域,人们抒发感情的语言不尽相似。为了练习好的感情语义建模,显然必须覆盖各种领域的情感语料。然而数据标注十分浪费人力资源,为此我们对网络数据进行挖掘,通过标记传播方式获得的情感分类语料。

互联网上天然有长期的弱标记评论数据,比如客户会对某个商品予以评论,同时给与评分。根据评分的高低我们能够确认评论的正负倾向。然而,这种数据是包括长期噪声的,需要一定的算法能够获得高质量数据。图3展示了我们的主要模式。

(a)我们首先从网络上获得的评论数据,根据特定规则获得高质量标注数据;


本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/tongxinshuyu/article-136389-1.html

    相关阅读
      发表评论  请自觉遵守互联网相关的政策法规,严禁发布、暴力、反动的言论

      热点图片
      拼命载入中...