b2科目四模拟试题多少题驾考考爆了怎么补救
b2科目四模拟试题多少题 驾考考爆了怎么补救

情感策略定义_品牌的情感宿舍策略_基于层次结构的多策略中文微博情感分析和特征抽取(3)

电脑杂谈  发布时间:2017-02-27 00:05:43  来源:网络整理

SupportVector

Machines)、朴素贝叶斯(NB,Naive

Bayes)、最大熵(ME,MaxinumEntropy)。通过结合文本特征,包括一元词特征(uni—gram)、二元词特征(bigram)、词性特征、情感词特征等,将文本映射为特征向量,用于模型的训练和分类预测。SidaWang[63等人采用朴素贝叶斯和支持向量机相结合的方法,在多个公开数据集上取得了不错的效果。Bollegalac70等人利用不同领域情感表达方式的共性来构建领域相关的情感词典,扩充文本特征,以此提高跨领域情感分类的效果。谢丽星[81等人针对中文微博的文本特征,提出了基于层次结构的多策略中文微博情感分析和特征抽取方法。

在自然语言处理领域,词作为文本的基本组成单元,One—hotRepresentation成为词语最常用的一种表达方式。但是该方法忽略了词与词之间的上下文语义与语法关系,也无法提供词本身所携带的信息。BengioC93等在2003年提出用神经网络构建二元语言模型的方法,把词映射到低维实数向量,通过词与词之间的距离来判断它们之间的语义相似度。

Andriy

MnihEl03等人提出层次Log—Bilinear模型来

训练语言模型。Mikolov[1卜123借鉴Log—Bilinear模型的思想,在word2vec中实现了CBOW和Skip—gram两种语言模型。随后,词嵌入(也称词向量)被应用自然语言处理的多个领域。Socher[131等人提出基于词向量的递归神经网络,实现对文本的向量表示,并在情感分析方面取得不错的效果。John—sonLl43提出基于One—hotRepresentation的词表达方式的卷积神经网络模型,显示了词序特征在文本分类上的有效性。上述基于词向量的深度学习模型主要利用了词的上下文语义信息和语法结构特征,而在情感分析任务中,词语极性和词性等词语本身所具有的特征信息直接影响文本的情感表达。

174

中文信息学报

2015芷

Maas[153利用训练语料的情感标注信息,提出了有监督学习和无监督学习相结合的语言模型。Tang[161提出一种嵌入情感信息的语言模型,在Twitter情感分类任务中取得最好成绩。基于层次结构的多策略中文微博情感分析和特征抽取Faru—

qiu[17]贝0采用后处理的方式,实现在任意词向量上

嵌入具有网络结构的语义词典。

目前的相关工作中,基于人工规则和词典资源的特征抽取方法往往依赖于特定领域或特定语料,而且文本特征维度随人工规则和词典资源的增加而线性增长,不仅增加了模型的训练成本,还降低了模型的泛化能力。

3基于卷积神经网络的词语情感序列特征

抽取模型

为了实现文本情感特征信息的有效挖掘和表达,本文提出了一种结合词语情感特征的卷积神经网络(Word

Feature

Convolutional

Neura]Net—

works,WFCNN)方法。基于层次结构的多策略中文微博情感分析和特征抽取这一方法首先建立一种基于情感词典资源的抽象词向量表达方式,通过该方法引入词语的情感极性和词性特征。然后用词向量组成文本特征矩阵,将其作为卷积神经网络模型的输入,并利用反向传播算法训练模型。最后,提取WFCNN模型产生的序列特征,将其作为输入文本的情感特征表示,加入到支持向量机SVMs分类器,实现对文本的情感极性分类。

3.1

基于词典的词语抽象表示方法

度限制,内容往往较为精简,偏向于V1语化,整体情感较为单一,因此文本中的相关情感表达序列片段往往代表着文本的情感倾向。例如,“太逗了!看到蒙牛笑喷了”其中“太逗了”和“笑喷了”代表了整句


本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-34703-3.html

相关阅读
    发表评论  请自觉遵守互联网相关的政策法规,严禁发布、暴力、反动的言论

    热点图片
    拼命载入中...