on
are
used
tO
tOextract
sequence
ap—
our
plied
sentimentclassification.Theevaluations
ChineseOpinionAnalysisEvaluation2014datasetshowthat
proposedapproachoutperformstheconvolutionalneuralnetworksmodelwithwordembeddingfeaturesandNaiveBayesSupportVectorMachines.
Key
words:convolutionalneuralnetworks;sentimentanalysis;wordsentimentsequencefeatures
的悄然改变。用户通过微博等自媒体在社交网络中
1
引言
互联网相关技术的飞速发展带来人们日常生活
表达自己的观点,在电子商务平台对网购的产品进行评价等行为已经成为了日常生活中的一部分。如何利用机器学习、自然语言处理技术对此类文本进
收稿日期:2015一07一06定稿日期:2015-09—10
基金项目:国家自然科学基金(61370165,61203378);国家863计划(2015AA015405);广东省自然科学基金(¥2013010014475);深圳市孑L雀计划技术创新项目(KQCX20140521144507925);深圳数字舞台表演机器人技术工程实验室
([2014]1507);深圳市基础研究计划(JCYJ20150625142543470)
万方数据
6期
陈钊等:结合卷积神经网络和词语情感序列特征的中文情感分析
173
行分析,获得其中的观点倾向性、情感极性,成为了人工智能领域的一个重要研究问题[1]。
传统的情感分析技术大体可以分为基于规则的方法和基于统计的方法。基于规则的方法主要从语言学角度出发,利用语言专家的人工知识编写词典和模板,对文本中的情感倾向性进行分析口]。基于统计的方法,则从机器学习的角度出发,利用人工标注的训练语料,进行特征提取和统计模型构建,自动化地实现情感极性的判断[3]。在文本情感分析发展的十余年中,两类方法相互渗透,使得情感分析技术向着更高的水平迈进。在这个过程中,研究人员们积累了大量的资源、工具、算法与模型。
为此,本文提出一种结合卷积神经网络和情感计算资源的中文文本情感分析方法,采用基于词典资源的抽象表达方式来描述每个词语的基本属性特征,将词语的情感极性和词性特征应用到文本的特征表示。然后利用卷积神经网络提取与文本情感表达相关的序列特征作为文本的特征向量用于情感分类。在中文倾向性分析评测Chinese
OpinionAnal—
ysis
Evaluation(COAE2014)数据集的实验显示本
文提出的方法取得了比目前主流的卷积神经网络
(ConvolutionalNeural
Network,CNN)以及朴素
贝叶斯支持向量机(NaiveBayes
SupportVector
Machines,NBSVM)更好的性能,显示了本文提出
思路的有效性。
本文的内容组织结构如下:第二节介绍情感分析以及深度学习的相关工作,第三节主要介绍本文提出的情感分析方法,第四节将通过两组实验评估
万方数据
本文方法的有效性,第五节将对本文的主要贡献做出梳理和总结。
2
相关工作
文本情感分析技术主要通过分析文本内容来判
断文本所表达的情感倾向。这一技术在产品评价分析、舆情监控等方有较广泛的应用。
情感分析技术大体可以分为基于规则的方法和基于统计的方法。其中基于情感词典资源的有监督机器学习方法是目前的研究热点。这类方法主要基于有监督的机器学习方法,如支持向量机(SVMs,
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-34703-2.html
专家说
对象不定