下采样层输出的特征向量作为全连接层的输入,然后利用Softmax输出分类结果,并根据训练数
属性。在此基础上,通过卷积神经网络的卷积运算,
在抽象出的词语属性序列上,进行基于卷积操作的特征提取。通过这一运算,获得在抽象属性基础上的序列特征。例如,“否定词+负面极性词=正面极性”这一规则,可以结合序列特征和文本分类标签,通过卷积运算获得。
因此,本文提出的相关方法所抽取的特征,具有很好的可理解性。在此基础上,可以将本文的相关方法与传统的规则方法通过添加规则集的方式进行融合,也可以利用本文的相关方法和传统的特征工程方法进行特征层面的融合。
据的实际分类标签,采用反向传播算法对模型参数
进行梯度更新。即:
P(yfy,W;,b,)一如丘优口z,(Ⅳ,?V+b,)(5)
其中,y∈{+1,一1),W,∈RyI,b;为偏置项。
最后,利用训练好的WFCNN模型,将文本特征矩阵转为特征向量V,并用SVMs分类器进行模型训练和分类。
3.3词语序列特征融合方法
本文提出的WFCNN模型在对文本特征矩阵进行特征提取后,输出文本的特征向量V。特征向量V可以作为其他模型的附加特征,为其他模型提供一种嵌入文本情感倾向性特征的简单高效的方法。假设V为增加文本情感倾向性特征后的特征向量,
4
实验结果
在2014年中文观点倾向性分析评测(Chinese
OpinionAnalysis
Evaluation,COAE2014)微博数
据集上,对本文提出方法有效性进行评估。COAE2014微博数据集分为训练数据集和测试数据集。训练数据来自同一个话题,总共2174条,其
中有1003条带有正面情绪,1171条带有负面情
绪。测试数据分别选白手机、保险、翡翠三个不同话题,总共7000条,其中带有正面情感的有3776条,带有负面情感的有3224条。
本文设计了两组实验来验证本文提出方法的有
n。涮模型原始特征向量,则:
V=U由蒯①V
其中④为向量拼接操作。
在本文提出的计算体系下,可以对文本中每一
(6)
效性。实验一,对比本文提出的WFCNN模型与Kim提出的基于word2vec训练的词向量的CNN模型(标记为W2VCNN)以及SidaWang提出的
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-34703-5.html
有着不属于这个年龄的成熟