首页 > 操作系统 >

情感策略定义_品牌的情感宿舍策略_基于层次结构的多策略中文微博情感分析和特征抽取(4)

电脑杂谈　发布时间：2017-02-27 00:05:43　来源：网络整理

的情感倾向。又如“所以我都不喝蒙牛，一直不喜欢

蒙牛。”，文本中的“不喜欢”表达了负面情绪。在对上述文本的倾向性进行识别时，若能提取与情感表达相关的序列片段，将有助于准确地判断文本的情感极性。基于上述对文本情感表达序列规则的观察，本文提出了利用词典资源构建词向量的方法。不同于ｗｏｒｄ２ｖｅｃ等实数向量的表示方式，本文利用词语本身具有的属性特征来构建词向量。

本文采用表１所示的词语特征。

本文把每一个词语映射到一个ｋ维０，１向量空间，即ｚ

Ｅ

Ｒ‘，其中ｋ代表词语本身具有的特征个

万方数据

表１情感分类采用的词语特征

特征名称

值是否是正面情感词（０／１）是否是负面情感词（０／１）是否是否定词（ｏ／１）

是否是程度副词（Ｏ／１）

是否是名词（０／１）是否是动词

（０／１）是否是形容词

（ｏ／１）是否是副词（０／１）是否是标点符号

（０／１）

数，每一维度的数值用０或１表示，０表示不具有该特征，１表示具有该特征。对于给定的句子，它包含孢个词ｚ。，１≤ｉ≤咒，构成一个咒×ｋ的特征矩阵。本文将句子中第ｉ个词到第Ｊ个词组成的短语片段记为ＸＥｉ，ｊ］。同理，包含ｒｔ个词的句子记做Ｘｈ。］。３．２基于词向量的卷积神经网络模型

卷积神经网络是一种前馈神经网络，由卷积层和下采样层叠加组合而成。每一层的输出是下一层的输人。卷积层作为特征提取层，通过滤波器提取局部特征，经过卷积核函数运算产生特征图，输出到下采样层。下采样层属于特征映射层，对卷积层产生的特征图进行采样，输出局部最优特征。本文在Ｋｉｍ［５］的卷积神经网络模型的基础上，引入了本文提出的基于词典资源的词向量表示方法。图１为本

文采用的卷积神经网络模型。

本文利用大小为ｈ×ｋ的滤波器对输入特征矩阵进行卷积操作，即：

Ｃｉ—ｆ（ｗ?Ｘｉ：Ｈ一＾一１＋６）

（１）

其中，ｃｉ代表特征图中第ｉ个特征值，．厂（?）为卷积核函数，硼Ｅ酞胜为滤波器，ｈ为滑动窗口大小，６为偏置值。Ｘ。：汁¨表示由第ｉ行到第ｉ＋＾一１行组成的局部特征矩阵。因此，特征图Ｃ为：

Ｃ—Ｅｃｌ，ｃ２，Ｃ３，…Ｃ，＾＋１］

（２）

下采样层采用Ｇｏｌｌｏｂｅｒｔ［１８３提出的ｍａｘ－ｏｖｅｒ—ｔｉｍｅ

ｐｏｏｌｉｎｇ方法进行特征采样，得到的特征值为；：

；一撇ｚ｛Ｃ）

（３）

卷积层和下采样层组成ＷＦＣＮＮ模型的特征提取层，ＷＦＣＮＮ由多个不同类型的特征提取层（＾取不同的值）并列组成，其中每种类型的特征提取层