摘要:
情感或情感分析广泛用于舆论分析,产品评论分析基于层次结构的多策略中文微博情感分析和特征抽取,产品推荐等领域,文本中的情感或情感分析通常基于情感词典. 尽管人为的情感词典是准确的,但它们的构建成本很高且难以及时更新. 很难适应诸如微博之类的新情感词的数据. 微博平台为新的情感词的发布和传播提供了便捷的途径,是新的情感词的重要来源. 考虑的人工A情感词典和大量包含新情感词的微博数据. 通过对中英文微博中情感词分布的差异进行统计,分析和比较,提出了一种基于分类思想的与特定语言无关的新情感. 单词提取方法cNSEm.cNSEm基于微博数据集和情感词典自动构建训练数据,训练分类器并确定候选单词的情感极性,最后使用投票机制确定候选单词的情感极性. 通过大量的详细实验,分析了cNSEm在中英文微博客数据上的表现,六种特征的作用和用法以及微博情感分类的新情感词的情感分类. 实验结果表明基于层次结构的多策略中文微博情感分析和特征抽取,cNSEm优于经典的同现和极性传播方法,尤其是在中文微博数据集中考虑名词情感词时. cNSEm提取的新情感词直接被使用. 前者以人工情感词典为参考,后者检查提取的新情感词对情感分类的帮助. 从评估指标来看,cNSEm提取的新情感词等效人工情感词典的质量. cNSEm可以适应中文和英文,差异很大.
展开
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-162291-1.html
小王子
这次国家必须要做坚决的回应