华东师范大学学报(自然科学版) ›› 2014, Vol. 2014 ›› Issue (4): 62-68, 87.
朱海欢, 余青松
ZHU Hai-huan, YU Qing-song
摘要: 提出一种基于词典与语料结合的中文微博主观句抽取方法, 通过判断句子中是否包含情感表达文本来判断句子是否为主观句. 首先, 从现有的情感词典中挑选出情感倾向较为固定的情感词构建了一个高可信情感词典, 用于抽取句子中的情感表达文本, 保证情感表达文本抽取的准确率; 然后提出~N-POSW~模型, 并基于~2-POS~W模型通过语料学习的方法较为准确地抽取句子中的剩余情感表达文本, 保证了情感表达文本抽取的召回率. 实验结果表明, 相比于传统的基于大规模情感词典的方法, 本文方法主观句抽取的F值提高了7%.
中图分类号: