广东工业大学学报 ›› 2014, Vol. 31 ›› Issue (3): 95-101.doi: 10.3969/j.issn.1007-7162.2014.03.017

• 综合研究 • 上一篇    下一篇

采用SVM方法的文本情感极性分类研究

广东工业大学 计算机学院,广东 广州 510006   

  1. 广东工业大学 计算机学院,广东 广州 510006
  • 收稿日期:2014-04-16 出版日期:2014-09-30 发布日期:2014-09-30
  • 作者简介:陈培文(1990-),男,硕士研究生,主要研究方向为文本情感分析和数据挖掘.
  • 基金资助:

    广东省自然科学基金资助项目(9151009001000007);广东省科技计划项目(2012B091000173)

Research on Sentiment Classification of Texts Based on SVM

School of Computers, Guangdong University of Technology, Guangzhou 510006, China   

  1. School of Computers, Guangdong University of Technology, Guangzhou 510006, China
  • Received:2014-04-16 Online:2014-09-30 Published:2014-09-30

摘要: 文本情感极性分类是文本情感分析首先要解决的关键问题.在分析影响文本情感分类的各类因素的基础上,首先构建了情感词典,并进行情感特征选取以及情感特征加权,然后使用SVM分类的方法对文本进行情感识别及分类,最后在语料数据集的基础上,在单机平台上和Spark分布式计算平台上执行分类模型,对比分析其分类精度和时间代价.实验结果验证了本文构建的情感极性分类模型在单机和分布式云平台上中的有效性.

关键词: 情感分类, 支持向量机, Spark分布式计算平台

Abstract: The key problem to solve in a sentiment analysis of texts is the sentiment polarity classification. Based on the analysis of various factors affecting sentiment classification of texts, it built the sentiment lexicon, extracted affective characteristics, and weighted sentimental features. Then, it used support vector machine (SVM)  classifier for emotion recognition and text classification. Finally, it performed the classification model with the corpus data sets on the single platform and the Spark distributed computing platform to analyze its classification accuracy and time cost. The experimental results verify the effectiveness of the text sentimental polarity categorization model on the single platform and on the spark distributed computing platform.

Key words: sentiment classification, support vector machine, Spark distributed computing platform

[1] 陈友鹏, 陈璟华. 基于鲸鱼优化参数的最小二乘支持向量机短期负荷预测方法[J]. 广东工业大学学报, 2020, 37(03): 75-81.
[2] 王丹荣, 莫艳. 基于支持向量机的离散线性微分方程求解方法[J]. 广东工业大学学报, 2020, 37(02): 87-93.
[3] 曾碧卿, 韩旭丽, 王盛玉, 徐如阳, 周武. 基于双注意力卷积神经网络模型的情感分析研究[J]. 广东工业大学学报, 2019, 36(04): 10-17.
[4] 胡俊, 滕少华, 张巍, 刘冬宁. 支持向量机与哈夫曼树实现多分类的研究[J]. 广东工业大学学报, 2014, 31(2): 36-42.
[5] 夏琴晔, 杨宜民. 基于biSCAN和SVM的机器人目标识别新算法研究[J]. 广东工业大学学报, 2013, 30(4): 65-69.
[6] 朱燕飞; 谭洪舟; 章云; . 基于LS-SVM的非线性系统盲辨识[J]. 广东工业大学学报, 2007, 24(2): 76-79.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!