我们的网站为什么显示成这样?

可能因为您的浏览器不支持样式,您可以更新您的浏览器到最新版本,以获取对此功能的支持,访问下面的网站,获取关于浏览器的信息:

|本期目录/Table of Contents|

基于表情符号的文本情感分析研究(PDF)

《现代预防医学》[ISSN:1003-8507/CN:51-1365/R]

期数:
2019年09期
页码:
1537-1540
栏目:
流行病与统计方法
出版日期:
2019-05-09

文章信息/Info

Title:
Textual sentiment analysis based on emoticons
作者:
阳庆玲1郑志伟1邱佳玲1郭山清2贾忠伟3宋超4顾菁5李菁华6郝元涛5郝春5
1.中山大学公共卫生学院医学统计与流行病学系,广东 广州 510080;
2.山东大学计算机科学与技术学院,山东 济南 250100;
3.北京大学中国药物依赖性研究所,北京 100871;
4.电子科技大学计算机科学与工程学院,大数据研究中心,四川 成都 611731;
5.中山大学公共卫生学院医学统计与流行病学系,国家治理研究院全球卫生研究中心,卫生信息研究中心,广东省卫生信息学重点实验室,广东 广州 510080;6.中山大学公共卫生学院卫生管理学系,广东 广州 510080
Author(s):
YANG Qing-ling*ZHENG Zhi-weiQIU Jia-lingGUO Shan-qingJIA Zhong-weiSONG ChaoGU JingLI Jing-huaHAO Yuan-taoHAO Chun
*Department of Medical Statistics and Epidemiology,School of Public Health,Sun Yat-sen University,Guangzhou,Guangdong 510080,China
关键词:
表情符号机器学习情感分析
分类号:
R195
DOI:
-
文献标识码:
A
摘要:
目的 提出一种基于表情符号的文本自动标注的方法,为文本情感分析提供方法学参考。方法 从Blued软件抓取广东省用户的发帖文本,筛选出情感倾向明显的表情符号。基于筛选的表情符号生成训练集,并对含表情符号的训练文本进行自动标注。然后用机器学习的方法训练分类器,并在人工标注的测试集中验证,评估其分类效果。结果 共选取标签表情符号174个,其中正向表情符号93个(53.5%),负向表情符号81个(46.5%)。纳入分析的文本共14.3万条,其中训练集13.0万条(90.9%),测试集1.3万条(9.1%)。朴素贝叶斯、逻辑回归、支持向量机、融合模型最高准确率分别为0.739、0.732、0.729、0.741。结论 基于表情符号自动标注文本的方法可应用于文本情感分类。

参考文献/References

-

备注/Memo

备注/Memo:
基金项目:广州市科技计划项目科学研究专项,基于成对数据的男男性接触者伴侣艾滋病高危性行为及风险预测研究,201504291407178;国家自然科学基金,基于人际依赖理论的男男性接触者伴侣艾滋病高危性行为研究,81502854
作者简介:阳庆玲(1993-),女,在读研究生,研究方向:艾滋病防治
通讯作者:郝春,E-mail:haochun@ mail.sysu.edu.cn
更新日期/Last Update: 2019-05-10