[1]陈俊宇,郑 列.基于R语言的商品评论情感可视化分析[J].湖北工业大学学报,2020,(1):110-113.
 CHEN Junyu,ZHENG Lie.Visual Analysis of Commodity Comment Emotion Based on R Language[J].,2020,(1):110-113.
点击复制

基于R语言的商品评论情感可视化分析()
分享到:

《湖北工业大学学报》[ISSN:1003-4684/CN:42-1752/Z]

卷:
期数:
2020年第1期
页码:
110-113
栏目:
湖北工业大学学报
出版日期:
2020-02-28

文章信息/Info

Title:
Visual Analysis of Commodity Comment Emotion Based on R Language
文章编号:
1003-4684(2020)01-0110-04
作者:
陈俊宇 郑 列
湖北工业大学理学院, 湖北 武汉 430068
Author(s):
CHEN Junyu ZHENG Lie
School of Sciences, Hubei Univ. of Tech., Wuhan 430068, China
关键词:
可视化分析 TF-IDF算法 词云图 LDAvis
Keywords:
visual analysis TF-IDF algorithm word cloud map LDAvis
分类号:
F724.6
文献标志码:
A
摘要:
通过自然语言处理技术,实现对商品评论数据的可视化流程分析,利用八爪鱼采集器对京东商品评论数据进行采集,对文本数据进行去重、分词、去停词等预处理,再结合TF-IDF算法来提取文本数据特征词,利用R软件建立LDA主题模型并提取主题,使用LDAvis 可视化工具对主题模型进行交互式可视化分析,并结合词云图将评论文本数据以更直观的方式展现出来,从而挖掘消费者重点关注的评论词语,结合主题模型和词云图两种可视化方法将用户评论情感数据通过丰富的图形进行内容展示,可以使情感分析的结果更准确、更全面反映产品和客户需求,为消费者的购买和商家的改进提供依据。
Abstract:
The visualization process of commodity review data through natural language processing technology is realized. Jingdong commodity review data by using Octopus collector is collected. Preprocessing of the data such as deduplication, word segmentation and stop word on text data is performed, and TF-IDF algorithm is then combined to extract text data feature words. LDA topic model is built and topics are extracted by using R software. Topic models are interactively visualized by using LDAvis visualization tool, and word cloud diagram is combined to display comment text data in a more intuitive way to explore the commentary words that consumers focus on. The innovation of this paper is to combine the theme model and the word cloud map to display the user’s commentary sentiment data through rich graphics, which can make the results of sentiment analysis more accurate. More comprehensive understanding of products and customer needs, providing an important basis for consumer purchases and business improvement.

参考文献/References:

[1] 刘 丹.基于客户评论的电商热水器数据分析与挖掘[J].理论观察,2017(11):98-100.
[2] 刘徽.基于电商评价数据的情感分析[J].内江科技,2018(12):104-105.
[3] 张梁均,云伟标,王路,等.R数据分析与挖掘实战[M].北京:机械工业出版社,2015.
[4] 陈雪,朱名勋.淘宝网店铺评论数据高频词挖掘研究[J].金融经济,2018(1):133-134.
[5] 刘少俊,方延风.基于主题模型的网络信息源可视化分析研究[J].图书情报导刊,2019(3):32-38.
[6] 陈义.文本挖掘在网购用户评论中的应用研究[D].杭州:浙江工商大学,2018.
[7] 杨斯楠,徐健,叶萍萍.网络评论情感可视化技术方法及工具研究[J].数据分析与知识发现,2018(5):77-86.

相似文献/References:

[1]石 诗,陈有坤.基于CiteSpace国内生态翻译学研究的可视化分析[J].湖北工业大学学报,2019,34(6):58.
 SHI Shi,CHEN Youkun.A CiteSpace Analysis of Research on Eco-translatology in China[J].,2019,34(1):58.

备注/Memo

备注/Memo:
[收稿日期] 2019-09-26
[基金项目] 教育部人文社会科学研究规划基金项目(17YJA790098)
[第一作者] 陈俊宇(1994-), 女,江西萍乡人,湖北工业大学硕士研究生,研究方向为大数据分析
[通信作者] 郑   列(1963-), 男,湖北英山人,湖北工业大学教授,研究方向为应用统计
更新日期/Last Update: 2020-04-11