[1]侯 乔,陈宏伟.基于多策略改进蝙蝠算法的文本特征选择[J].湖北工业大学学报,2019,34(5):64-66+71.
 HOU Qiao,CHEN Hongwei.Text Feature Selection Based on Multistrategy Improved Bat Algorithm[J].,2019,34(5):64-66+71.
点击复制

基于多策略改进蝙蝠算法的文本特征选择()
分享到:

《湖北工业大学学报》[ISSN:1003-4684/CN:42-1752/Z]

卷:
34卷
期数:
2019年第5期
页码:
64-66+71
栏目:
湖北工业大学学报
出版日期:
2019-10-30

文章信息/Info

Title:
Text Feature Selection Based on Multistrategy Improved Bat Algorithm
文章编号:
1003-4684(2019)05-0064-03
作者:
侯  乔 陈宏伟
湖北工业大学计算机学院, 湖北 武汉 430068
Author(s):
HOU QiaoCHEN Hongwei
School of Computer Science, Hubei Univ. of Tech., Wuhan 430068, China
关键词:
特征选择 蝙蝠算法 文本分类 多策略改进
Keywords:
feature selection bat algorithm text classification multistrategy improvement
分类号:
TP391
文献标志码:
A
摘要:
特征选择是文本分类过程的重要处理步骤,在其他分类预处理环节和分类算法确定的条件下,通过传统特征选择方法很难大幅度提高文本分类的准确率。针对此问题,介绍了一个基于改进蝙蝠优化的新的文本特征选择方法,即利用传统的特征选择方法对原始特征进行预选,在此基础上使用高斯局部扰动和自适应调节权重机制改进传统蝙蝠群算法,并以二进制编码形式对预选特征进行优选,分类准确率作为个体的适应度,提出了多策略改进蝙蝠算法的文本特征选择算法MSBA,实现对文本特征选择优化模型的高效求解。结果表明,采用MSBA进行特征优选后,其分类准确率得到有效提高。
Abstract:
Feature selection is an important processing step of the text classification process. It is difficult to greatly improve the accuracy of text classification by traditional feature selection methods, when other classification processing and algorithms are set. Therefore, a new text feature selection method based on improved bat optimization is introduced. It uses traditional feature selection method to preselect the original features, based on which Gaussian local perturbation and adaptive adjustment weights are used to improve the traditional bat group algorithm. The preference and classification accuracy of preselected features is used as the fitness of the individual in binary coding. The multistrategy improved bat algorithm text feature selection algorithm MSBA is proposed to realize the efficient solution of text feature selection optimization model. The results show that the classification accuracy of MSBA is improved.

参考文献/References:

[1] Pang Guansong, Jiang Shengyi. Text automatic classification technology research[J]. Information Studies: Theory & Application, 2012, 35(2):123-128.
[2] 周茜,赵明生,扈旻.中文文本分类中的特征选择研究[J].中文信息学报,2004, 18(3):18-24.
[3] 代六玲,黄河燕,陈肇雄.中文文本分类中特征抽取方法的比较研究[J].中文信息学报,2004,18(1):27-33.
[4] 庞观松,蒋盛益.文本自动分类技术研究综述[J].情报理论与实践,2012,35(2): 123-128.
[5] Mirjalili S, Mirjalili S M,Yang X S. Binary bat algorithm[J]. Neural Computing and Applications, 2014, 25(3-4): 663-681.
[6] 李文慧,张英俊,潘理虎.多因素影响特征选择的短文本分类方法[J].计算机系统应用,2018,27(12):216-221.
[7] 李煜,裴宇航,刘景森.融合均匀变异与高斯变异的蝙蝠优化算法[J].控制与决策, 2017, 32(10):1775-1781.
[8] 朱德刚,孙辉,赵嘉,等.基于高斯扰动的粒子群优化算法[J].计算机应用, 2014,34(3):754-759.
[9] 吕石磊,黄永霖,陈海强,等.基于自适应步长的改进蝙蝠算法[J].控制与决策, 2018,33(3):57-564.
[10] Feng G, Guo J, Jing B Y, et al. Feature subset selection using naive Bayes for text classification[J]. Pattern Recognition Letters, 2015, 65: 109-115.

相似文献/References:

[1]韩 麟,陈宏伟.基于Spark的灰狼优化算法研究[J].湖北工业大学学报,2019,34(5):60.
 HAN Lin,CHEN Hongwei.Research on Grey Wolf Optimization Algorithm Based on the Spark[J].,2019,34(5):60.
[2]万英杰,刘 辉.基于RCA-BA算法的配电网故障区段定位研究[J].湖北工业大学学报,2019,34(1):57.
 WAN Yingjie,LIU Hui.Research on Fault Location of Distribution Network Based on RCA-BA Algorithm[J].,2019,34(5):57.

备注/Memo

备注/Memo:
[收稿日期] 2019-07-05
[基金项目] 国家自然科学基金(61772180); 湖北省自然科学基金(2013CFB020)
[第一作者] 侯   乔(1994-), 男, 湖北安陆人,湖北工业大学硕士研究生,研究方向为大数据,文本处理
[通信作者] 陈宏伟(1975-), 男, 湖北武汉人, 工学博士,湖北工业大学教授,研究方向为云计算,大数据
更新日期/Last Update: 2019-11-21