参考文献/References:
[1] 黄文彬, 徐山川, 吴家辉, 等. 移动用户画像构建研究[J]. 现代情报, 2016, 36(10):54-61.
[2] 孟巍, 吴雪霞, 李静,等. 基于大数据技术的电力用户画像[J]. 电信科学, 2017(S1):15-20.
[3] 单晓红, 张晓月, 刘晓燕. 基于在线评论的用户画像研究——以携程酒店为例[J]. 情报理论与实践, 2018, 41(4): 99-104,149.
[4] Zaharia M, Chowdhury M, Franklin M J, et al. Spark: cluster computing with working sets[C]//Usenix Conference on Hot Topics in Cloud Computing, 2010.
[5] 朱珠. 基于Hadoop的海量数据处理模型研究和应用[D]. 北京:北京邮电大学, 2008.
[6] 李绍俊, 杨海军, 黄耀欢,等. 基于NoSQL数据库的空间大数据分布式存储策略[J]. 武汉大学学报(信息科学版), 2017, 42(2):163-169.
[7] Vora M N. Hadoop-HBase for large-scale data[C]// International Conference on Computer Science & Network Technology,2012.
[8] 程国建, 赵倩倩. K-means聚类算法在Spark平台上的应用[J]. 软件导刊, 2016, 15(2):146-148.
[9] 张媛, 张燕平. 一种PCA算法及其应用[J]. 计算机技术与发展, 2005, 15(2):67-68.
[10] 吴晓婷, 闫德勤. 数据降维方法分析与研究[J]. 计算机应用研究, 2009, 26(8):28322835.