广东工业大学学报 ›› 2017, Vol. 34 ›› Issue (03): 49-53.doi: 10.12052/gdutxb.170011
王荣荣, 傅秀芬
Wang Rong-rong, Fu Xiu-fen
摘要:
聚类分析是非监督模式分类的一个重要分支.DBSCAN算法是基于密度聚类的最常见算法,且具有可发现任意形状的簇并且对噪声点不敏感等优点而得到广泛研究与应用.本文首先研究了DBSCAN所存在的一些问题,以及当前基于DBSCAN算法改进算法所存在的不足.其次,对于mpts-HDBSCAN算法处理密度分布不均匀数据聚类效果不理想的情况,提出了一种新的分区算法.分区算法根据数据分布的直方图确定分组数据,根据分区阈值这个标准来确定是否对数据进行划分处理;然后运用mpts-HDBSCAN算法对划分后的子数据进行聚类,并对聚类的结果进行合并.实验结果表明,改进后的算法对于处理密度不均匀数据具有更好的效果.
中图分类号:
[1] 滕少华, 吴昊, 李日贵等. 可调多趟聚类挖掘在电信数据分析中的应用[J]. 广东工业大学学报, 2014, 31(3):1-7. TENG S H, WU H, LI R G, et al. The application of the adjustable multi-time clustering algorithm in telecom data[J]. Journal of Guangdong University of Technology, 2014, 31(3):1-7. |
[1] | 樊娟, 邓秀勤, 刘玉兰. 一种基于Fréchet距离的谱聚类算法[J]. 广东工业大学学报, 2023, 40(02): 39-44. |
[2] | 莫赞, 范梦婷, 刘洪伟, 严杨帆. 基于在线用户行为的产品非对称竞争市场结构研究[J]. 广东工业大学学报, 2023, 40(02): 111-119. |
[3] | 范梦婷, 刘洪伟, 高鸿铭, 何锐超. 电子商务平台下的竞争产品市场结构研究[J]. 广东工业大学学报, 2019, 36(06): 32-37. |
[4] | 何庆祥, 张巍. 改进的聚类算法在恐怖袭击事件中的应用[J]. 广东工业大学学报, 2019, 36(04): 24-30. |
[5] | 谢振东, 冷梦甜, 吴金成. 基于一卡通数据的公交站点识别方法分析与研究[J]. 广东工业大学学报, 2019, 36(01): 23-28. |
[6] | 张巍, 麦志深. 核模糊谱聚类LOF降噪方法研究[J]. 广东工业大学学报, 2018, 35(06): 77-82. |
[7] | 马飞, 李娟. 基于聚类算法的MOOCs学习者分类及学习行为模式研究[J]. 广东工业大学学报, 2018, 35(03): 18-23. |
[8] | 陈丽, 曹熙, 林俊杰, 高鸿铭, 刘飞雅, 李艳艳. 基于数据挖掘的短期电力负荷风险预测分析[J]. 广东工业大学学报, 2017, 34(03): 105-109. |
[9] | 陈继峰, 刘广聪, 彭成平. 一种改进的无线传感器网络DV-Hop定位算法[J]. 广东工业大学学报, 2017, 34(02): 80-85. |
[10] | 申小敏, 李保俊, 孙旭, 徐维超. 基于卷积神经网络的大规模人脸聚类[J]. 广东工业大学学报, 2016, 33(06): 77-84. |
[11] | 王波, 钟映春, 陈俊彬. 融合AP和GMM的说话人识别方法研究[J]. 广东工业大学学报, 2015, 32(04): 145-149. |
[12] | 滕少华, 吴昊, 李日贵, 张巍, 刘冬宁, 梁路. 可调多趟聚类挖掘在电信数据分析中的应用[J]. 广东工业大学学报, 2014, 31(3): 1-7. |
[13] | 蒋盛益, 王连喜. 聚类分析研究的挑战性问题[J]. 广东工业大学学报, 2014, 31(3): 32-38. |
[14] | 李云, 鲍鸿. 语音分组识别技术的研究[J]. 广东工业大学学报, 2014, 31(2): 54-57. |
[15] | 姚蕾. 一种粒子群-Mamdani模糊神经网络的参数优化新算法[J]. 广东工业大学学报, 2014, 31(1): 36-39. |
|