广东工业大学学报 ›› 2014, Vol. 31 ›› Issue (3): 1-7.doi: 10.3969/j.issn.1007-7162.2014.03.001
• 综合研究 • 下一篇
Teng Shao-hua, Wu Hao, Li Ri-gui, Zhang Wei, Liu Dong-ning, Liang Lu
广东工业大学 计算机学院,广东 广州 510006
摘要: 电信业务每天都产生大量数据,如何从这些数据中提取有用的信息是当今数据挖掘的难题之一.针对实际应用中存在聚类簇数难以确定、单趟聚类算法有时不能收敛到用户指定的簇数等问题,提出了可调多趟聚类挖掘方法.第1趟通过引入一个较大的K值,采用K-means聚类算法,获得K个簇,为第2趟聚类的簇数及簇中心初始值选择提供参考.经电信现网业务数据实验,本文的方法既改善了原聚类方法的局部收敛性,又能较好地适应用户的不同数据分析需求,该方法可用于不确定簇数的大数据分析中.
[1] | 杨婷, 滕少华. 改进的贝叶斯分类方法在电信客户流失中的研究与应用[J]. 广东工业大学学报, 2015, 32(3): 67-72. |
|