用户名: 密码: 验证码:
数据挖掘在电信企业客户细分中的应用研究
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
数据挖掘是较先进的数据分析方法,可以对客户数据进行深入地分析。“以客户为中心”的先进的经营管理理念充分体现在客户细分上。客户细分最大程度地满足客户需求,使企业利润达到极大化。将数据挖掘技术应用于客户细分,能够帮助企业实现既定目标。
     本文针对电信行业的客户细分,主要做了以下工作:
     首先,介绍了国内外有关电信行业客户细分常用的方法,比较分析了各数据挖掘算法的特点。结合电信行业的数据海量的特点,重点分析了经典K-means算法和k-medoids算法的设计思想,确定了以优化初值、固定细分标准、提高执行效率作为算法改进的关键点,提出了适合于电信行业客户细分的tt-k-means(二次均值)算法和tt-k-medoids(二次中心点)算法,并完成算法的详细设计。
     其次,采集赣州电信公司的样本数据,结合部分经验值,对系统进行了验证,并对细分结果进行了比较分析。实验结果表明,tt-k-means和tt-k-medoids细分结果更准确,运行效率更高。
     最后,介绍了数据挖掘的整个流程和数据仓库的架构模式,在该系统架构之内,设计实现了客户细分系统。该系统以tt-k-means和tt-k-medoids为核心,由系统管理模块、预处理模块、聚类分析模块、知识表达模块构成。
     开发的系统具备试运行条件和应用推广价值。它的成功开发和应用,为今后实现其它类别的客户细分系统做了有益的探索。
The advanced management idea of“Take the customer as the center”manifests fully in the customer segmentation. Customer segmentation may meet customer need at whole hog, enable the enterprise to achieve the maximal profit. Data Mining is an advanced effective data analysis method. Its Application to customer segmentation will help the enterprises to gain their ends on the best way.
     As for customer segmentation in telecommunication enterprises, in this article I have mainly done the following work:
     Firstly, It introduced commonly used methods of customer segmentation in the domestic and foreign telecommunication enterprises, various characteristics of data mining algorithm by comparative analysis.
     With emphasis I analyzed the design concept of the classical K-means algorithm and the k-medoids algorithm, determined optimizing the initial value and the fixed segmentation standard and efficiency of carrying out to take the algorithm improvement as the key point, proposed tt-k-means and tt-k-mediods algorithms, and completed their detailed design.
     Secondly, I have gathered some sample data from Ganzhou Teleco mmunication Corporation, confirmed the system by some empirical values, and carried on the comparative analysis to the segmentation result.
     The experimental result indicated that segmentation results from tt-k-means and tt-k-mediods algorithms were efficient and effective, and the model produced was reasonable and understandable.
     Finally, I introduced the entire flow of data mining and the framework of data warehouse, and completed the customer segmentation system in the construction. The system took tt(two-times) algorithms as a core. It’s composed of system administration module, pretreatment module, cluster analysis module, knowledge expression module. This system should become a subsystem to the business analysis system.
     The successful application of this system would facilitate to explore some other similar segmentation system.
引文
[1] 尹松,周永权,李陶深.数据聚类方法的研究与分析[J].航空计算技术,2005(3):63-66
    [2] 秦永俊.数据挖掘在 CRM 中的应用设计[J].电脑开发与应用,2004(1):32-34
    [3] 李 斌 ,郭 剑 毅 .聚 类 分 析 在 客 户 关 系 管 理 中 的 研 究 与 应 用 . 计 算 机 工 程 与 设 计 , 2005(2):540-542
    [4] 袁方,周志勇,宋鑫.初始聚类中心优化的 k-means 算法.计算机工程,2007(2):65-66
    [5] Kanufman L,Rousseeuw PJ.Finding Groups in Data:an Introduction to Cluster Analvsis,John Wiley & Sons,1990:99-100
    [6] Ester M, Kriegel H-P,Sander J,Xu X.:A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise,Froc. 2nd Int. Conf.on Knowledge Discovery and Data Mining(KDD'96),Portland,OR,AAA Press. 1996:226-231
    [7] Ciaccia P,Patella M,Zezula P:M-tree:An Efficient Access Method for Similarity Search in Metric Spaces,Proc.23rd Int.Conf.on Very Large Data Bases, Athens, Greece, 1997:426-435
    [8] Lm J.Walker.Requilements of an Objected-Oriented Design Metbod.Software Engineering Journa1:7-8
    [9] Bechmann N,Kriegel H.-P,Schneider R,Seeger B.Tlie R*-tree: An Efficient and Robust Access Method for poW is and Rectasigles, Proc. ACM SIGMOD W t. Conf. on Management of Data, Atlantic City, NJ, ACM Press, New York,1990:322-331
    [10] Boocb G. Object-Oriented Development IEEE Transaction Software Engineering:245-247
    [11] Lm J.Walker.Requilements of an Objected- Oriented Design Metbod.Software Engineering Journal:7-8
    [12] Sheneiderman.B. Direct Manipulation: A Step Byond Programming Language.IEEE Computer: 357-359
    [13] Olsen DRJ,Dempsy EP. Syngraph:A Graphical User Interface Generat-or.Computer Graphics:69-70
    [14] P.Valduriez. S.khoshafian and G.P.Copeland. Implementation Techniques of Complex Objects:44-45
    [15] O.M.Nierstrasz. A Survey of Object Oriented Concepts. In: Active Object Environments (Ed. by D.Tsichritzis), University of Geneva:19-21
    [16] A.Snyder.The Essence of Objects: Concepts and Terms.IEEE Software:562-564
    [17] 李益强,漆晨曦.基于数据挖掘的电信客户细分研究[J].电信决策研究动态,2005(5): 37-42
    [18] 田扬戈,边馥苓.基于概念聚类和面向属性归纳的区划分析[J].武汉大学学报(信息科学版),2005(1):86-88
    [19] 石杰楠.数据挖掘研究综述[J].航天制造技术,2OO5(8):27-28
    [20] 杜冰.数据挖掘在电信行业中的应用[J],科技和产业,2005(11):16-21
    [21] Mehmed Kantardzi 著,闪四清,陈茵,程雁等译.数据挖掘[J].清华大学出版社,2003:3-59,219
    [22] 陈文伟,黄金才.数据挖掘与数据仓库[M].人民邮电出版社,2004:5-7,106-107
    [23] 陈 慧 萍 ,王 煜 ,王 建 东 .高 维 数 据 挖 掘 算 法 的 研 究 与 进 展 [J].计 算 机 工 程 与 应 用 , 2006:170-171
    [24] Lu Changkui,Jiang Chengyu,Wang Ningsheng.A Fast Algorithm for Support Vector Clustering.Journal of Southwest Jiaotong University[J],2004(11):136-140
    [25] 李别.基于神经网络的数据挖掘算法[J].广东技术师范学院学报,2005(4):26-29
    [26] 陈良维.数据挖掘中聚类算法研究[J].微计算机信息(管控一体化),2006:209-211
    [27] 牟廉明.数据挖掘中聚类方法比较研究[J].内江师范学院学报,2003:16-20
    [28] 尹云飞,钟智,黄发良.基于数据挖掘的模块评估法[J].计算机工程,2005(4):52-53
    [29] 张 红 云 ,石 阳 ,马 垣 .数 据 挖 掘 中 聚 类 算 法 比 较 研 究 [J].鞍 山 钢 铁 学 院 学 报,2001 (10):364-367
    [30] 王 敞 ,陈 增 强 ,袁 著 祉 .基 于 遗 传 算 法 的 K 均 值 聚 类 分 析 .计 算 机 科 学 ,2003(2): 163-164
    [31] 刘志成,文全刚.K-中心点聚类算法分析及其实现[J].电脑知识与技术,2005(6):20 -24
    [32] 范英 ,张忠能,凌君逸.聚类方 法 在 通 信 行 业 客户 细 分 中 的 应 用[J].计 算机工 程, 2004(12):440-442
    [33] 郭俊,樊彦国.一种改进的 CURE 聚类算法[J].内蒙古石油石油化工,2005(8):12-15
    [34] 冯 兴 杰 ,黄 亚 楼 .增 量 式 CURE聚 类 算 法 研 究 [J].小 型 微 型 计 算 机 系 统 ,2004(10): 1847-1849
    [35] 吕强,俞金寿.DBSCAN在非空间属性处理上的扩展[J].计算机应用,2005(6):1379- 1381
    [36] ZHOU HaoFeng,YUAN QingQing,CHENG ZunPing and SHI BaiLe. PHC:A Fast Partition and Hierarchy Based Clustering Algorithm[J].Computer.Sci.&Technol,2003(3),Vol.18.No3:407-411
    [37] 苏守宝,郁书好,陈明华.基于智能计算的聚类挖掘研究进展.计算机测量与控制,2006 (14):561-563
    [38] 行小帅,焦李成.数据挖掘的聚类方法[J].电路与系统学报,2003(2):59-66
    [39] 陈梅兰.基于网格和密度聚类算法研究[J].计算机与现代化,2005(2):1-6
    [40] 刘义,万迪方,张鹏.基于购买行为的客户细分方法比较研究[J].管理科学,2003(2): 69-72
    [41] 王茂芝,郭科,徐文皙,范安东.利用连续 Hopfield 神经网络求解聚类问题的模型构造 [J].应用科学学报,2006(1):31-35
    [42] 丁学钧,刘建臣,宋淑彩.一种基于属性的模糊聚类算法及其应用研究[J].计算机工程,2004(l2):59-61
    [43] 张 玉 英 , 孟 海 东 . 数 据 挖 掘 技 术 中 聚 类 算 法 的 改 进 研 究 . 包 头 钢 铁 学 院 学报,2005(12):338-341
    [44] 梁伍七,江克勤.数据挖掘中的模糊聚类分析及其应用[J].安庆师范学院学报(自然科学版),2004(5):65-67
    [45] 吴景岚,朱文兴.基于 K 中心点的文档聚类算法[J].兰州大学学报,2005(10):88-91
    [46] 程扬.数据仓库技术的研究与分析[J].福建电脑,2005(9):14-15
    [47] 彭木根编著.数据仓库技术与实现[M].电子工业出版社,2003
    [48] 康晓东主编.基于数据仓库的数据挖掘技术[M].机械工业出版社,2004
    [49] 严任远.基于数据仓库的企业OLAP多维模型的设计与实现[J].情报杂志,2006(9):31 -33
    [50] 刘 蓉 ,陈 晓 红 .基 于 数 据 挖 掘 的 移 动 通 信 客 户 消 费 行 为 分 析 [J].计 算 机 应 用 与 软件,2006(2):61
    [51] 王晓红.数据挖掘在消费者生活形态细分中的应用研究[J].理论与方法.市场研究, 2005(10):31-35
    [52] 陈凤洁.电信客户细分方法及应用[J].科技和产业,2005(11):10-12
    [53] 左子叶,朱扬勇.基于数据挖掘聚类技术的信用评分评级[J].计算机应用与软件, 2004(4):1-4
    [54] 苏成.数据挖掘中不可忽视的环节—数据预处理[J].应用技术,2006(10):64-66
    [55] 鄂旭,高学东,谢霖铨,贺海钧.粗糙集中一种连续属性预处理方法[J].辽宁工程技术大学学报,2005(6):400-403
    [56] 王新英,陈语林.数据抽取、转换、装载综述[J].企业技术开发,2004(8):3-5
    [57] Michael J.A.Berry,Gordon S.Linoff 编著,袁卫等译.数据挖掘[M].中国人民大学中国时政经济出版社,2004
    [58] 易珺,路璐,曹东.改进的 k-means 算法在客户细分中的应用研究[J].微型机与应用, 2005(12):52-53

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700