数据挖掘中聚类初始化方法的优化研究
  修订日期:2007-12-30  点此下载全文
引用本文:李新良.数据挖掘中聚类初始化方法的优化研究[J].计算技术与自动化,2008,(2):130-133
摘要点击次数: 1926
全文下载次数: 386
李新良
[1]娄底职业技术学院,湖南娄底417000 [2]湖南大学软件学院,湖南长沙410082
中文摘要:研究现有的迭代优化聚类的初始化方法:即采样法,距离优化法以及密度估计法,分析它们的优缺点.提出一种新的基于距离的初始化方法,它不需要设定门限,不受数据集的顺序影响,它使得聚类过程有良好的速度和迭代次数,且初始化运算时间较短,对孤立点和噪声有较强的抑制作用,它适用于较大规模数据的聚类初始化.
中文关键词:数据挖掘  聚类  聚类有效性  聚类初始化  分类属性
 
The Optimization Reserch of Clustering Initialization in Data Mining
LI Xin-liang
查看全文   查看/发表评论   下载pdf阅读器