预览加载中,请您耐心等待几秒...
1/3
2/3
3/3

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第13卷第1期重庆科技学院学报(自然科学版)2011年2月改进的初始中心与隶属度函数的模糊C-均值算法万龙(重庆大学,重庆400030)摘要:针对模糊C-均值(FCM)算法对初始中心敏感的缺点,通过选取离均值最远的点作为初始聚类中心的方法,提出了一种基于均值距离的初始中心选取算法,同时由于远离各类聚类中心的野值样本会影响迭代结果,通过改变隶属度函数来克服这种缺陷。然后选取有代表性的样本作为实验数据集进行实验,通过实验得出,与传统的FCM算法比较,改进的FCM算法可以得到更高的准确率,实验证明了改进算法的有效性和优越性。关键词:模糊C-均值;初始中心;隶属度函数;聚类中心中图分类号:O159文献标识码:A文章编号:1673-1980(2011)01-0178-03聚类分析作为一种非监督学习方法,是机器学局部最优以及对初始值敏感的问题。习领域中的一个重要的研究方向。在聚类分析中,本文针对FCM算法对初始聚类中心的敏感性问模糊C-均值(FCM)聚类算法是最重要的模糊聚类算题,通过选取离均值最远的点作为初始聚类中心的方法,法之一,被广泛应用于特征分析、模式识别、图像处提出了一种基于均值距离的初始中心点选取算法,同时理、分类器设计和聚类等等[1]。改进了隶属度函数,进一步提高了聚类效果。实验表明,FCM算法就是反复修改聚类中心和隶属度矩阵算法的稳定性较好,并且算法的准确率得到了提高。的过程,因此也称为动态聚类。FCM算法从任意初始传统模糊均值算法点开始,沿着一个迭代子序列收敛到目标函数的局1C-部极小点但该算法存在着一些不足[2]。:数据集{x,i=1,2,…,n}是n个样本组成的样本算法的性能依赖于初始聚类中心和初始隶i(1)集合为预定的类别数目为每个,c,mi(i=1,2,…,c)属度函数的选取。聚类的中心,u(x)是第i个样本对于第j类的隶属度函(2)事先必须确定聚类的个数。ji数的目标函数可以写为(3)模糊指标的选择。。FCM:cn(4)收敛到局部极值问题。b2Jf=∑∑[uj(xi)]||xi-mj||(1)针对这些问题,很多学者进行了研究。文献采j=1i=1用贪心算法选取有代表性的点作为初始中心,提出其中,b>1是一个可以控制聚类结果的模糊程一种基于权重的初始中心点选取算法,得出了优化度的常数。聚类初始中心的模糊C-均值方法;文献[3]采用一种模糊C-均值算法要求一个样本对于各个聚类改进的最大最小距离算法对原始空间中的数据进行的隶属度之和为1,即:粗分类,将粗分类结果中每类类心作为初始聚类中c∑uj(xi)=1,i=1,2,…,n(2)心,再运用核C-均值聚类算法进行分类;文献[4]针对j=1隶属度归一化可能引起结果偏差的问题,通过改进在条件式下求式的极小值令对和(2)(1),Jfmiuj隶属度函数为每个样本点赋予一个定量的权值来,,(x)得偏导数为0,可得必要条件:构造加权的目标函数文献通过加入点密度加权i;[5]n系数和特征矢量权重,提出一种具有两阶段的模糊b∑[uj(xi)]xiFCM聚类改进算法;文献[6]提出了一种将自适应策i=1mj=,(3)n略与传统模糊C-均值聚类算法相结合的方法,这种b∑[uj(xi)]方法在不影响收敛速度的情况下,能够很好地解决i=1收稿日期:2010-05-21作者简介:万龙,男,江西南昌人,重庆大学通信工程学院在读硕士研究生,研究方向为信号与信息处理。··178万龙:改进的初始中心与隶属度函数的模糊C-均值算法21/(b-1)件,使得在样本集不理想的情况下可能导致结果不(1/||xi-mj||)uj(xi)=c好。比如某个野值样本远离各类的聚类中心,本来它21/(b-1)∑(1/xi-mk)严格属于各类的隶属度都很小,但由于式(2)的条件k=1的要求,将会使它对各类都有较大的隶属度,这种野i=1,2,…,n;j=1,2,…,c(4)值的存在将影响迭代的结果为了克服这种缺陷可FCM算法的基本思路是用迭代方法求得公式。,以放松归一化条件,改变隶属度函数,即:(3)和(4),算法步骤如下:2设定聚类数目和参数1/(b-1)①cb。n(1/||xi-mj||)uj(xi)=初始化各个聚类中心c②mi。21/(b-1)∑(1/||xi-mk||)③重复下面的运算,直到各个样本的隶属度值稳定:k=1用当前的聚类中心根据式(4)计算隶属度函数;用i=1,2,…,n;j=1,2,…,c(5)当前的隶属度函数按式(3)更新计算各类聚类中心。2.3改进的模糊C-均值算法当算法终止时,就得到了每个类的聚类中心以改进的模糊C-均值算法