基于模糊理论的聚类分析方法及应用研究
2006级 王成波
指导教师:秦昆
摘 要
模糊理论是研究不确定性的一门重要理论,基于模糊理论的聚类算法考虑了聚类过程中的不确定性,具有十分重要的研究意义。基于目标函数的模糊聚类算法是模糊聚类领域的研究热点,常用算法包括:模糊C均值(FCM)算法、区间二型模糊C均值(IT-2FCM)算法、可能性C均值(PCM)算法等。
FCM聚类方法的约束条件是一种概率约束,样本点对于所有类的隶属度之和为1,导致FCM算法所计算出的隶属度不能很好地符合聚类的典型性概念。FCM聚类方法对噪声也赋予了较大的隶属度,受噪声影响较大,这样可能会造成错误的聚类结果。PCM聚类是一种在可能性理论框架下的聚类方法,不具有概率约束,该方法所计算出的隶属度解释为样本点属于各个类的可能性,反映的是一种典型性。因此,PCM聚类方法使得聚类中心受噪声及野值的干扰较小,在噪声环境下具有较好的聚类结果。但是PCM算法需要良好的初始聚类中心、合适的模糊化因子m和类簇尺度,并且收敛速度较慢。
本文通过对二型模糊集合与云模型的研究,利用云模型和二型模糊集合处理不确定性的优势,针对模糊化因子m和类簇尺度的不确定性而引起的PCM聚类结果的不确定性,分别研究了基于云模型的可能性聚类方法CPCM(CPCM,Cloud-based Possibility C-means)和基于区间二型模糊集合的可能性聚类方法IT-2PCM(IT-2PCM,Interval Type-2 Possibility C-means)。通过对人工构造的点状数据集以及UCI机器学习标准数据集中的IRIS数据进行聚类分析实验,验证了CPCM算法和IT-2PCM算法的有效性。在此基础上,分别研究了基于CPCM聚类的图像分割方法和基于IT-2PCM聚类的图像分割方法。
关键词:模糊聚类分析;二型模糊集合;可能性理论;云模型;CPCM;IT-2PCM