聚类算法大部分都使用距离来计算相似度,本文探讨了无需使用距离的方法。
上传时间: 2014-12-05
上传用户:FreeSky
聚类算法是基于距离的,但是大多采取单一的欧氏距离,不利于结果的发现。
标签: 聚类算法
上传时间: 2015-03-30
上传用户:caozhizhi
实现聚类K均值算法: K均值算法:给定类的个数K,将n个对象分到K个类中去,使得类内对象之间的相似性最大,而类之间的相似性最小。 缺点:产生类的大小相差不会很大,对于脏数据很敏感。 改进的算法:k—medoids 方法。这儿选取一个对象叫做mediod来代替上面的中心 的作用,这样的一个medoid就标识了这个类。步骤: 1,任意选取K个对象作为medoids(O1,O2,…Oi…Ok)。 以下是循环的: 2,将余下的对象分到各个类中去(根据与medoid最相近的原则); 3,对于每个类(Oi)中,顺序选取一个Or,计算用Or代替Oi后的消耗—E(Or)。选择E最小的那个Or来代替Oi。这样K个medoids就改变了,下面就再转到2。 4,这样循环直到K个medoids固定下来。 这种算法对于脏数据和异常数据不敏感,但计算量显然要比K均值要大,一般只适合小数据量。
上传时间: 2015-04-03
上传用户:sardinescn
变色龙层次聚类算法,利用动态模型的层次聚类算法
上传时间: 2015-04-03
上传用户:gtf1207
层次聚类算法中的cure算法,它利用代表点来达到聚类目的
上传时间: 2015-04-03
上传用户:jjj0202
图像模式识别的聚类器设计,采用VC++实现,和分类器设计相对应。
上传时间: 2014-12-02
上传用户:han_zh
gmeans-- Clustering with first variation and splitting 文本聚类算法Gmeans ,使用了3种相似度函数,cosine,euclidean ,KL.文本数据使用的是稀疏矩阵形式.
标签: Clustering euclidean variation splitting
上传时间: 2014-01-05
上传用户:cainaifa
k均值聚类的算法,这是通用程序!欢迎借鉴使用
上传时间: 2015-04-12
上传用户:diets
一个改进的聚类算法FCMA,可以实现数据的自适应有效聚类,对2维数据测试效果较好
上传时间: 2014-09-10
上传用户:jjj0202
数据挖掘中的聚类算法程序演示参考 dbscan for C#
上传时间: 2015-04-13
上传用户:dongbaobao