系统聚类算法K-means 属于聚类分析中一种基本的划分方法,常采用误差平方和准则函数作为聚类准则,该算法在处理大数据集时是相对可伸缩且高效率的,同时具有潜在的数据并行性。但是这种算法依赖于初始值的选择以及数据的输入顺序;此外,当运用误差平方和准则函数测度聚类效果时,如果各簇的形状和大小差别很大,为使误差平方和 Jc 值达到最小有可能出现将大的聚类簇分割的现象。
上传时间: 2015-03-25
上传用户:zhuoying119
定时器程序 采用89c2051 SL存放秒的个位数 SH存放秒的十位数 ML存放分的个位数 MH存放分的十位数 HL存放时的个位数 HH存放时的十位数
上传时间: 2014-01-25
上传用户:yxgi5
k-means算法(matlab编写),其中包含测试数据集,可以使用.
上传时间: 2014-01-12
上传用户:ddddddos
Parzen 窗 和 K近邻法进行概率密度估计 还带一个示波器控件.
上传时间: 2013-12-17
上传用户:13517191407
K均值算法的一个改进算法,简单实用,但是有点简单。
上传时间: 2015-03-29
上传用户:清风冷雨
K均值是一个预先知道类数的算法,需要具备专业知识,不现实。本文提出一个确定类数的方法。
上传时间: 2015-03-30
上传用户:GavinNeko
用三种方法实现在数组中选择第k个最小的元素
上传时间: 2015-03-31
上传用户:cccole0605
实现聚类K均值算法: K均值算法:给定类的个数K,将n个对象分到K个类中去,使得类内对象之间的相似性最大,而类之间的相似性最小。 缺点:产生类的大小相差不会很大,对于脏数据很敏感。 改进的算法:k—medoids 方法。这儿选取一个对象叫做mediod来代替上面的中心 的作用,这样的一个medoid就标识了这个类。步骤: 1,任意选取K个对象作为medoids(O1,O2,…Oi…Ok)。 以下是循环的: 2,将余下的对象分到各个类中去(根据与medoid最相近的原则); 3,对于每个类(Oi)中,顺序选取一个Or,计算用Or代替Oi后的消耗—E(Or)。选择E最小的那个Or来代替Oi。这样K个medoids就改变了,下面就再转到2。 4,这样循环直到K个medoids固定下来。 这种算法对于脏数据和异常数据不敏感,但计算量显然要比K均值要大,一般只适合小数据量。
上传时间: 2015-04-03
上传用户:sardinescn
Scalable k-means software and test datasets This package (a Unix tar file, gzipped) contains the source code for the software that was used to run the experiments for the article
标签: Scalable datasets contains software
上传时间: 2015-04-05
上传用户:康郎
K-均值算法的c语言实现,他是一种基于样本间相似性度量的间接聚类方法。
上传时间: 2015-04-05
上传用户:zhuimenghuadie