【#文档大全网# 导语】以下是®文档大全网的小编为您整理的《第二章(K均值算法)》,欢迎阅读!
算法:
第一步:选K个初始聚类中心,z1(1),z2(1),…,zK(1),其中括
号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定,例如可选开始的K个模式样本的向量值作为初始聚类中心。
第二步:逐个将需分类的模式样本{x}按最小距离准则分配给K
个聚类中心中的某一个zj(1)。
xzi(k),i1,2,K},则假设i=j时,Dj(k)min{
xSj(k),其中k为迭代运算的次序号,第一次迭代
k=1,Sj表示第j个聚类,其聚类中心为zj。
第三步:计算各个聚类中心的新的向量值,zj(k+1),j=1,2,…,K
求各聚类域中所包含样本的均值向量:
zj(k1)
1
Nj
xSj(k)
x,
j1,2,,K
其中Nj为第j个聚类域Sj中所包含的样本个数。以均值向量作为新的聚类中心,可使如下聚类准则函数最小:
Jj
xSj(k)
xzj(k1),
2
j1,2,,K
在这一步中要分别计算K个聚类中的样本均值向量,所以称之为K-均值算法。
第四步:若zj(k1)zj(k),j=1,2,…,K,则返回第二步,将模式
样本逐个重新分类,重复迭代运算;
若zj(k1)zj(k),j=1,2,…,K,则算法收敛,计算结束。
本文来源:https://www.wddqxz.cn/999b17c6a1c7aa00b52acbeb.html