导航:首页 > 源码编译 > 数据挖掘k中心点算法

数据挖掘k中心点算法

发布时间:2025-09-10 02:42:37

1. 简述K-means算法的基本过程及其不足。《数据挖掘》作业题追分100

过程:
1、 从 n个数据对象任意选择 k 个对象作为初始聚类中心;
2、 根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离;并根据最小距离重新对相应对象进行划分;
3、 重新计算每个(有变化)聚类的均值(中心对象)
4、循环步骤2和3,直到每个聚类不再发生变化为止

缺点:
1、聚类个数K需要自己决定,因此在不知道具体有多少类时需要从2开始多次尝试,选择最好的
2、当k确定时,聚类效果和初始中心选择有关,所以算法很不稳定
3、算法在维数较多时,由于需要多次迭代,花费时间较长

2. kmeans聚类算法是什么

K-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。

聚类属于无监督学习,以往的回归、朴素贝叶斯、SVM等都是有类别标签y的,也就是说样例中已经给出了样例的分类。而聚类的样本中却没有给定y,只有特征x,比如假设宇宙中的星星可以表示成三维空间中的点集。

(2)数据挖掘k中心点算法扩展阅读:

k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。

(1)适当选择c个类的初始中心;

(2)在第k次迭代中,对任意一个样本,求其到c个中心的距离,将该样本归到距离最短的中心所在的类;

(3)利用均值等方法更新该类的中心值;

(4)对于所有的c个聚类中心,如果利用(2)(3)的迭代法更新后,值保持不变,则迭代结束,否则继续迭代。

阅读全文

与数据挖掘k中心点算法相关的资料

热点内容
反编译后不能搜索位置 浏览:482
离心式压缩机最小转速 浏览:957
什么叫程序员加班卖命 浏览:273
共享文件夹加密码怎么加 浏览:23
一个程序员可以加班吗 浏览:134
邻近梯度算法 浏览:572
linux运维创建文件夹 浏览:896
win7下载java 浏览:280
艾叶pdf 浏览:440
压缩弹簧的安装 浏览:307
房贷还完后到银行解压要多久办完 浏览:734
程序员钱前途 浏览:521
云服务器维护用户需要做什么 浏览:741
邮箱为什么显示服务器配置错误 浏览:469
中国趣的命令 浏览:897
php中sleep函数 浏览:657
程序员那么可爱免费卡 浏览:736
javatcp多线程 浏览:45
深圳解压去哪里 浏览:700
ash源码解读 浏览:957