导航:首页 > 源码编译 > 质心算法原理

质心算法原理

发布时间:2025-08-28 14:22:24

A. java代码怎么实现计算图像二值连通区域的质心

一:几何距(Geometric Moments)知识与质心寻找原理

1. Image Moments是图像处理中非常有用的算法,可以用来计算区域图像的质心,方向等几何特性,同时Mpq的高阶具有旋转不变性,可以用来实现图像比较分类,正是因为Moments有这些特性,很多手绘油画效果也会基于该算法来模拟实现。它的数学表达为:

它的低阶M00,M01, M10可以用来计算质心,中心化以后M11,M02,M20可以用来计算区域的方向/角度

2. 什么是质心

就是通过该点,区域达到一种质量上的平衡状态,可能物理学上讲的比较多,简单点的说就是规则几何物体的中心,不规则的可以通过挂绳子的方法来寻找。

二:算法流程

1. 输入图像转换为二值图像

2. 通过连通组件标记算法找到所有的连通区域,并分别标记

3. 对每个连通区域运用计算几何距算法得到质心

4. 用不同颜色绘制连通区域与质心,输出处理后图像

三:算法效果

左边为原图, 右边蓝色为连通组件标记算法处理以后结果,白色点为质心

四:关键代码解析

1. 计算几何距算法代码

doublem00 = moments(pixels, width, height, 0, 0);

doublexCr = moments(pixels, width, height, 1, 0) / m00;// row

doubleyCr = moments(pixels, width, height, 0, 1) / m00;// column

return new double[]{xCr, yCr};

B. K-Means聚类算法

        所谓聚类算法是指将一堆没有标签的数据自动划分成几类的方法,属于无监督学习方法,这个方法要保证同一类的数据有相似的特征,如下图所示:

        根据样本之间的距离或者说是相似性(亲疏性),把越相似、差异越小的样本聚成一类(簇),最后形成多个簇,使同一个簇内部的样本相似度高,不同簇之间差异性高。

相关概念:

K值 :要得到的簇的个数

质心 :每个簇的均值向量,即向量各维取平均即可

距离量度 :常用欧几里得距离和余弦相似度(先标准化)

算法流程:

1、首先确定一个k值,即我们希望将数据集经过聚类得到k个集合。

2、从数据集中随机选择k个数据点作为质心。

3、对数据集中每一个点,计算其与每一个质心的距离(如欧式距离),离哪个质心近,就划分到那个质心所属的集合。

4、把所有数据归好集合后,一共有k个集合。然后重新计算每个集合的质心。

5、如果新计算出来的质心和原来的质心之间的距离小于某一个设置的阈值(表示重新计算的质心的位置变化不大,趋于稳定,或者说收敛),我们可以认为聚类已经达到期望的结果,算法终止。

6、如果新质心和原质心距离变化很大,需要迭代3~5步骤。

K-Means采用的启发式方式很简单,用下面一组图就可以形象的描述:

        上图a表达了初始的数据集,假设k=2。在图b中,我们随机选择了两个k类所对应的类别质心,即图中的红色质心和蓝色质心,然后分别求样本中所有点到这两个质心的距离,并标记每个样本的类别为和该样本距离最小的质心的类别,如图c所示,经过计算样本和红色质心和蓝色质心的距离,我们得到了所有样本点的第一轮迭代后的类别。此时我们对我们当前标记为红色和蓝色的点分别求其新的质心,如图d所示,新的红色质心和蓝色质心的位置已经发生了变动。图e和图f重复了我们在图c和图d的过程,即将所有点的类别标记为距离最近的质心的类别并求新的质心。最终我们得到的两个类别如图f。

坐标系中有六个点:

1、我们分两组,令K等于2,我们随机选择两个点:P1和P2

2、通过勾股定理计算剩余点分别到这两个点的距离:

3、第一次分组后结果:

        组A:P1

        组B:P2、P3、P4、P5、P6

4、分别计算A组和B组的质心:

        A组质心还是P1=(0,0)

        B组新的质心坐标为:P哥=((1+3+8+9+10)/5,(2+1+8+10+7)/5)=(6.2,5.6)

5、再次计算每个点到质心的距离:

6、第二次分组结果:

        组A:P1、P2、P3

        组B:P4、P5、P6

7、再次计算质心:

        P哥1=(1.33,1) 

        P哥2=(9,8.33)

8、再次计算每个点到质心的距离:

9、第三次分组结果:

        组A:P1、P2、P3

        组B:P4、P5、P6

可以发现,第三次分组结果和第二次分组结果一致,说明已经收敛,聚类结束。

优点:

1、原理比较简单,实现也是很容易,收敛速度快。

2、当结果簇是密集的,而簇与簇之间区别明显时, 它的效果较好。

3、主要需要调参的参数仅仅是簇数k。

缺点:

1、K值需要预先给定,很多情况下K值的估计是非常困难的。

2、K-Means算法对初始选取的质心点是敏感的,不同的随机种子点得到的聚类结果完全不同 ,对结果影响很大。

3、对噪音和异常点比较的敏感。用来检测异常值。

4、采用迭代方法, 可能只能得到局部的最优解,而无法得到全局的最优解 。

1、K值怎么定?

        答:分几类主要取决于个人的经验与感觉,通常的做法是多尝试几个K值,看分成几类的结果更好解释,更符合分析目的等。或者可以把各种K值算出的 E 做比较,取最小的 E 的K值。

2、初始的K个质心怎么选?

        答:最常用的方法是随机选,初始质心的选取对最终聚类结果有影响,因此算法一定要多执行几次,哪个结果更reasonable,就用哪个结果。 当然也有一些优化的方法,第一种是选择彼此距离最远的点,具体来说就是先选第一个点,然后选离第一个点最远的当第二个点,然后选第三个点,第三个点到第一、第二两点的距离之和最小,以此类推。第二种是先根据其他聚类算法(如层次聚类)得到聚类结果,从结果中每个分类选一个点。

3、关于离群值?

        答:离群值就是远离整体的,非常异常、非常特殊的数据点,在聚类之前应该将这些“极大”“极小”之类的离群数据都去掉,否则会对于聚类的结果有影响。但是,离群值往往自身就很有分析的价值,可以把离群值单独作为一类来分析。

4、单位要一致!

        答:比如X的单位是米,Y也是米,那么距离算出来的单位还是米,是有意义的。但是如果X是米,Y是吨,用距离公式计算就会出现“米的平方”加上“吨的平方”再开平方,最后算出的东西没有数学意义,这就有问题了。

5、标准化

        答:如果数据中X整体都比较小,比如都是1到10之间的数,Y很大,比如都是1000以上的数,那么,在计算距离的时候Y起到的作用就比X大很多,X对于距离的影响几乎可以忽略,这也有问题。因此,如果K-Means聚类中选择欧几里德距离计算距离,数据集又出现了上面所述的情况,就一定要进行数据的标准化(normalization),即将数据按比例缩放,使之落入一个小的特定区间。

参考文章: 聚类、K-Means、例子、细节

C. 目前行业内有哪些比较高精度的室内定位算法和实现

目前室内定位常用的较高精度的定位方法,从原理上主要分为七种:邻近探测法、质心定位法、多边定位法、三角定位法、极点法、指纹定位法和航位推算法。
一、邻近探测法
通过一些有范围限制的物理信号的接收,从而判断移动设备是否出现在某一个发射点附近。该方法虽然只能提供大概的定位信息,但其布设成本低、易于搭建,适合于一些对定位精度要求不高的应用,例如自动识别系统用于公司的员工签到。
二、质心定位法
根据移动设备可接收信号范围内所有已知的信标(beacon)位置,计算其质心坐标作为移动设备的坐标。该方法易于理解,计算量小,定位精度取决于信标的布设密度。
三、多边定位法
通过测量待测目标到已知参考点之间的距离,从而确定待测目标的位置。精度高、应用广。
四、三角定位法
基于无线信号的三角测量定位算法是室内定位算法中非常常见的一种,三角测量定位算法类似GPS卫星定位。实际定位过程中使用的是RSSI信号值衰减模型。原理是在无线信号强度在空间中传播随着距离衰减,而无线信号强度(RSSI值)对于定位标签上的接收器来说是可测的,那么依据测试到的信号强度,再根据信号衰减模型就可以反推出距离了。获取待测目标相对2个已知参考点的角度后结合两参考点间的距离信息可以确定唯一的三角形,即可确定待测目标的位置。基于三角测量定位算法的定位方案是被动式蓝牙定位方案和主被动一体式蓝牙定位方案。
五、极点法
通过测量相对某一已知参考点的距离和角度从而确定待测点的位置。该方法仅需已知一个参考点的位置坐标,因此使用非常方便,已经在大地测量中得到广泛应用。
六、指纹定位法
在定位空间中建立指纹数据库,通过将实际信息与数据库中的参数进行对比来实现定位。指纹定位的优势是几乎不需要参考测量点,定位精度相对较高;但缺点是前期离线建立指纹库的工作量巨大,同时很难自适应于环境变化较大的场景。
七、航位推算法
是在已知上一位置的基础上,通过计算或已知的运动速度和时间计算得到当前的位置。数据稳定,无依赖,但该方法存在累积误差,定位精度随着时间增加而恶化。

阅读全文

与质心算法原理相关的资料

热点内容
海康萤石云app怎么回放 浏览:402
写一个编译器怎么写 浏览:283
单片机蜂鸣器发声原理 浏览:137
程序员那么可爱陆离跳水是哪集 浏览:15
如何制作cdn服务器 浏览:109
写java加密程序 浏览:657
菜鸟数据分析pdf 浏览:287
单片机做实用东西 浏览:647
我的世界最强斗罗服务器怎么觉醒武魂 浏览:925
密友圈app怎么切换用户登录 浏览:214
我把程序员当爱豆追 浏览:972
android判断电话接通 浏览:645
大孔文件夹 浏览:783
反诈骗app在哪里下载 浏览:526
军工程序员面试视频 浏览:812
质心算法原理 浏览:423
163smtpphp 浏览:669
java缓存使用 浏览:919
java验证码识别ocr 浏览:878
马云生产服务器 浏览:215