导航:首页 > 源码编译 > 兰德系数源码

兰德系数源码

发布时间:2022-09-28 02:08:07

⑴ 聚类的评价指标

在聚类任务中,常见的评价指标有:准确率、F值、调整兰德系数和标准互信息素。
将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

⑵ 我们一般使用哪些指标判断聚类结果的优劣

有参考标准的指标主要有:

1、Jaccard系数(Jaccard Coefficient, JC)
2、FM指数(Fowlkes and Mallows Index, FMI)
3、Rand指数(Rand Index, RI)
4、F值(F-measure)
上述性能度量的结果值均在[0,1]区间,值越大越好,值越大表明聚类结果和参考模型,直接的聚类结果越吻合,聚类结果就相对越好。
5、兰德系数(Rand index,RI)需要给定实际类别信息C,假设K是聚类结果,RI取值范围为[0,1],值越大意味着聚类结果与真实情况越吻合。
6、调整兰德系数(Adjusted rand index)对于随机结果,RI并不能保证分数接近零。所以ARI取值范围为[-1,1],值越大意味着聚类结果与真实情况越吻合。从广义的角度来讲,ARI衡量的是两个数据分布的吻合程度。

无监督的,无需基准数据集,不需要借助于外部参考模型指标有:

1、紧密度(Compactness):每个聚类簇中的样本点到聚类中心的平均距离。对应聚类结果,需要使用所有簇的紧密度的平均值来衡量聚类算法和聚类各参数选取的优劣。紧密度越小,表示簇内的样本点月集中,样本点之间聚类越短,也就是说簇内相似度越高。
2、分割度(Seperation):是个簇的簇心之间的平均距离。分割度值越大说明簇间间隔越远,分类效果越好,即簇间相似度越低。
3、戴维森堡丁指数(Davies-bouldin Index,DBI):该指标用来衡量任意两个簇的簇内距离之后与簇间距离之比。该指标越小表示簇内距离越小,簇内相似度越高,簇间距离越大,簇间相似度低。
4、邓恩指数(Dunn Validity Index,DVI):任意两个簇的样本点的最短距离与任意簇中样本点的最大距离之商。该值越大,聚类效果越好。
5、轮廓系数 (Silhouette Coefficient):对于一个样本集合,它的轮廓系数是所有样本轮廓系数的平均值。轮廓系数的取值范围是[-1,1],同类别样本距离越相近不同类别样本距离越远,分数越高。

若帮助到您,求采纳~

阅读全文

与兰德系数源码相关的资料

热点内容
php截取最后一位 浏览:376
安卓源码单独编译内核 浏览:445
易语言在线编译 浏览:111
unityandroid游戏开发教程 浏览:93
android去掉虚拟按键 浏览:872
内地激情戏多的电影 浏览:42
更新最快的电视剧电影网 浏览:263
剑三宏设置命令 浏览:245
3C语言编译器 浏览:170
我的世界基岩版怎么加入tis服务器 浏览:390
php论坛模板 浏览:908
找个免费看电影的网站 浏览:372
程序员怎么接手别人遗留的代码 浏览:752
瞬变pdf 浏览:307
php开发仓库管理系统 浏览:688
12米小孩自己看电影 浏览:676
丧尸电影全部 浏览:660
go编译器选择 浏览:448
天正门窗总表命令 浏览:257
pdf阅读器编辑 浏览:514