导航:首页 > 源码编译 > 兰德系数源码

兰德系数源码

发布时间:2022-09-28 02:08:07

⑴ 聚类的评价指标

在聚类任务中,常见的评价指标有:准确率、F值、调整兰德系数和标准互信息素。
将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

⑵ 我们一般使用哪些指标判断聚类结果的优劣

有参考标准的指标主要有:

1、Jaccard系数(Jaccard Coefficient, JC)
2、FM指数(Fowlkes and Mallows Index, FMI)
3、Rand指数(Rand Index, RI)
4、F值(F-measure)
上述性能度量的结果值均在[0,1]区间,值越大越好,值越大表明聚类结果和参考模型,直接的聚类结果越吻合,聚类结果就相对越好。
5、兰德系数(Rand index,RI)需要给定实际类别信息C,假设K是聚类结果,RI取值范围为[0,1],值越大意味着聚类结果与真实情况越吻合。
6、调整兰德系数(Adjusted rand index)对于随机结果,RI并不能保证分数接近零。所以ARI取值范围为[-1,1],值越大意味着聚类结果与真实情况越吻合。从广义的角度来讲,ARI衡量的是两个数据分布的吻合程度。

无监督的,无需基准数据集,不需要借助于外部参考模型指标有:

1、紧密度(Compactness):每个聚类簇中的样本点到聚类中心的平均距离。对应聚类结果,需要使用所有簇的紧密度的平均值来衡量聚类算法和聚类各参数选取的优劣。紧密度越小,表示簇内的样本点月集中,样本点之间聚类越短,也就是说簇内相似度越高。
2、分割度(Seperation):是个簇的簇心之间的平均距离。分割度值越大说明簇间间隔越远,分类效果越好,即簇间相似度越低。
3、戴维森堡丁指数(Davies-bouldin Index,DBI):该指标用来衡量任意两个簇的簇内距离之后与簇间距离之比。该指标越小表示簇内距离越小,簇内相似度越高,簇间距离越大,簇间相似度低。
4、邓恩指数(Dunn Validity Index,DVI):任意两个簇的样本点的最短距离与任意簇中样本点的最大距离之商。该值越大,聚类效果越好。
5、轮廓系数 (Silhouette Coefficient):对于一个样本集合,它的轮廓系数是所有样本轮廓系数的平均值。轮廓系数的取值范围是[-1,1],同类别样本距离越相近不同类别样本距离越远,分数越高。

若帮助到您,求采纳~

阅读全文

与兰德系数源码相关的资料

热点内容
政府文件加密没法转换 浏览:370
android判断栈顶 浏览:329
凭证软件源码 浏览:857
androidwebview滚动事件 浏览:7
如何将电脑上的图片压缩成文件包 浏览:899
程序员转金融IT 浏览:834
黑马程序员培训效果如何 浏览:911
本地集成编译 浏览:528
韩国电影哪个app可以看 浏览:703
玖月授权什么app什么梗 浏览:785
怎么使用服务器上的ip地址是什么情况 浏览:750
手机密码加密后怎么解密 浏览:343
华为云的服务器的ip地址怎么访问不 浏览:367
webstormvue在线实时编译生效 浏览:184
3225pdf 浏览:171
java中的常用类 浏览:395
安卓手机oppo反向色调怎么开 浏览:138
罗志祥pdf 浏览:224
美国战争pdf 浏览:243
任务栏右击如何显示常用文件夹 浏览:100