许可优化
许可优化
产品
产品
解决方案
解决方案
服务支持
服务支持
关于
关于
软件库
当前位置:服务支持 >  软件文章 >  谱聚类算法初探(无公式版,通俗理解)

谱聚类算法初探(无公式版,通俗理解)

阅读数 4
点赞 0
article_banner


文章目录

  • 1. 浅谈谱聚类 1.1 抽象理解 1.2 基本算法步骤 1.3 优缺点 2. 基于锚点的谱聚类 2.1 Large Scale Spectral Clustering with Landmark-Based Representation, AAAI 2011 2.2 Consistency of Anchor-based Spectral Clustering,arxiv 2021 3. 更多参考资料

      本文不会设计到数学公式的推导,而是从抽象层面对谱聚类进行叙述,并介绍几个改进的算法。试图给读者留有一些印象,了解谱聚类的基本概念、特性,在以后需要的时候可以进行尝试。
     


谱聚类就是基于图论的聚类方法,通过对样本数据的拉普拉斯矩阵的特征向量进行聚类,从而达到对样本数据进行聚类的目的。 https://zhuanlan.zhihu.com/p/29941760【简单理解】

1. 浅谈谱聚类

首先介绍两个基本概念:

  • 谱:Y=A*X,矩阵X乘以A等于对矩阵X做了空间线性变换,那么Y=map(X),A就是map的线性算子,它的所有特征值的全体,称为方阵的谱;
  • 方阵的谱半径: 方阵最大的特征值

1.1 抽象理解

谱聚类把待聚类的数据集中的每一个样本看做是图中一个顶点,这些顶点连接在一起,连接的这些边上有 权重 ,权重的大小表示这些样本之间的相似程度。同一类的顶点它们的相似程度很高,在图论中体现为同一类的顶点中连接它们的边的权重很大,不在同一类的顶点连接它们的边的权重很小。于是谱聚类的最终目标就是找到一种切割图的方法,使得切割之后的各个子图内的权重很大,子图之间的权重很小。
在这里插入图片描述

1.2 基本算法步骤

一种经典的谱聚类算法如下所示,首先计算给定数据集中的相似度矩阵 W W W,这里有很多种方式可以计算,比如K近邻、全连接法【可见参考资料2】,其主要目的是衡量数据点之间的相似度;根据相似度矩阵 W W W构造图拉普拉斯矩阵 L L L(这里需要利用W进一步构造度矩阵和 邻接矩阵 ,才能得到图拉普拉斯矩阵);计算图拉普拉斯矩阵的特征值,获取前k个最小特征值对应的特征向量 Z ∈ R n × k Z∈R^{n\times k} Z∈Rn×k;将 Z Z Z中每一行视为一个数据点,进行K-Mean聚类,最后聚类的结果就对应于 原始数据 的聚类结果。


免责声明:本文系网络转载或改编,未找到原创作者,版权归原作者所有。如涉及版权,请联系删

相关文章
技术文档
QR Code
微信扫一扫,欢迎咨询~
customer

online

联系我们
武汉格发信息技术有限公司
湖北省武汉市经开区科技园西路6号103孵化器
电话:155-2731-8020 座机:027-59821821
邮件:tanzw@gofarlic.com
Copyright © 2023 Gofarsoft Co.,Ltd. 保留所有权利
遇到许可问题?该如何解决!?
评估许可证实际采购量? 
不清楚软件许可证使用数据? 
收到软件厂商律师函!?  
想要少购买点许可证,节省费用? 
收到软件厂商侵权通告!?  
有正版license,但许可证不够用,需要新购? 
联系方式 board-phone 155-2731-8020
close1
预留信息,一起解决您的问题
* 姓名:
* 手机:

* 公司名称:

姓名不为空

姓名不为空

姓名不为空
手机不正确

手机不正确

手机不正确
公司不为空

公司不为空

公司不为空