模糊C均值聚类算法:基于RFM数据的MATLAB实现

RFM数据是指最近一次消费,消费频率以及消费金额,分别构成R,F,M,给定200行用户行为数据,我们用模糊C均值聚类进行分析

首先简单介绍一下模糊C均值聚类,每一个样本距各个聚类中心(初始聚类中心需要随机指定)都有一个隶属度,每一个样本至各个聚类的隶属度总和为1。

通过每次随机分配,取均值等方法,在层层迭代过程中,寻找聚类中心,使得每个样本到每个聚类中心的距离值最小化,所计算的聚类结果就是我们的目标。

目标方程值最小化

MBA智库对于RFM有着详细的解释,link:https://wiki.mbalib.com/zh-tw/RFM%E6%A8%A1%E5%9E%8B

模糊C均值聚类的详细说明可以参见:https://wiki.mbalib.com/zh-tw/RFM%E6%A8%A1%E5%9E%8B

下面给出RFM数据

接下来我们用欧式距离定义的方法,计算用户特征向量与聚类中心的距离值:

两个向量相减,求平方,再求和,最后开方

接下来就是数据预处理,因为R,F,M分别代表的含义不同,单位也不同,因此要实现数据的无量纲化,我们采用归一化处理。即数据减去最小值,再除以最大值与最小值的差值

最后,我们设定以下参数:

即聚类数目,迭代次数,模糊系数(要求大于1),以及精度。

最后看一下各个用户(即样本数据)对于各个类别的归属度,可以直观反应用户u对N个类别的隶属度

我们用表格查看:

可见,用户1隶属于6类,用户2隶属于类别4等等。

相关推荐
技术文档
软件下载
QR Code
微信扫一扫,欢迎咨询~

联系我们
武汉格发信息技术有限公司
湖北省武汉市经开区科技园西路6号103孵化器
电话:155-2731-8020 座机:027-59821821
邮件:tanzw@gofarlic.com
Copyright © 2023 Gofarsoft Co.,Ltd. 保留所有权利
遇到许可问题?该如何解决!?
评估许可证实际采购量? 
不清楚软件许可证使用数据? 
收到软件厂商律师函!?  
想要少购买点许可证,节省费用? 
收到软件厂商侵权通告!?  
有正版license,但许可证不够用,需要新购? 
联系方式 155-2731-8020
预留信息,一起解决您的问题
* 姓名:
* 手机:

* 公司名称:

姓名不为空

手机不正确

公司不为空