聚类
# 无监督学习
不给定带标记的训练示例,自动对输入的数据进行分类或分群。
优点:
算法不受监督信息(偏见)的约束,可能考虑到新的信息
不需要标签数据,极大程度扩大数据样本
主要应用:聚类分析、关联规则、维度缩减
# 聚类分析
又称为群分析,
根据对象的某些属性的相似度,将其自动划分为不同的类别。
(分类问题)
# K-means
K 均值聚类算法:以空间中 k 个点为中心进行聚类,最靠近它们的对象归为一类。
核心步骤:
设 kkk 个点为 x1,x2,…,xkx_1,x_2,\dots,x_kx1,x2,…,xk,mmm 个区域簇为 u1,u2,…,umu_1,u_2,\dots,u
more...