什么是分类与聚类?
北京青年报客户端 2025-02-07 18:00

分类和聚类看起来非常相似,都是把数据做区分,但它们有本质区别,对应的机器学习方法也不一样。

分类就是把某个东西分到已知的类型里去,比如已知有水果、蔬菜、主食、肉类等等类别。对于一个新的食物,把它分到中间的某一类去,这个过程就是分类。分类一般对应的是监督学习,也就是会用大量已知标签类别的数据对AI进行训练,训练完成后,用它来对新的物品进行分类。

而聚类所使用的数据是未知类别的,需要根据样本数据本身的特征,把特征相似的聚到一类。

例如,还是针对食物做聚类,计算机可能会把形状大小相似的聚为一类,或者按照营养成分的相似性进行聚类。聚类一般对应的机器学习类型是非监督学习。

策划制作本文为科普中国-创作培育计划作品

出品|中国科协科普部

监制|中国科学技术出版社有限公司、北京中科星河文化传媒有限公司

作者丨北京云御纪文化传播有限公司

审核丨秦曾昌 北京航空航天大学 自动化科学与电气工程学院 副教授

来源:科普中国

编辑/韩世容

最新评论