午夜三级A三级三点窝,成人网站免费av,国产一卡二卡四卡无卡免费

人工智能之K-Means算法

2018-06-17 06:30

前言：人工智能機(jī)器學(xué)習(xí)有關(guān)算法內(nèi)容，人工智能之機(jī)器學(xué)習(xí)主要有三大類：1）分類；2）回歸；3）聚類。今天我們重點(diǎn)探討一下K－Means算法。

K－Means是十大經(jīng)典數(shù)據(jù)挖掘算法之一。K－Means和KNN（K鄰近）看上去都是K打頭，但卻是不同種類的算法。kNN是監(jiān)督學(xué)習(xí)中的分類算法，而K－Means則是非監(jiān)督學(xué)習(xí)中的聚類算法；二者相同之處是均利用近鄰信息來(lái)標(biāo)注類別。

提到“聚類”一詞，使人不禁想到：“物以類聚，人以群分”。聚類是數(shù)據(jù)挖掘中一種非常重要的學(xué)習(xí)流派，指將未標(biāo)注的樣本數(shù)據(jù)中相似的分為同一類。

K－means算法是很典型的基于距離的聚類算法。于1982年由Lloyod提出。它是簡(jiǎn)單而又有效的統(tǒng)計(jì)聚類算法。一般采用距離作為相似性的評(píng)價(jià)指標(biāo)，即認(rèn)為兩個(gè)對(duì)象的距離越近，其相似度就越大。該算法認(rèn)為簇是由距離靠近的對(duì)象組成的，因此把得到緊湊且獨(dú)立的簇作為最終目標(biāo)。

K－Means概念：

K－means算法是硬聚類算法，是典型的基于原型的目標(biāo)函數(shù)聚類方法的代表，它是數(shù)據(jù)點(diǎn)到原型的某種距離作為優(yōu)化的目標(biāo)函數(shù)，利用函數(shù)求極值的方法得到迭代運(yùn)算的調(diào)整規(guī)則。K－means算法以歐式距離作為相似度測(cè)度，它是求對(duì)應(yīng)某一初始聚類中心向量V最優(yōu)分類，使得評(píng)價(jià)指標(biāo)J最小。算法采用誤差平方和準(zhǔn)則函數(shù)作為聚類準(zhǔn)則函數(shù)。

K－Means核心思想：

由用戶指定k個(gè)初始質(zhì)心（initial centroids），作為聚類的類別（cluster），重復(fù)迭代直至算法收斂。即以空間中k個(gè)點(diǎn)為中心進(jìn)行聚類，對(duì)最靠近他們的對(duì)象歸類。通過(guò)迭代的方法，逐次更新各聚類中心的值，直至得到最好的聚類結(jié)果。

k個(gè)初始類聚類中心點(diǎn)的選取對(duì)聚類結(jié)果具有較大的。