更新時(shí)間:2021年04月28日11時(shí)27分 來(lái)源:傳智教育 瀏覽次數(shù):
根據(jù)你的“鄰居”來(lái)推斷出你的類(lèi)別
K Nearest Neighbor算法又叫KNN算法,這個(gè)算法是機(jī)器學(xué)習(xí)里面一個(gè)比較經(jīng)典的算法, 總體來(lái)說(shuō)KNN算法是相對(duì)比較容易理解的算法
定義
如果一個(gè)樣本在特征空間中的k個(gè)最相似(即特征空間中最鄰近)的樣本中的大多數(shù)屬于某一個(gè)類(lèi)別,則該樣本也屬于這個(gè)類(lèi)別。
來(lái)源:KNN算法最早是由Cover和Hart提出的一種分類(lèi)算法
距離公式
兩個(gè)樣本的距離可以通過(guò)如下公式計(jì)算,又叫歐式距離 ,關(guān)于距離公式會(huì)在后面進(jìn)行討論
假設(shè)我們現(xiàn)在有幾部電影
其中? 號(hào)電影不知道類(lèi)別,如何去預(yù)測(cè)?我們可以利用K近鄰算法的思想
分別計(jì)算每個(gè)電影和被預(yù)測(cè)電影的距離,然后求解
1)計(jì)算已知類(lèi)別數(shù)據(jù)集中的點(diǎn)與當(dāng)前點(diǎn)之間的距離
2)按距離遞增次序排序
3)選取與當(dāng)前點(diǎn)距離最小的k個(gè)點(diǎn)
4)統(tǒng)計(jì)前k個(gè)點(diǎn)所在的類(lèi)別出現(xiàn)的頻率
5)返回前k個(gè)點(diǎn)出現(xiàn)頻率最高的類(lèi)別作為當(dāng)前點(diǎn)的預(yù)測(cè)分類(lèi)
猜你喜歡:
BERT的MLM任務(wù)中為什么采用了80%, 10%, 10%的策略?
2020-09-21若學(xué)員已經(jīng)報(bào)了人工智能課程,同時(shí)也喜歡爬蟲(chóng)、Python Web開(kāi)發(fā)如何辦?
2020-09-16傳智播客人工智能課程如何保障學(xué)員的消化吸收?
2020-09-16數(shù)學(xué)基礎(chǔ)不好能報(bào)人工智能嗎?
2020-09-16報(bào)人工智能AI進(jìn)階班需要什么條件,編程零基礎(chǔ)能報(bào)嗎?
2020-09-16傳智播客人工智能的課程內(nèi)容和授課模式?
2020-09-16北京校區(qū)