機(jī)器學(xué)習(xí)中常用的十類算法
AI技術(shù)發(fā)展的三大支柱:“算法+大數(shù)據(jù)+計(jì)算能力”,算法是人工智能發(fā)展的核心關(guān)鍵之一,很多技術(shù)環(huán)節(jié)和系統(tǒng)功能的實(shí)現(xiàn)都依賴于算法的精準(zhǔn)度,算法的優(yōu)劣直接影響了人工智能的發(fā)展方向。那么我們當(dāng)下感受到的人工智能生活服務(wù),運(yùn)用了哪些AI算法呢?跟隨OFweek編輯一起來看看吧。
1.人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)(ANN)以大腦處理機(jī)制作為基礎(chǔ),開發(fā)用于建立復(fù)雜模式和預(yù)測(cè)問題的算法。該類型算法在語音、語義、視覺、各類游戲等任務(wù)中表現(xiàn)極好,但需要大量數(shù)據(jù)進(jìn)行訓(xùn)練,且訓(xùn)練要求很高的硬件配置。
ANN在圖像和字符識(shí)別中起著重要的作用,手寫字符識(shí)別在欺詐檢測(cè)甚至國(guó)家安全評(píng)估中有很多應(yīng)用。ANN 的研究為深層神經(jīng)網(wǎng)絡(luò)鋪平了道路,是「深度學(xué)習(xí)」的基礎(chǔ),現(xiàn)已在計(jì)算機(jī)視覺、語音識(shí)別、自然語言處理等方向開創(chuàng)了一系列令人激動(dòng)的創(chuàng)新。
2.決策樹
在機(jī)器學(xué)習(xí)中,決策樹是一個(gè)預(yù)測(cè)模型,他代表的是對(duì)象屬性與對(duì)象值之間的一種映射關(guān)系。其采用一種樹形結(jié)構(gòu),其中每個(gè)內(nèi)部節(jié)點(diǎn)表示一個(gè)屬性上的測(cè)試,每個(gè)分支代表一個(gè)測(cè)試輸出,每個(gè)葉節(jié)點(diǎn)代表一種類別。
決策樹算法屬于非參數(shù)型,較為容易解釋,但其趨向過擬合;可能陷入局部最小值中;無法在線學(xué)習(xí)。決策樹的生成主要分為兩步:1.節(jié)點(diǎn)的分裂:當(dāng)一個(gè)節(jié)點(diǎn)所代表的屬性無法給出判斷時(shí),則選擇將該節(jié)點(diǎn)分成2個(gè)子節(jié)點(diǎn) 2. 閾值的確定:選擇適當(dāng)?shù)拈撝凳沟梅诸愬e(cuò)誤率最小。
3.集成算法
簡(jiǎn)單算法一般復(fù)雜度低、速度快、易展示結(jié)果,其中的模型可以單獨(dú)進(jìn)行訓(xùn)練,并且它們的預(yù)測(cè)能以某種方式結(jié)合起來去做出一個(gè)總體預(yù)測(cè)。每種算法好像一種專家,集成就是把簡(jiǎn)單的算法組織起來,即多個(gè)專家共同決定結(jié)果。
集成算法比使用單個(gè)模型預(yù)測(cè)出來的結(jié)果要精確的多,但需要進(jìn)行大量的維護(hù)工作。
AdaBoost的實(shí)現(xiàn)是一個(gè)漸進(jìn)的過程,從一個(gè)最基礎(chǔ)的分類器開始,每次尋找一個(gè)最能解決當(dāng)前錯(cuò)誤樣本的分類器。好處是自帶了特征選擇,只使用在訓(xùn)練集中發(fā)現(xiàn)有效的特征,這樣就降低了分類時(shí)需要計(jì)算的特征數(shù)量,也在一定程度上解決了高維數(shù)據(jù)難以理解的問題。
4.回歸算法
回歸分析是在一系列的已知自變量與因變量之間的相關(guān)關(guān)系的基礎(chǔ)上,建立變量之間的回歸方程,把回歸方程作為算法模型,通過其來實(shí)現(xiàn)對(duì)新自變量得出因變量的關(guān)系。因此回歸分析是實(shí)用的預(yù)測(cè)模型或分類模型。
5.貝葉斯算法
樸素貝葉斯分類是一種十分簡(jiǎn)單的分類算法:對(duì)于給出的待分類項(xiàng),求解在此項(xiàng)出現(xiàn)的條件下各個(gè)類別出現(xiàn)的概率,哪個(gè)最大,就認(rèn)為此待分類項(xiàng)屬于哪個(gè)類別。
樸素貝葉斯分類分為三個(gè)階段,1.根據(jù)具體情況確定特征屬性,并對(duì)每個(gè)特征屬性進(jìn)行適當(dāng)劃分,形成訓(xùn)練樣本集合2.計(jì)算每個(gè)類別在訓(xùn)練樣本中的出現(xiàn)頻率及每個(gè)特征屬性劃分對(duì)每個(gè)類別的條件概率估計(jì)3.使用分類器對(duì)待分類項(xiàng)進(jìn)行分類。
6.K近鄰
K緊鄰算法的核心是未標(biāo)記樣本的類別,計(jì)算待標(biāo)記樣本和數(shù)據(jù)集中每個(gè)樣本的距離,取距離最近的k個(gè)樣本。待標(biāo)記的樣本所屬類別就由這k個(gè)距離最近的樣本投票產(chǎn)生,給定其測(cè)試樣本,基于某種距離度量找出訓(xùn)練集中與其最靠近的k個(gè)訓(xùn)練樣本,然后基于這k個(gè)“鄰居”的信息來進(jìn)行預(yù)測(cè)。
K緊鄰算法準(zhǔn)確性高,對(duì)異常值和噪聲有較高的容忍度,但計(jì)算量較大,對(duì)內(nèi)存的需求也較大。該算法主要應(yīng)用于文本分類、模式識(shí)別、圖像及空間分類。
7.聚類算法
聚類算法是機(jī)器學(xué)習(xí)中涉及對(duì)數(shù)據(jù)進(jìn)行分組的一種算法。在給定的數(shù)據(jù)集中,我們可以通過聚類算法將其分成一些不同的組。應(yīng)用中科利用聚類分析,通過將數(shù)據(jù)分組可以比較清晰的獲取到數(shù)據(jù)信息。該算法讓數(shù)據(jù)變得有意義,但存在結(jié)果難以解讀,針對(duì)不尋常的數(shù)據(jù)組,結(jié)果可能無用。
在商業(yè)領(lǐng)域中,聚類可以幫助市場(chǎng)分析人員從消費(fèi)者數(shù)據(jù)庫中區(qū)分出不同的消費(fèi)群體來,并且概括出每一類消費(fèi)者的消費(fèi)模式或者說習(xí)慣。
8.隨機(jī)森林算法
隨機(jī)森林是一種有監(jiān)督學(xué)習(xí)算法,基于決策樹為學(xué)習(xí)器的集成學(xué)習(xí)算法。隨機(jī)森林非常簡(jiǎn)單,易于實(shí)現(xiàn),計(jì)算開銷也很小,但是它在分類和回歸上表現(xiàn)出非常驚人的性能,因此,隨機(jī)森林被譽(yù)為“代表集成學(xué)習(xí)技術(shù)水平的方法”。
隨機(jī)森林擁有廣泛的應(yīng)用前景,從市場(chǎng)營(yíng)銷到醫(yī)療保健保險(xiǎn),既可以用來做市場(chǎng)營(yíng)銷模擬的建模,統(tǒng)計(jì)客戶來源,保留和流失,也可用來預(yù)測(cè)疾病的風(fēng)險(xiǎn)和病患者的易感性。
9.支持向量機(jī)
支持向量機(jī)通過尋求結(jié)構(gòu)化風(fēng)險(xiǎn)最小來提高學(xué)習(xí)機(jī)泛化能力,實(shí)現(xiàn)經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍的最小化,從而達(dá)到在統(tǒng)計(jì)樣本量較少的情況下,亦能獲得良好統(tǒng)計(jì)規(guī)律的目的。它是一種二類分類模型,其基本模型定義為特征空間上的間隔最大的線性分類器,即支持向量機(jī)的學(xué)習(xí)策略便是間隔最大化,最終可轉(zhuǎn)化為一個(gè)凸二次規(guī)劃問題的求解。
支持向量機(jī)可應(yīng)用于諸如文本分類,圖像分類,生物序列分析和生物數(shù)據(jù)挖掘,手寫字符識(shí)別等領(lǐng)域。
10.深度學(xué)習(xí)
深度學(xué)習(xí)基于人工神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí),區(qū)別于傳統(tǒng)的機(jī)器學(xué)習(xí),深度學(xué)習(xí)需要更多樣本,換來更少的人工標(biāo)注和更高的準(zhǔn)確率。
深度學(xué)習(xí)是學(xué)習(xí)樣本數(shù)據(jù)的內(nèi)在規(guī)律和表示層次,這些學(xué)習(xí)過程中獲得的信息對(duì)諸如文字,圖像和聲音等數(shù)據(jù)的解釋有很大的幫助。它的最終目標(biāo)是讓機(jī)器能夠像人一樣具有分析學(xué)習(xí)能力,能夠識(shí)別文字、圖像和聲音等數(shù)據(jù)。 作為復(fù)雜的機(jī)器學(xué)習(xí)算法,在語音和圖像識(shí)別方面取得的效果,遠(yuǎn)遠(yuǎn)超過先前相關(guān)技術(shù)。
小結(jié)
算法是計(jì)算機(jī)科學(xué)領(lǐng)域最重要的基石之一,當(dāng)下需要處理的信息量是呈指數(shù)級(jí)的增長(zhǎng),每人每天都會(huì)創(chuàng)造出大量數(shù)據(jù),無論是三維圖形、海量數(shù)據(jù)處理、機(jī)器學(xué)習(xí)、語音識(shí)別,都需要極大的計(jì)算量,在AI時(shí)代越來越多的挑戰(zhàn)需要靠卓越的算法來解決。
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
11月20日火熱報(bào)名中>> 2024 智能家居出海論壇
-
11月28日立即報(bào)名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國(guó)智造CIO在線峰會(huì)
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
精彩回顧立即查看>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車
推薦專題
- 1 腦機(jī)接口芯片,華為出了新專利!
- 2 銀行業(yè)AI大模型,從入局到求變
- 3 巨頭搶布局,VC狂撒錢,為了能讓「AI讀心」這些公司卷瘋了
- 4 阿斯麥ASML:“骨折級(jí)”洋相,又成AI第一殺手?
- 5 蘋果市值創(chuàng)新高,iPhone 16能否助力突破4萬億美元大關(guān)?
- 6 地平線開啟配售,阿里百度各砸5000萬美金,市值最高超500億
- 7 小馬智行沖刺納斯達(dá)克:或成「全球Robotaxi第一股」,兩年半營(yíng)收約12億元
- 8 云從科技:營(yíng)收低迷與虧損加劇,2025年盈利目標(biāo)挑戰(zhàn)重重
- 9 AI奇跡:域名賣爆,無名小島意外賺2億
- 10 逆境求生,泄密風(fēng)波中的高精地圖
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市