人工智能之馬爾可夫模型(MM)
這里“MM”-馬爾可夫模型,不是跟中國(guó)網(wǎng)絡(luò)俗語(yǔ)“美眉”有關(guān),而是跟俄國(guó)的“老司機(jī)”馬爾可夫有關(guān)。
這位“老司機(jī)”全名叫安德雷·安德耶維齊·馬爾可夫(Андрей Андреевич Марков),是俄國(guó)數(shù)學(xué)家。1874年18歲的馬爾可夫考入圣彼得堡大學(xué),師從切比雪夫(另一位俄國(guó)“老司機(jī)”,著名的切比雪夫定理-概率論與數(shù)理統(tǒng)計(jì)的基礎(chǔ)),物理-數(shù)學(xué)博士,畢業(yè)后留校任教,圣彼得堡大學(xué)教授,圣彼得堡科學(xué)院院士。在概率論、數(shù)論、函數(shù)逼近論和微分方程等方面卓有成就。
馬爾可夫模型概述:
馬爾可夫模型MM(MarkovModel)是一種統(tǒng)計(jì)模型。它的原始模型馬爾可夫鏈,由俄國(guó)數(shù)學(xué)家馬爾可夫于1906年提出,將此一般化到可數(shù)無(wú)限狀態(tài)空間是由柯?tīng)柲宸蛟?936年給出的。馬爾可夫鏈?zhǔn)桥c馬爾可夫過(guò)程緊密相關(guān)。馬爾可夫過(guò)程是研究離散事件動(dòng)態(tài)系統(tǒng)狀態(tài)空間的重要方法,它的數(shù)學(xué)基礎(chǔ)是隨機(jī)過(guò)程理論。
馬爾可夫性質(zhì):
此性質(zhì)稱(chēng)為馬爾可夫性質(zhì)(Markov Property),亦稱(chēng)無(wú)后效性或無(wú)記憶性。
若X(t)為離散型隨機(jī)變量,則馬爾可夫性亦滿(mǎn)足等式。
馬爾可夫過(guò)程:
若隨機(jī)過(guò)程{X(t), t屬于T}滿(mǎn)足馬爾可夫性質(zhì),則稱(chēng)為馬爾可夫過(guò)程。
比如,荷花池中一只青蛙的跳躍,液體中微粒所作的布朗運(yùn)動(dòng),傳染病受感染的人數(shù),原子核中一自由電子在電子層中的跳躍,人口增長(zhǎng)過(guò)程、闖迷宮的老鼠等都可視為馬爾可夫過(guò)程。
常見(jiàn)馬爾可夫過(guò)程有:
(1)獨(dú)立隨機(jī)過(guò)程為馬爾可夫過(guò)程。
(2)獨(dú)立增量過(guò)程為馬爾可夫過(guò)程。
(3)泊松過(guò)程為馬爾可夫過(guò)程。
(4)維納過(guò)程為馬爾可夫過(guò)程。
(5)質(zhì)點(diǎn)隨機(jī)游動(dòng)過(guò)程為馬爾可夫過(guò)程。
跟樸素貝葉斯、支持向量機(jī)等機(jī)器學(xué)習(xí)算法不同,馬爾可夫過(guò)程不必給處理的數(shù)據(jù)打標(biāo)簽。馬爾可夫過(guò)程更側(cè)重于處理控制或決策問(wèn)題。
馬爾可夫過(guò)程用于預(yù)測(cè)基本步驟:首先確定系統(tǒng)狀態(tài),然后確定狀態(tài)之間轉(zhuǎn)移概率,再進(jìn)行預(yù)測(cè),并對(duì)預(yù)測(cè)結(jié)果進(jìn)行分析-若結(jié)果合理,則可提交預(yù)測(cè)報(bào)告,否則需檢查系統(tǒng)狀態(tài)及狀態(tài)轉(zhuǎn)移概率是否正確。
馬爾可夫鏈:
馬爾可夫鏈MC(Markov Chain)是指數(shù)學(xué)中具有馬爾可夫性質(zhì)的離散事件隨機(jī)過(guò)程。該過(guò)程中,在給定當(dāng)前知識(shí)或信息的情況下,過(guò)去對(duì)于預(yù)測(cè)將來(lái)是無(wú)關(guān)的。在馬爾可夫鏈的每一步,系統(tǒng)根據(jù)概率分布,可以從一個(gè)狀態(tài)變到另一個(gè)狀態(tài),也可以保持當(dāng)前狀態(tài)。狀態(tài)的改變叫做轉(zhuǎn)移,與不同的狀態(tài)改變相關(guān)的概率叫做轉(zhuǎn)移概率。
時(shí)間和狀態(tài)都離散的馬爾可夫過(guò)程成為馬爾可夫鏈MC。
馬爾可夫鏈原理:
馬爾可夫鏈MC描述了一種狀態(tài)序列,其每個(gè)狀態(tài)值取決于前面有限個(gè)狀態(tài)。馬爾可夫鏈?zhǔn)蔷哂旭R爾可夫性質(zhì)的隨機(jī)變量的一個(gè)數(shù)列。這些變量的范圍,即它們所有可能取值的集合,被稱(chēng)為“狀態(tài)空間”,而的值則是在時(shí)間n的狀態(tài)。
馬爾可夫鏈?zhǔn)桥c馬爾可夫過(guò)程緊密相關(guān)。運(yùn)用馬爾可夫鏈只需要最近或現(xiàn)在的動(dòng)態(tài)資料便可預(yù)測(cè)將來(lái)。
馬爾可夫鏈性質(zhì):
馬爾可夫鏈MC具有以下性質(zhì):
1)正定性:狀態(tài)轉(zhuǎn)移矩陣中的每一個(gè)元素被稱(chēng)為狀態(tài)轉(zhuǎn)移概率,由概率論知識(shí)可知,每個(gè)狀態(tài)轉(zhuǎn)移概率皆為正數(shù),用公式即可表示為:
2)有限性:由概率論知識(shí)知,狀態(tài)轉(zhuǎn)移陣中的每一行狀態(tài)轉(zhuǎn)移陣中每行相加皆為1,用公式可表示為:
馬爾可夫序列分類(lèi)器:
序列分類(lèi)器或序列標(biāo)號(hào)器是給序列中的某個(gè)單元指派類(lèi)或者標(biāo)號(hào)的模型。諸如:詞類(lèi)標(biāo)注、語(yǔ)音識(shí)別、句子切分、字素音位轉(zhuǎn)換、局部句法剖析、語(yǔ)塊分析、命名實(shí)體識(shí)別、信息抽取都屬于序列分類(lèi)。
馬爾可夫序列分類(lèi)器為:
1)顯馬爾可夫模型(VMM),又叫馬爾可夫模型MM。
2)隱馬爾可夫模型(HMM),描述一個(gè)含有隱含未知參數(shù)的馬爾可夫過(guò)程,是一個(gè)雙重隨機(jī)過(guò)程(包括馬爾可夫鏈和一般隨機(jī)過(guò)程)。
馬爾可夫模型應(yīng)用:
馬爾可夫模型廣泛應(yīng)用在語(yǔ)音識(shí)別,詞性自動(dòng)標(biāo)注,音字轉(zhuǎn)換,概率文法等各個(gè)自然語(yǔ)言處理、算術(shù)編碼、地理統(tǒng)計(jì)學(xué)、企業(yè)產(chǎn)品市場(chǎng)預(yù)測(cè)、人口過(guò)程、生物信息學(xué)(編碼區(qū)域或基因預(yù)測(cè))等應(yīng)用領(lǐng)域。經(jīng)過(guò)長(zhǎng)期發(fā)展,尤其是在語(yǔ)音識(shí)別中的成功應(yīng)用,使它成為一種通用的統(tǒng)計(jì)工具。
1)狀態(tài)統(tǒng)計(jì)建模:馬爾可夫鏈通常用來(lái)建模排隊(duì)理論和統(tǒng)計(jì)學(xué)中的建模。還可作為信號(hào)模型用于熵編碼技術(shù)等。馬爾科夫鏈預(yù)測(cè)法是一種適用于隨機(jī)過(guò)程的科學(xué)、有效的動(dòng)態(tài)預(yù)測(cè)方法。馬爾可夫鏈有眾多的生物學(xué)應(yīng)用,特別是人口過(guò)程,可以幫助模擬生物人口過(guò)程的建模。
2)隱蔽馬爾可夫模型(HMM)還被用于生物信息學(xué),用以編碼區(qū)域或基因預(yù)測(cè)。1980年代后半期,HMM開(kāi)始應(yīng)用到生物序列尤其是DNA的分析中。此后,在生物信息學(xué)領(lǐng)域HMM逐漸成為一項(xiàng)不可或缺的技術(shù)。到目前為止,隱馬爾可夫模型(HMM)一直被認(rèn)為是實(shí)現(xiàn)快速精確的語(yǔ)音識(shí)別系統(tǒng)的最成功的方法。復(fù)雜的語(yǔ)音識(shí)別問(wèn)題通過(guò)隱含馬爾可夫模型能非常簡(jiǎn)單地被表述、解決,讓人們由衷地感嘆數(shù)學(xué)模型之妙。
3)馬爾科夫鏈蒙特卡羅方法(Markov Chain Monte Carlo)方法: 馬爾科夫鏈蒙特卡羅MCMC是在樸素貝葉斯[請(qǐng)參見(jiàn)公眾號(hào)“科技優(yōu)化生活”之人工智能(29)]論框架下,通過(guò)計(jì)算機(jī)進(jìn)行模擬的蒙特卡羅方法[請(qǐng)參見(jiàn)公眾號(hào)“科技優(yōu)化生活”之人工智能(31)],該方法將馬爾科夫鏈(MC)引入到蒙特卡羅(MC)模擬中,實(shí)現(xiàn)隨著抽樣分布隨機(jī)模擬的進(jìn)行而改變的動(dòng)態(tài)模擬,彌補(bǔ)了傳統(tǒng)的蒙特卡羅積分只能靜態(tài)模擬的缺陷,是近年來(lái)廣泛應(yīng)用的統(tǒng)計(jì)計(jì)算方法。
結(jié)語(yǔ):
馬爾可夫模型(Markov Model)是一種統(tǒng)計(jì)模型。它的原始模型馬爾可夫鏈,由俄國(guó)數(shù)學(xué)家馬爾可夫于1906年提出。運(yùn)用馬爾可夫鏈只需要最近或現(xiàn)在的動(dòng)態(tài)資料便可預(yù)測(cè)將來(lái)。馬爾可夫鏈?zhǔn)桥c馬爾可夫過(guò)程緊密相關(guān)。馬爾可夫過(guò)程是研究離散事件動(dòng)態(tài)系統(tǒng)狀態(tài)空間的重要方法,它的數(shù)學(xué)基礎(chǔ)是隨機(jī)過(guò)程理論。馬爾可夫模型在及人工智能之自然語(yǔ)言處理等領(lǐng)域應(yīng)用廣泛。
原創(chuàng) 張志榮
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-11.13立即報(bào)名>>> 【在線(xiàn)會(huì)議】多物理場(chǎng)仿真助跑新能源汽車(chē)
-
11月28日立即報(bào)名>>> 2024工程師系列—工業(yè)電子技術(shù)在線(xiàn)會(huì)議
-
12月19日立即報(bào)名>> 【線(xiàn)下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國(guó)智造CIO在線(xiàn)峰會(huì)
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
-
精彩回顧立即查看>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
推薦專(zhuān)題
- 1 【一周車(chē)話(huà)】沒(méi)有方向盤(pán)和踏板的車(chē),你敢坐嗎?
- 2 特斯拉發(fā)布無(wú)人駕駛車(chē),還未迎來(lái)“Chatgpt時(shí)刻”
- 3 特斯拉股價(jià)大跌15%:Robotaxi離落地還差一個(gè)蘿卜快跑
- 4 馬斯克給的“驚喜”夠嗎?
- 5 打完“價(jià)格戰(zhàn)”,大模型還要比什么?
- 6 馬斯克致敬“國(guó)產(chǎn)蘿卜”?
- 7 神經(jīng)網(wǎng)絡(luò),誰(shuí)是盈利最強(qiáng)企業(yè)?
- 8 比蘋(píng)果偉大100倍!真正改寫(xiě)人類(lèi)歷史的智能產(chǎn)品降臨
- 9 諾獎(jiǎng)進(jìn)入“AI時(shí)代”,人類(lèi)何去何從?
- 10 Open AI融資后成萬(wàn)億獨(dú)角獸,AI人才之爭(zhēng)開(kāi)啟
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷(xiāo)售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷(xiāo)售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專(zhuān)家 廣東省/江門(mén)市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市