訂閱
糾錯
加入自媒體

人工智能之決策樹(DT)

在生活或工作中,人們經(jīng)常面臨各種各樣的選擇,很迷茫困惑,正確的決策非常重要。同樣,人工智能研究中也會遇到?jīng)Q策問題,今天就跟大家聊聊人工智能之決策樹。

決策樹(DecisionTree)是一類常見的機器學(xué)習(xí)方法。決策樹(DT)在人工智能中所處的位置:

人工智能->機器學(xué)習(xí)->監(jiān)督學(xué)習(xí)->決策樹。

在機器學(xué)習(xí)中,決策樹(DT)是一個預(yù)測(決策)模型,它所代表的是對象屬性與對象值之間的一種映射關(guān)系。決策樹算法根據(jù)數(shù)據(jù)的屬性采用樹狀結(jié)構(gòu)建立決策模型。

人工智能之決策樹(DT)

什么是決策樹?

決策樹(DT)是在已知各種情況發(fā)生概率的基礎(chǔ)上,通過構(gòu)成決策樹來求取凈現(xiàn)值的期望值大于等于零的概率,評價項目風險,判斷其可行性的決策分析方法,是直觀運用概率分析的一種圖解法。由于這種決策分支畫成圖形很像一棵樹的枝干,故稱決策樹。從數(shù)據(jù)產(chǎn)生決策樹的機器學(xué)習(xí)技術(shù)叫做決策樹學(xué)習(xí)。

通過定義我們知道,決策樹(DT)是一種樹形結(jié)構(gòu),樹中每個節(jié)點表示某個對象,而每個分叉路徑則代表的某個可能的屬性值,而每個葉結(jié)點則對應(yīng)從根節(jié)點到該葉節(jié)點所經(jīng)歷的路徑所表示的對象的值。結(jié)點有兩種類型:內(nèi)部節(jié)點和葉節(jié)點,內(nèi)部節(jié)點表示一個特征、屬性或一個屬性上的測試,每個分支代表一個測試輸出,葉節(jié)點表示一個類別。決策樹(DT)一般都是自上而下的來生成的。每個決策或事件(即自然狀態(tài))都可能引出兩個或多個事件,導(dǎo)致不同的結(jié)果。

人工智能之決策樹(DT)

決策樹(DT)是一種十分常見的分類方法,也稱分類樹。它是一種監(jiān)督學(xué)習(xí),即給定一堆樣本,每個樣本都有一組屬性和一個類別,這些類別是事先確定的,那么通過學(xué)習(xí)得到一個分類器,這個分類器能夠?qū)π鲁霈F(xiàn)的對象給出正確的分類。因此,決策樹常常用來解決分類和回歸問題。

決策樹構(gòu)成要素:

1)決策結(jié)點:用方塊結(jié)點□表示,是對幾種可能方案的選擇,即最后選擇的最佳方案。如果決策屬于多級決策,則決策樹的中間可以有多個決策點,以決策樹根部的決策點為最終決策方案。

2)方案枝:由結(jié)點引出若干條細支,每條細支代表一個方案,稱為方案枝

3)狀態(tài)結(jié)點:用圓形結(jié)點○表示,代表備選方案的經(jīng)濟效果(期望值),通過各狀態(tài)節(jié)點的經(jīng)濟效果的對比,按照一定的決策標準就可以選出最佳方案。

4)概率枝:由狀態(tài)節(jié)點引出的分支稱為概率枝,概率枝的數(shù)目表示可能出現(xiàn)的自然狀態(tài)數(shù)目。每個分枝上要注明該狀態(tài)的內(nèi)容和其出現(xiàn)的概率。

5)結(jié)果結(jié)點:用三角結(jié)點△表示,將每個方案在各種自然狀態(tài)下取得的收益值或損失值標注于結(jié)果節(jié)點的右端。

人工智能之決策樹(DT)

總之,決策樹一般由決策結(jié)點、方案枝、狀態(tài)結(jié)點、概率枝和結(jié)果結(jié)點等組成,這樣樹形圖由左向右或自上而下,由簡到繁展開,組成一個樹狀網(wǎng)絡(luò)圖。

決策樹學(xué)習(xí)過程:

決策樹學(xué)習(xí)過程建樹過程包含特征選擇、決策樹的生成與剪枝過程。決策樹的學(xué)習(xí)算法通常是遞歸地選擇最優(yōu)特征,并用最優(yōu)特征對數(shù)據(jù)集進行分割。開始時,構(gòu)建根結(jié)點,選擇最優(yōu)特征,該特征有幾種值就分割為幾個子集,每個子集分別遞歸調(diào)用此方法,返回結(jié)點,返回的結(jié)點就是上一層的子結(jié)點。直到所有特征都已經(jīng)用完,或者數(shù)據(jù)集只有一維特征為止。另外,隨機森林分類器將許多決策樹結(jié)合起來以提升分類的正確率

人工智能之決策樹(DT)

決策樹建樹過程的主要挑戰(zhàn)是確定哪些屬性作為根節(jié)點以及每個級別的節(jié)點。處理這些需要知道屬性選擇。目前主要有2種不同的屬性選擇方法(信息增益和基尼指數(shù))來識別這些屬性。當信息增益作為標準時,假設(shè)屬性是分類的;對于基尼系數(shù),則假設(shè)屬性是連續(xù)的。

人工智能之決策樹(DT)

1  2  下一頁>  
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號