id3演算法原理_簡述ID3演算法基本原理和步驟

⑴ 簡述ID3演算法基本原理和步驟

1.基本原理：
以信息增益/信息熵為度量，用於決策樹結點的屬性選擇的標准，每次優先選取信息量最多（信息增益最大）的屬性，即信息熵值最小的屬性，以構造一顆熵值下降最快的決策樹，到葉子節點處的熵值為0。（信息熵無條件熵條件熵信息增益請查找其他資料理解）
決策樹將停止生長條件及葉子結點的類別取值：
①數據子集的每一條數據均已經歸類到每一類，此時，葉子結點取當前樣本類別值。
②數據子集類別仍有混亂，但已經找不到新的屬性進行結點分解，此時，葉子結點按當前樣本中少數服從多數的原則進行類別取值。
③數據子集為空，則按整個樣本中少數服從多數的原則進行類別取值。

步驟：
理解了上述停止增長條件以及信息熵，步驟就很簡單

⑵ 什麼是ID3演算法

ID3演算法是由Quinlan首先提出的。該演算法是以資訊理論為基礎，以信息熵和信息增益度為衡量標准，從而實現對數據的歸納分類。以下是一些資訊理論的基本概念：
定義1：若存在n個相同概率的消息，則每個消息的概率p是1/n，一個消息傳遞的信息量為-Log2(1/n)
定義2：若有n個消息，其給定概率分布為P=(p1,p2…pn)，則由該分布傳遞的信息量稱為P的熵，記為
。
定義3：若一個記錄集合T根據類別屬性的值被分成互相獨立的類C1C2..Ck，則識別T的一個元素所屬哪個類所需要的信息量為Info(T)=I(p)，其中P為C1C2…Ck的概率分布，即P=(|C1|/|T|,…..|Ck|/|T|)
定義4：若我們先根據非類別屬性X的值將T分成集合T1,T2…Tn，則確定T中一個元素類的信息量可通過確定Ti的加權平均值來得到，即Info(Ti)的加權平均值為：
Info(X, T)=(i=1 to n 求和)((|Ti|/|T|)Info(Ti))
定義5：信息增益度是兩個信息量之間的差值，其中一個信息量是需確定T的一個元素的信息量，另一個信息量是在已得到的屬性X的值後需確定的T一個元素的信息量，信息增益度公式為：
Gain(X, T)=Info(T)-Info(X, T)
ID3演算法計算每個屬性的信息增益，並選取具有最高增益的屬性作為給定集合的測試屬性。對被選取的測試屬性創建一個節點，並以該節點的屬性標記，對該屬性的每個值創建一個分支據此劃分樣本.
數據描述
所使用的樣本數據有一定的要求,ID3是:
描述-屬性-值相同的屬性必須描述每個例子和有固定數量的價值觀。
預定義類-實例的屬性必須已經定義的,也就是說,他們不是學習的ID3。
離散類-類必須是尖銳的鮮明。連續類分解成模糊范疇(如金屬被「努力,很困難的,靈活的,溫柔的,很軟」都是不可信的。
足夠的例子——因為歸納概括用於(即不可查明)必須選擇足夠多的測試用例來區分有效模式並消除特殊巧合因素的影響。
屬性選擇
ID3決定哪些屬性如何是最好的。一個統計特性,被稱為信息增益,使用熵得到給定屬性衡量培訓例子帶入目標類分開。信息增益最高的信息(信息是最有益的分類)被選擇。為了明確增益,我們首先從資訊理論借用一個定義，叫做熵。每個屬性都有一個熵。

熱點內容

linux判斷是否為文件發布：2025-08-05 00:13:12 瀏覽：937

手機處理器編譯器發布：2025-08-04 23:51:31 瀏覽：704

ug曲線點倒角編程發布：2025-08-04 23:39:01 瀏覽：928

當演算法把人馴服發布：2025-08-04 23:35:35 瀏覽：710

字母r編程發布：2025-08-04 23:28:41 瀏覽：576

編譯openwrt添加型號發布：2025-08-04 23:20:40 瀏覽：275

快眼看app哪裡下載發布：2025-08-04 22:47:28 瀏覽：11

手機上門禁卡加密怎麼處理發布：2025-08-04 22:46:20 瀏覽：857

2019年稅務師教材pdf 發布：2025-08-04 22:32:27 瀏覽：503

android支付寶源碼發布：2025-08-04 22:27:07 瀏覽：942

建造師加密鎖怎麼辦發布：2025-08-04 22:19:32 瀏覽：301

郵箱在線文檔怎麼設文件夾發布：2025-08-04 22:04:01 瀏覽：876

區塊鏈編譯eth 發布：2025-08-04 21:59:05 瀏覽：784

安卓手機軟體如何給照片加發光點發布：2025-08-04 21:50:03 瀏覽：979

結構性存款在app哪裡發布：2025-08-04 21:50:00 瀏覽：970

iphone如何快速打開app 發布：2025-08-04 21:41:46 瀏覽：800

好玩的程序員笑話發布：2025-08-04 21:18:56 瀏覽：82

linux下如何搭建web伺服器發布：2025-08-04 21:11:43 瀏覽：222

狼群之飢和命令之眼發布：2025-08-04 21:11:41 瀏覽：369

xp使用telnet命令發布：2025-08-04 21:00:03 瀏覽：159

導航:首頁 > 源碼編譯 > id3演算法原理

id3演算法原理

與id3演算法原理相關的資料