導航:首頁 > 源碼編譯 > 蒙特卡洛樹的演算法

蒙特卡洛樹的演算法

發布時間:2025-04-15 03:09:04

『壹』 蒙特卡洛樹是什麼演算法

蒙特卡羅樹搜索(MCTS)會逐漸的建立一顆不對稱的樹。可以分為四步並反復迭代:

(1)選擇
從根節點,也就是要做決策的局面R出發向下選擇一個最急迫需要被拓展的節點T;局面R是第一個被檢查的節點,被檢查的節點如果存在一個沒有被評價過的招式m,那麼被檢查的節點在執行m後得到的新局面就是我們所需要展開的T;如果被檢查的局面所有可行的招式已經都被評價過了,那麼利用ucb公式得到一個擁有最大ucb值的可行招式,並且對這個招式產生的新局面再次進行檢查;如果被檢查的局面是一個游戲已經結束的游戲局面,那麼直接執行步驟4;通過反復的進行檢查,最終得到一個在樹的最底層的最後一次被檢查的局面c和它的一個沒有被評價過的招式m,執行步驟2。

(2)拓展
對於此時存在於內存中的局面c,添加一個它的子節點。這個子節點由局面c執行招式m而得到,也就是T。

(3)模擬
從局面T出發,雙方開始隨機的落子。最終得到一個結果(win/lost),以此更新T節點的勝利率。

(4)反向傳播
在T模擬結束之後,它的父節點c以及其所有的祖先節點依次更新勝利率。一個節點的勝利率為這個節點所有的子節點的平均勝利率。並從T開始,一直反向傳播到根節點R,因此路徑上所有的節點的勝利率都會被更新。

閱讀全文

與蒙特卡洛樹的演算法相關的資料

熱點內容
靠演算法買彩票 瀏覽:489
程序員考核d 瀏覽:237
自助游中國pdf 瀏覽:738
安卓p40是什麼手機 瀏覽:79
24cxx編程器 瀏覽:583
陰陽師如何查看哪個伺服器有ID 瀏覽:308
公務員照片壓縮 瀏覽:450
編譯的時候怎麼找未定義的函數 瀏覽:344
有什麼我的世界伺服器 瀏覽:298
伺服器亮綠燈是什麼意思 瀏覽:629
python畫的圖如何保存高清版 瀏覽:491
10的搭接還用加密嗎 瀏覽:365
bytedance這個文件夾是什麼意思呢 瀏覽:590
演算法站的客體 瀏覽:78
src文件夾c語言怎麼運行 瀏覽:25
怎麼把已安裝的app放到桌面 瀏覽:948
如何查看蘋果手機app是否取消訂閱 瀏覽:774
u盤加密之後手機可以打開嗎 瀏覽:47
單片機串口發射怎麼回事 瀏覽:479
程序員假裝自己很忙 瀏覽:800