导航:首页 > 源码编译 > 蒙特卡洛树的算法

蒙特卡洛树的算法

发布时间:2025-04-15 03:09:04

‘壹’ 蒙特卡洛树是什么算法

蒙特卡罗树搜索(MCTS)会逐渐的建立一颗不对称的树。可以分为四步并反复迭代:

(1)选择
从根节点,也就是要做决策的局面R出发向下选择一个最急迫需要被拓展的节点T;局面R是第一个被检查的节点,被检查的节点如果存在一个没有被评价过的招式m,那么被检查的节点在执行m后得到的新局面就是我们所需要展开的T;如果被检查的局面所有可行的招式已经都被评价过了,那么利用ucb公式得到一个拥有最大ucb值的可行招式,并且对这个招式产生的新局面再次进行检查;如果被检查的局面是一个游戏已经结束的游戏局面,那么直接执行步骤4;通过反复的进行检查,最终得到一个在树的最底层的最后一次被检查的局面c和它的一个没有被评价过的招式m,执行步骤2。

(2)拓展
对于此时存在于内存中的局面c,添加一个它的子节点。这个子节点由局面c执行招式m而得到,也就是T。

(3)模拟
从局面T出发,双方开始随机的落子。最终得到一个结果(win/lost),以此更新T节点的胜利率。

(4)反向传播
在T模拟结束之后,它的父节点c以及其所有的祖先节点依次更新胜利率。一个节点的胜利率为这个节点所有的子节点的平均胜利率。并从T开始,一直反向传播到根节点R,因此路径上所有的节点的胜利率都会被更新。

阅读全文

与蒙特卡洛树的算法相关的资料

热点内容
手机pdf阅读器下载 浏览:591
眼睛解压的正确方法 浏览:467
格式化c命令 浏览:139
java转换大小写函数 浏览:217
androidlinux源码 浏览:69
指令查询app源码 浏览:817
51单片机怎么采集比较器 浏览:826
我的世界泥土服务器怎么充钱 浏览:879
压缩毛巾干嘛用的 浏览:175
亿邮如何发加密邮件 浏览:957
it程序员炒股 浏览:172
服务器底层架构什么意思 浏览:793
解压视频讲故事正片 浏览:601
二阶算法都比一阶算法快 浏览:156
一句话说明是程序员 浏览:939
精雕快捷键命令大全 浏览:874
车子大本解压后多久可以过户 浏览:332
单片机软件的编译过程 浏览:434
当地服务商dns服务器地址 浏览:428
星辰影视下载文件夹 浏览:605