��/��/��ţ

��

��ؿ��ţ��£�

��Դ�� - SUMSTC

4. ��ؿ��MCTS��

��

��ؿ��Monte Carlo tree search��MCTS��һ��ĳЩ��߹��̵��ʽ��㷨��עĿ��Ϸ�е�ʹ�á�һ��Ҫ��ǵ��Χ��Ҳ��Ϸ��ʱ��Ϸ�Լ��ȷ��Ϸ��

��ԣ�https://zh.wikipedia.org/zh-hans/��ؿ��

��

��һ

ѡ��(selection)�Ǹ��ݵ�ǰ��Ӳ��ͳ�ƽ��ѡ��һ��ŵ��Ӳ��衣

��չ(expansion)�ڵ�ǰ��õ�ͳ�ƽ��Լ��һ��ʱ��ѡ��һ��Ӳ��衣

ģ��(simulation)ģ��Ϸ��һ��

��򴫲�(Back-Propagation)��Ϸ��Ľ��Ӧ·��ͳ�Ƽ�¼��ֵ��

��ԣ�https://www.cnblogs.com/steven-yang/p/5993205.html

��Ͷ�

ѡ��Selection��Ӹ��R��ʼ��ѡ��ӽ��Ҷ�ӽ��L��һ��ѡ��ӽ��ķ��Ϸ��ŵķ��չ��ؿ��ľ�Ҫ��ڡ�

��չ��Expansion��һ��Ӯʹ��Ϸ��L��򴴽�һ��ӽ�㲢ѡȡ��һ��C��

��棨Simulation��ڴӽ��C��ʼ��Խ��Ϸ��ֳ�Ϊplayout��rollout��

��򴫲��Backpropagation��ʹ��Ϸ�Ľ��´�C��R��·��ϵĽ��Ϣ��

��ԣ�https://zh.wikipedia.org/zh-hans/��ؿ��

ͼ��

��ԣ�https://www.cnblogs.com/steven-yang/p/5993205.html

��ϸ�㷨

�ڿ�ʼ�׶Σ��ֻ��һ��ڵ㣬Ҳ��Ҫ��ߵľ��档

��е�ÿһ��ڵ��Ϣ��ľ��棬��ʵĴ��ۼ��֡�

1. ѡ��(Selection)

��ѡ��׶Σ��Ҫ�Ӹ��ڵ㣬Ҳ��Ҫ��ߵľ��R��ѡ��һ����Ҫ��չ�Ľڵ�N��R��ÿһ�ε��е�һ��Ľڵ㣻

��ڱ��ľ��ԣ��ֿ��ܣ�

1. �ýڵ��п��ж��Ѿ��չ��

2. �ýڵ��п��ж��δ��չ��

3. ��ڵ��Ϸ�Ѿ��(��Ѿ��ӵ��)

��ֿ��ܣ�

1. ��п��ж��Ѿ��չ��ˣ��ô��ǽ�ʹ��UCB��ʽ��ýڵ��ӽڵ��UCBֵ��ҵ�ֵ��һ��ӽڵ��顣��µ��

2. ��ľ��Ȼ��û�б��չ��ӽڵ�(��˵ĳ�ڵ��20��ж��вŴ��19��ӽڵ�)��ô��Ϊ��ڵ��Ǳ��ε��ĵ�Ŀ��ڵ�N��ҳ�N��δ��չ�Ķ��A��ִ�в��[2]��

3. ��鵽�Ľڵ��һ��Ϸ�Ѿ��Ľڵ㡣��ô�Ӹýڵ�ֱ��ִ�в��{4]��

ÿһ��Ľڵ�ı��ʴ��׶ζ��

�ڷ��ĵ��֮��ǽ��ĵ׶��ҵ�һ��ڵ㣬��Ĳ��衣

2. ��չ(Expansion)

��ѡ��׶ν��ʱ��ǲ��ҵ��һ��б��չ�Ľڵ�N��Լ��һ��δ��չ�Ķ��A��д��һ��µĽڵ��ΪN��һ��ӽڵ㡣�ľ��ǽڵ�N��ִ��˶��A֮��ľ��档

3. ģ��(Simulation)

Ϊ��õõ�һ��ʼ��֡��Ǵӿ�ʼ��Ϸ��У�ֱ��õ�һ��Ϸ��֣��ֽ��Ϊ�ĳ�ʼ��֡�һ��ʹ��ʤ��/ʧ��Ϊ��֣�ֻ��1��0��

4. ��򴫲�(Backpropagation)

�ڵ�ģ��֮��ĸ��ڵ�N�Լ��Ӹ��ڵ㵽N��·��ϵ��нڵ㶼��ݱ��ģ��Ľ��Լ��ۼ��֡��[1]��ѡ��ֱ�ӷ��һ��Ϸ��ֵĻ��ݸý��֡�

ÿһ�ε��չ��ŵ��ӣ��Ĺ�ģҲ��ӡ��һ��ĵ��ʱ��֮��ѡ��ڵ��õ��ӽڵ��Ϊ��ξ��ߵĽ��

��ԣ�https://www.zhihu.com/question/39916945/answer/83799720

��ɲο��https://jeffbradberry.com/posts/2015/09/intro-to-monte-carlo-tree-search/

�㷨α��

5.��㷨��UCT��

UCB1

�ڸ�ʽ�У�

��ԣ�https://zh.wikipedia.org/zh-hans/��ؿ��

��У�CԽ�󣬾ͻ�Խ�չ˷��ʴ��Խ��ٵ��ӽڵ㡣

��ԣ�https://zhuanlan.zhihu.com/p/25345778

UCT��

UCT�㷨��Upper Confidence Bound Apply to Tree��㷨��һ�ֲ��㷨��㷨��ؿ��UCB��ʽ��ϣ��ڳ��ģ��ڴ�ͳ��㷨��ʱ��Ϳռ䷽��ơ�

��MCTS + UCB1 = UCT

��ԣ�https://baike.baidu.com/item/UCT�㷨

�㷨�е�UCB��ʽ��滻Ϊ��UCB1-tuned ��

�ŵ�

MCTS �ṩ�˱ȴ�ͳ��õķ��

1.Aheuristic ��ʽ

MCTS ��Ҫ��κι��ڸ��Ի��߾��ʵ��֪ʶ��ľ��ߡ��㷨��û��κι��ڲ��Ϸ��֪ʶ��½��Ч��ζ��һ��򵥵�MCTS ʵ�ֿ��ںܶ�Ĳ��Ϸ�У�ֻ��Ҫ��΢С�ĵ��Ҳʹ�� MCTS �Ƕ��һ��Ĳ��Ϸ�ĺܺõķ��

2.Asymmetric �ǶԳ�

MCTS ִ��һ�ַǶԳƵ��Ӧ��ռ��˽ṹ��㷨��Ƶ��ط��ʸ��Ȥ�Ľڵ㣬��۽��ʱ��ڸ��ص��Ĳ��֡��ʹ�� MCTS ��ʺ��Щ��Ÿ��ķ�֧��ӵĲ��Ϸ��˵ 19X19 ��Χ�塣��ô��Ͽռ��׼�Ļ��Ȼ��߿��ȵ��⣬��MCTS ��Ӧ��˵��գ��ҵ��Щ��Ż��ж��Ĺ��۽��Щ��֡�

3.�κ�ʱ��

�㷨��κ�ʱ��ֹ��ص�ǰ��еĹ��ơ��ǰ��Ա��߹��á��Ա�dfs��

4.��

�㷨ʵ�ַǳ��㣨http://mcts.ai/code/python.html��

��ԣ�https://www.jianshu.com/p/d011baff6b64

ȱ��

MCTS ��ȱ��٣��Щȱ��Ҳ��Ƿǳ��ؼ��Ӱ��ء�

1.��Ϊ��

MCTS �㷨��ʽ��ĳЩ��Ǻܴ�Ĳ��Ϸ��ڿɳ��ܵ�ʱ��Ҳ��ܹ��ҵ��õ��ж��ʽ��ϲ��Ŀռ��ȫ��С��£��ؼ��ڵ㲢��ܹ��㹻��Ĵ��Ĺ��ơ�

2.�ٶ�

MCTS ��Ҫ�㹻��ĵ��һ��ܺõĽ��ϣ��Ҳ�Ǹ��һ��Ż��Ӧ��ϵ��⡣��磬��ѵ�Χ��Ҫ��εĽ�ս��Ѻ�ǿ��ܵõ�ר�Ҽ��ж��е�GGP ʵ�ֶԸ��Ӹ��ӵĲ��Ϸ��Ҳ��ֻҪÿ��ʮ�Σ��޹صģ��ս��Կɳ��ܵ��ж�ʱ�䣬��GGP ��ܺ��ʱ��ʵ�ÿ��ж��Ҳ��ܳ��ֱ��ַǳ��õ��

��ԣ�https://www.jianshu.com/p/d011baff6b64

6.��ϸʾ��

http://mcts.ai/code/python.html

ͼ�ģ�Tao

�༭��

�׷��΢�Ź��ںţ�SUMSTC

��ݴ�ѧ΢��ֲ�

��: 2018-07-192018-07-19 20:05:15
ԭ��https://kuaibao.qq.com/s/20180719G1Q3YX00?refer=cp_1026
��Ѷ��Ѷ�ƿ��Ѷ��ݿ��ƽ̨�ʺţ��ţ��֮һ��Ѷ��ݿ��ƽ̨��Э�顷ת�ط��ݡ�
��Ȩ��ϵ cloudcommunity@tencent.com ɾ��

��Ѷ

ɨ��

��վ�� Ⱥ

��ȡר�� 10Ԫ��ż�ȯ

˽�� ��ɻ�

��ؿ��ţ��£�

��Ѷ

ɨ��

��

�

��Դ

��

��Ѷ�ƿ��

��Ų�Ʒ

��Ƽ�

��Ƽ�

���ؿ��������ţ��£�

�����Ѷ

����

�

��Դ

����

��Ѷ�ƿ�����

���Ų�Ʒ

�����Ƽ�

�����Ƽ�

��ؿ��ţ��£�

��Ѷ

��

��

��Ѷ�ƿ��

��Ų�Ʒ

��Ƽ�

��Ƽ�