如何用強化學習設計一個能玩五子棋的AI?
還記得2015年大戰(zhàn)李世石和柯潔的阿爾法狗嗎?你是否想過自己動手設計訓練一個能下棋的AI呢?我的好友敏哥寫了一個系列文章來教你從LeetCode一道題的題解開始,逐步理解和實現(xiàn)一個能下井字棋和五子棋的強化學習AI。文章鏈接如下。
感興趣的小伙伴歡迎關注敏哥的公眾號get相應資源????!
下面是敏哥更多的強化學習相關原創(chuàng)文章和視頻。
深度強化學習實踐系列

組合游戲系列5: 井字棋、五子棋AlphaGo Zero 算法實戰(zhàn)

經(jīng)典論文解讀系列

解讀TRPO論文,深度強化學習結合傳統(tǒng)優(yōu)化方法

Sutton 強化學習教程動手系列
通過代碼學Sutton強化學習4:21點游戲蒙特卡洛解得最佳策略

通過代碼學Sutton強化學習:從Q-Learning 演化到 DQN
經(jīng)典論文視頻解讀系列
【英語】Pointer Networks 論文解讀:RNN解組合優(yōu)化
評論
圖片
表情
