游戏AI必备新框架，谷歌发布基于TensorFlow的「多巴胺」开源框架

乾明 2018-08-28 15:38:31 来源：量子位

郭一璞发自凹非寺

量子位报道 | 公众号 QbitAI

上周那个在DOTA2 TI8赛场上“装逼失败”的OpenAI Five，背后是强化学习的助推。

其实不仅仅是OpenAI Five，下围棋的AlphaGo和AlphaGo Zero、玩雅达利街机游戏的DeepMind DQN（deep Q-network），都离不开强化学习（Reinforcement Learning）。

游戏AI必备新框架，谷歌发布基于TensorFlow的「多巴胺」开源框架

现在，谷歌发布了一个基于TensorFlow的强化学习开源框架，名叫Dopamine。

另外，还有一组Dopamine的教学colab。

和它的名字Dopamine（多巴胺）一样，新框架听上去就令人激动。

清晰，简洁，易用

新框架在设计时就秉承着清晰简洁的理念，所以代码相对紧凑，大约是15个Python文件，基于Arcade Learning Environment (ALE)基准，整合了DQN、C51、 Rainbow agent精简版和ICML 2018上的Implicit Quantile Networks。

可再现

新框架中代码被完整的测试覆盖，可作为补充文档的形式，也可以用ALE来评估。

基准测试

为了让研究人员能快速比较自己的想法和已有的方法，该框架提供了DQN、C51、 Rainbow agent精简版和Implicit Quantile Networks的玩ALE基准下的那60个雅达利游戏的完整训练数据，以Python pickle文件和JSON数据文件的格式存储，并且放到了一个可视化网页中。

游戏AI必备新框架，谷歌发布基于TensorFlow的「多巴胺」开源框架

另外，新框架中还有训练好的深度网络、原始统计日志，以及TensorBoard标注好的TensorFlow事件文件。

传送门

开源框架资源

Dopamine谷歌博客：

https://ai.googleblog.com/2018/08/introducing-new-framework-for-flexible.html

Dopamine github下载：

https://github.com/google/dopamine/tree/master/docs#downloads

colabs：

https://github.com/google/dopamine/blob/master/dopamine/colab/README.md

游戏训练可视化网页：

https://google.github.io/dopamine/baselines/plots.html

相关资料

ALE基准：

https://arxiv.org/abs/1207.4708

DQN（DeepMind）：

https://storage.googleapis.com/deepmind-media/dqn/DQNNaturePaper.pdf

C51（ICML 2017）：

https://arxiv.org/abs/1707.06887

Rainbow：

https://arxiv.org/abs/1710.02298

Implicit Quantile Networks（ICML 2018）：

https://arxiv.org/abs/1806.06923

版权所有，未经授权不得以任何形式转载及使用，违者必究。

TensorFlow 多巴胺游戏AI 谷歌

相关阅读

只需3kbps就能清晰通话，这个谷歌音频工具开源了！

随时随地进行高质量通话

子豪2021-04-12

Lyra 谷歌音频处理

搜索结果牛头不对马嘴？谷歌用BERT改进搜索引擎，做到更懂你

晓查2019-10-27

搜索引擎谷歌

谷歌PaLM大模型成为快餐店员工！点餐黑话都能听懂，网友：不会搞砸我的订单吧

AI chatbot接单员上岗！

西风2023-05-12

AI chatbot 谷歌

谷歌用新AI超越自己：让Imagen能够指定生成对象，风格还能随意转换

5张照片让物体“闪现”到任意场景

羿阁2022-08-27

Imagen 谷歌

美国进入紧急状态：谷歌投入1700名工程师上阵抗疫，马斯克称车祸比新冠病毒危险

乾明2020-03-14

新冠病毒谷歌马斯克

谷歌最大「现金奶牛」危了：广告市场占有率连年下降，数起反垄断诉讼缠身

这几年罚款不少

萧箫2023-01-31

搜索引擎数字广告谷歌

热门文章

雷军：地表最强四门车，小米造！自曝造车起步估值超700亿

陶哲轩在IMO上给AI团队颁奖！他们要做AI数学的ImageNet

给iPhone背面贴个AI录音机，生意老好了

AI视频修复速度10倍提升，过曝变色也能逐帧搞定｜美图国科大新算法

微软蓝屏搞瘫全球，马斯克很生气，原因很尴尬