DeepMind深度学习高级课程，视频资源已全部放出｜是研究生课哟

栗子 2018-11-24 12:02:17 来源：量子位

痴栗子发自麦蒿寺量子位报道 | 公众号 QbitAI

昨天，DeepMind兴奋地发推宣告：

我们在伦敦大学学院 (UCL) 讲授的课程，现在全部课堂视频都放出来了。

课号COMPGI22，名叫高级深度学习和强化学习 (Advanced Deep Learning and Reinforcement Learning) ，是今年早些时候结课的。

面对这一喜讯，推特上的小伙伴们纷纷马克，奔走相告。

DeepMind发布研究成果的推特，几条加起来可能也不及这一条资源的关注度。

两个部分，合体进化

一个学期18节课，老师是DeepMind研究负责人兼UCL教授Thore Graepel，与他率领的一众DM研究员。

课程分为两个部分，互有交叉，在学期的结尾正式汇合：

一个部分，是用深度神经网络做机器学习；

另一部分，是用强化学习做预测和控制。

两股溪流，终会以“深度强化学习”之名，合为一体：

在强化学习环境里，深度神经网络会以函数逼近器 (Function Approximators) 的形象出现。

深度学习部分

开始，是简要介绍神经网络和监督学习，用的是TensorFlow。

后面，是卷积神经网络 (CNN) ；

递归神经网络 (RNN) ；

端到端 (End-to-End) 以及基于能量 (Energy-Based) 的学习；

优化方法 (Optimization Methods) ；

无监督学习 (Unsupervised Learning) ；

当然，还会讲到注意力 (Attention) 和记忆 (Memory) 。

课堂要讨论的应用方向，包括物体识别，以及自然语言处理。

强化学习部分

这一部分，会涉及马尔可夫决策过程 (Markov Decision Process) ；

动态规划/动态编程 (Dynamic Programming) ；

无模型预测和控制 (Model-Free Prediction and Control) ；

价值函数 (Value Function) ；

近似 (Approximation) ；

策略梯度方法 (Policy Gradient Methods) ；

学习与规划的整合 (Integration of Learning and Planning) ；

以及强化学习里最重要的，探索未知与利用已知之间的两难抉择。

应用层面的讨论，包括学打经典游戏，和桌游。

最终，两个部分完成合体。

友情提示：以上两部分是穿插进行，同学们可提前做好心理建设。

祝您成功

这里，是每一节课的主题。

前三节是深度学习，又三节是强化学习。不过再往后，就是一节深度学习、一节强化学习，这样的高频切换了。

如果各位刚才没注意，DeepMind宣布课程喜讯的那条推特，最后一句话是：

课程视频传送门 (梯子必要) ：

https://www.youtube.com/playlist?list=PLqYmG7hTraZDNJre23vqCGIVpfZ_K2RZs

DeepMind 深度学习课程

栗子

SQuAD风云：AI对鲁迅作品的理解超过我了？别激动……2018-01-20
马云正式卸任后，阿里巴巴开盘跌0.87%2019-09-10
亚马逊在华拓展云计算团队，挑战阿里巴巴和腾讯2019-10-16
AI独角兽云知声，已完成一期科创板IPO辅导2019-10-17

DeepMind深度学习高级课程，视频资源已全部放出｜是研究生课哟

两个部分，合体进化

祝您成功

相关阅读

DeepMind发布神经网络、强化学习库，网友：推动JAX发展

47岁DeepMind创始人斩获“诺奖风向标”！AlphaFold上榜拉斯克奖

奥巴马竟被「去马赛克AI」洗白，CVPR新研究惹上种族歧视大麻烦，LeCun也被卷入其中

全程中文！谷歌发布机器学习速成课，完全免费（附视听评测）

BigGAN被干了！DeepMind发布LOGAN：FID提升32%，华人一作领衔

免费中文深度学习课程来了！北大本科生同款，孙剑领衔旷视研究团队开讲

热门文章

雷军：地表最强四门车，小米造！自曝造车起步估值超700亿

陶哲轩在IMO上给AI团队颁奖！他们要做AI数学的ImageNet

给iPhone背面贴个AI录音机，生意老好了

AI视频修复速度10倍提升，过曝变色也能逐帧搞定｜美图国科大新算法

微软蓝屏搞瘫全球，马斯克很生气，原因很尴尬