2019微软研究大盘点:机器学习突破即将到来,人机交互更加真实,惜别沈向洋

十三 发自 凹非寺
量子位 报道 | 公众号 QbitAI

研究是为了实现一个长期目标,通常是渐进式的发展过程。

随着岁末钟声的临近,微软研究院回顾了这一年来在人工智能领域中的工作。

微软研究院表示:

2019年,是科技面临严峻挑战的一年。

总体来说,研究大盘点包括以下几个方面:

· 让AI和机器学习系统更容易被访问;
· 促进了”以人为本“的创新研究;
· 创建适合所有人的人机交互;
· 安全、存储、系统以及应用方面的突破;
· 为研究社区提供开源工具和数据;
· 为研究团体提供奖学金

此外,沈向洋博士于前不久宣布离职微软。

微软研究院在此次复盘中也与沈向洋博士道了声”再见“

提高AI和机器学习的可访问性

机器学习很显然对人们的生活产生了一定影响。

那么微软的研究人员在这一年中做了些什么呢?

提高机器学习系统的能力,进一步发展这一科学的新模式

他们使用了一些特殊方法让这些系统能够更容易被访问。

在深度学习方面,微软研究院合作研究经理高剑峰博士的团队,提出了MT-DNN模型

这是一个学习通用语言嵌入的模型,结合了多任务学习的优势和BERT的语言模型预训练,帮助系统快速发展自然语言处理所必需的语义理解。

MT-DNN地址:

Towards universal language embeddings

微软研究院Xu Tan的团队则开发了MASS。

这是一种预训练方法,在序列到序列的语言生成方面优于现有模型。

MASS地址:

Introducing MASS – A pre-training method that outperforms BERT and GPT in sequence to sequence language generation tasks

而在未来几年里,将会出现机器学习的突破

能够超越目前将使用马尔科夫决策过程作为基础的方法,尤其是强化学习,会变得更加适用于现实场景。

项目地址:

Reinforcement learning for the real world with Dr. John Langford and Rafah Hosn

许多机器学习应用程序受益于庞大的数据集,然而也有很多应用是没有足够的数据来证明其方法是有效的。

进入机器教学(machine teaching)领域,领域专家可以用很少的数据建立定制的人工智能模型。

项目地址:

Machine teaching, LUIS and the democratization of custom AI with Dr. Riham Mansour

另外一个让AI较为民主化的项目是研究院与Justin Harris合作的区块链框架上的分散与协作人工智能

它可以让用户在以太网上训练和维护模型和数据集。

此外,微软研究院首席研究员Debadeepta Dey在今年的NeurIPS上提出了Petridish项目。

△超过300名微软研究人员参与了NeurIPS 2019

这是一种高效的前向神经结构搜索算法,它可以帮助识别给定机器学习任务的神经结构。

项目地址:

Project Petridish: Efficient forward neural architecture search

促进负责、包容、以人为本的创新

2019年ACM FAT *大会在亚特兰大举行。

微软研究院在会议上发表了四篇论文,分别涵盖了职业分类中的性别偏见、数据驱动决策在加强不公正方面的作用、算法决策系统的战略操纵,以及在没有资金的情况下公平分配项目。

这些工作来自微软的 FATE 研究小组,该小组研究人工智能、机器学习、数据科学、大规模实验和自动化的复杂社会影响。

在五月份的CHI大会上,研究员Saleema Amershi与其合作者提出了一套人机交互设计的指导方案,汇集了20多年的研究、建议和最佳实践,围绕着与人工智能系统的有效交互。

把这些工作结合在一起,将有助于设计师管理用户的期望,调节自治的程度,解决模糊性,并向用户提供系统如何从用户的行为中学习意识。

项目地址:

Guidelines for human-AI interaction design

此外,开源模拟器 AirSim今年举办了无人机的NeurIPS比赛。

在无人驾驶飞机挑战赛中,参赛者与微软研究院的一名对手在同一跑道上进行竞争,他们的策略和机动水平通常是同类竞赛所没有的。

项目地址:

Game of Drones at NeurIPS 2019: Simulation-based drone-racing competition built on AirSim

创建适合所有人的人机交互

在ACM CHI关于计算系统中的人为因素的会议上,微软研究人员展示了一些论文和演示,探索如何为有认知或感觉障碍的用户提供可访问性。

这些研究包括:浏览器的“阅读模式”是否真的对患有阅读障碍的人有帮助,以及帮助低视力的人(包括亮度敏感度和低视力)更容易接触到VR的工具。

还展示了微软的Soundscape,这是一个使用3D音频提示来增强态势感知和辅助导航的项目。

项目地址:

Features

此外,还有一些使虚拟环境更加真实、可触摸和可导航的项目。

△微软Dreamwalker VR

Dreamwalker是一个虚拟现实项目,可以通过虚拟现实增强真实世界的行走体验。虚拟环境可以实时检测用户周围的环境,并生成一个虚拟世界,说明他们的路径和任何障碍。

项目地址:

DreamWalker: Substituting Real-World Walking Experiences with a Virtual Reality

安全、存储、系统和应用方面的突破

同态加密技术的发展和采用在2019年取得了持续的进展。同态加密技术可以在加密数据上进行计算,有助于保护隐私。

Microsoft SEAL已经成为世界上最流行的同态加密库之一,在学术界和工业界都得到了广泛的采用。

项目地址:
https://github.com/Microsoft/SEAL

今年4月,随着EverCrypt的发布,Project Everest又向前迈进了一步,建立了一个安全认证的HTTPS生态系统。

其中,EverCrypt是第一个完全认证的密码提供商,满足了TLS协议的安全需求。Project Everest是微软、Inria和卡内基梅隆大学的合作项目。

项目地址:

EverCrypt cryptographic provider offers developers greater security assurances

到2023年,预计将有超过100 ZB的数据存储在云里。

为了满足这一需求,Project Silicon正在开发第一个从媒体设计到云计算使用的存储技术。

项目地址:

Project Silica

今年,这个团队与华纳兄弟公司(Warner Bros.)合作进行了一项概念验证,把1978年的电影《超人》(Superman)装在一块几乎坚不可摧的玻璃上,大小和杯垫差不多。

项目地址:

Optics for the cloud: storage in the zettabyte era with Dr. Ant Rowstron and Mark Russinovich

与此同时,今年4月,微软和华盛顿大学的研究人员实现了一个“Hello, World!”,他们展示了首个以人工合成的DNA存储和检索数据的全自动系统。

项目地址:
https://news.microsoft.com/innovation-stories/hello-data-dna-storage/?utm_source=elevate&utm_campaign=1385

剑桥大学的研究人员 Andy Gordon 和 Simon Peyton Jones 通过探索编程语言研究如何改进电子表格这一世界上最常见的商业应用,展示了基础研究的实际影响。

在下面的项目中,他们详细介绍了他们与Microsoft Excel团队的合作是如何改进产品的,比如单元格可以包含与外部数据源链接的一级记录,以及可以计算“溢出”到相邻单元格的数组值的公式。

项目地址:

Influencing mainstream software—Applying programming language research ideas to transform spreadsheets

在 ACM 网络搜索和数据挖掘国际会议上,微软的研究人员展示了一项关于极端分类的新研究。

极端分类是一个研究领域,有望显著提高算法的速度和质量。这项工作可以带来更多相关的推荐和搜索结果。

在下面这篇二月份的博文中,印度微软研究院的 Manik Varma 对极端分类进行了深入探讨。

项目地址:

Everything you always wanted to know about extreme classification (but were afraid to ask)

由于计算机视觉技术的进步,尤其是视频目标检测和分类技术的进步,视频分析已经变得更加精确。

然而,快速而实用的实时视频分析却相对滞后。

去年12月,微软研究人员 Ganesh Ananthanarayanan 和 Yuanchao Shu 主持了一个关于 Project Rocket 的网络研讨会,这是一个可扩展的软件栈,利用边缘和云来满足视频分析应用的需求。

项目地址:

Live Video Analytics

为研究社区提供开源工具和数据

在这一年中,微软的研究人员为了学术界的利益,做了一些开源项目,包括以下内容:

SandDance:是 Azure Data Studio、 Visual Studio Code 和 Power BI 中的数据可视化工具。
地址:https://cloudblogs.microsoft.com/opensource/2019/10/10/microsoft-open-sources-sanddance-visual-data-exploration-tool/

TensorWatch:是一个人工智能调试和可视化工具。
地址:https://www.microsoft.com/en-us/research/blog/microsoft-makes-ai-debugging-and-visualization-tool-tensorwatch-open-source/

PhoneticMatching:是 Maluuba 自然语言理解平台的一个组成部分。
地址:https://www.microsoft.com/en-us/research/blog/a-phonetic-matching-made-in%cb%88h%c9%9bv%c9%99n/

SpaceFusion:是一个学习范例,它将不同的深度学习模型汇集到一起,用于人工智能对话。
地址:https://www.microsoft.com/en-us/research/blog/spacefusion-structuring-the-unstructured-latent-space-for-conversational-ai/

Icecaps:一个会话建模工具包。
地址:https://www.microsoft.com/en-us/research/blog/microsoft-icecaps-an-open-source-toolkit-for-conversation-modeling/

Icebreaker:一个深层次的生成模型,最小化训练一个机器学习模型所需的数据量和成本。
地址:https://www.microsoft.com/en-us/research/blog/icebreaker-new-model-with-novel-element-wise-information-acquisition-method-reduces-cost-and-data-needed-to-train-machine-learning-models/

基于去年发布的Microsoft Research Open Data(一个基于Azure的数据共享库),公司开发了一套数据使用协议,并在GitHub上发布,可将其应用于多个公共数据集。

支持和尊重研究团体

今年,微软研究院推出了Ada Lovelace奖学金,用来支持计算机相关领域攻读博士学位的人才。

有关他们的研究可以访问下面的链接:

Ada Lovelace Fellowship

10名博士生还获得了为期两年的奖学金(作为博士奖学金项目的一部分),用来支持他们在光子学、系统和网络以及人工智能方面的研究。

此外,微软研究院将奖学金授予了五位从事高影响力突破性研究的教师。

有关他们的研究可以访问下面的链接:

Investing in leading minds—Microsoft Research Faculty Fellowship

微软研究院的研究人员在本年度获得了许多奖项和荣誉,完整名单如下:

Awards

最后,要和沈向洋博士说一声再见。

沈向洋博士已经在微软就职23年,将于明年2月份离职。

传送门

微软研究院博客:

Microsoft Research 2019 reflection—a year of progress on technology’s toughest challenges

版权所有,未经授权不得以任何形式转载及使用,违者必究。