29岁MIT博士小姐姐努力6年、处理半吨硬盘数据,“洗”出人类第一张黑洞照片
少不了机器学习的功劳
黑洞栗 郭一璞 发自 凹非寺
量子位 报道 | 公众号 QbitAI
人类第一次看到黑洞照片之后,一名小姐姐的照片也跟着刷了屏。
她激动得十指交叉,身边的电脑屏幕上,黑洞的样子模糊显现出来,一行行代码在旁边滚动。
在Facebook上发出这张照片时,小姐姐说:
看着我做的第一张黑洞照片一点点“洗”出来,真是不可思议。
“我做的第一张黑洞照片”?
对,全人类看到的第一张黑洞照片,就是她“做”的。
这位小姐姐名叫Katie Bouman (凯蒂 · 布曼) ,今年29岁。她带领算法团队“洗”出了这张照片,也成了第一批“看到”黑洞的人类之一。
人类“拍”到的第一张黑洞照片,并不是像我们拿手机拍照那样,点下屏幕就好,而是需要分布在全球各地的许多天文望远镜在同一时间“按下快门”,记录无线电数据。
然后,再依靠机器学习算法,把数据拼到一起,重建出图像。而这个“洗照片”的任务,就是凯蒂在MIT读博时做的项目。
搞定半吨硬盘
六年前,凯蒂开始了她在MIT CSAIL的博士生涯,想要研究“如何看见或者测量肉眼看不见的东西”,黑洞简直是再合适不过的研究对象了。因此,她加入了EHT(事件视界望远镜)团队。
凯蒂的本科读的密歇根大学的电气工程,硕士读的是MIT的电气工程和计算机科学专业,可以说,对于天文方面,她当时一窍不通。
就这样,她开始研究“把多台天文望远镜获得的数据合成一张黑洞照片”的算法。
一搞就是三年的秘密工作。在2016年之前,这个项目一直是保密的,小姐姐研究这么激动人心的项目,却憋着不能说,连自己的家人都没告诉。
而且直到2017年6月,凯蒂的算法才终于可以开始实战。她收到了一堆装着黑洞观测数据的硬盘:
这些硬盘足有半吨,从世界各地用飞机运来。数量之大,甚至让人联想到1969年玛格丽特·汉密尔顿为阿波罗11号登月而准备的一人高的代码。
这些硬盘中的数据,来自智利、夏威夷、南极洲、亚利桑那、西班牙、墨西哥六个地方的一共八台天文望远镜。
天文望远镜获取的数据量非常大,一晚上就能收集到2PB(约2000TB)。如此庞大的数据难以用网络传输,必须装到硬盘里,空运到MIT。
而且,这半吨硬盘里的数据不仅仅是黑洞,还包含天空中的各种复杂、凌乱的数据,凯蒂要靠这些数据,拼出一张完整的黑洞写真。
本来,根据射电望远镜数据还原天体图像需要人类天文学家参与。他们以自己的专业知识,将成像算法指引到他们认为正确的方向。
然而面对PB级稀疏、嘈杂的数据,想靠人力从中找出图像太难了。于是,他们使用了机器学习方法。
虽然这支团队已经花了好几年的时间构建算法,在合成数据上实验,但直到有了这些硬盘,他们才能真正知道他们的算法,是不是真的能捕捉到不可见的黑洞。
这项任务究竟什么样?
就好比,你把一颗鹅卵石扔进池塘,却还想看到它的样子。
一石激起的涟漪
入水的瞬间,石子会激起一圈一圈的涟漪。
只要这些涟漪,就算石子沉到水下,也依然可以通过算法重现它的模样。
黑洞,就像是这颗已经看不见的鹅卵石。
不同的望远镜收到的两股无线电波相遇,就起了涟漪,学名叫做“干涉”。
而凯蒂提出的CHIRP算法,便是依靠干涉来重建黑洞的。
具体来说,从银河中心传来的无线电信号,到达两台望远镜的时间是不一样的,干涉也是这样发生的。
所以说,重建黑洞照片,最重要的就是时间差。
可是,地球有厚重的大气层保护着,无线电波穿过大气层的时候,速度会变慢,时间的测定也就不够准确了。
所以,小姐姐想出了一种机智的方法,来解决这个问题:
如果每一个测量值,都是三台望远镜 (不是两台) 相乘的结果,大气带来的误差就能相互抵消了。
这样一来,算法有了,团队便开始“冲洗”黑洞的照片了。
一洗就是两年
半吨硬盘的数据量处理起来,工程量还是太大了。
洗照片的过程中,一度有四个团队同时工作,每个团队负责分析一部分数据。
原本预计一年洗好的照片,花了两年时间才让世界看到。
除了耗时之外,小姐姐也说过,团队就是一口大锅,里面有天文学家,物理学家,数学家,工程师……如果不是这样,也不可能完成这个从前看来不可能的任务。
而她的工作,是在照片终于合成成功并公布之后,凯蒂终于可以告诉全世界,合成第一张黑洞照片的意义:
这是我们了解黑洞的一个窗口,从这里开始,我们验证了我们的物理规律。虽然我们已经靠理论推断出黑洞的样子,但只有亲眼所见才能验证,因此,看到黑洞图像也是巨大的科学进步。
现在,凯蒂早已博士毕业,继续在MIT的EHT项目做了一段时间的博士后之后,即将成为加州理工学院的助理教授。
庞大的团队
除了凯蒂之外,整个团队还有很多人,他们来自各种各样的领域。
凯蒂在2017年的TED演讲中分享了团队的核心成员名单,包括:
Sheperd Doeleman
哈佛大学黑洞计划观测助理主任
Andrew Chael
哈佛大学黑洞计划研究生
Lindy Blackburn
哈佛大学黑洞计划射电天文学家
Michael Johnson
哈佛 – 史密森尼天体物理中心研究员
Katherine Rosenfeld
哈佛 – 史密森尼天体物理中心研究员
Hotaka Shiokawa
哈佛 – 史密森尼天体物理中心博士后
William T. Freeman
MIT计算机科学与人工智能实验室教授
Vincent Fish
MIT Haystack天文台研究科学家
Kazumori Akiyama
MIT Haystack天文台博士后
Daniel Zoran
DeepMind研究科学家
传送门
最后,如果你对他们所用的算法感兴趣,可以读一下这篇论文:
Computational Imaging for VLBI Image Reconstruction
https://dspace.mit.edu/handle/1721.1/103077
— 完 —
- SQuAD风云:AI对鲁迅作品的理解超过我了?别激动……2018-01-20
- 马云正式卸任后,阿里巴巴开盘跌0.87%2019-09-10
- 亚马逊在华拓展云计算团队,挑战阿里巴巴和腾讯2019-10-16
- AI独角兽云知声,已完成一期科创板IPO辅导2019-10-17