神刀安全网

最强起底“阿尔法狗”前世今生,后世的创业狗们加油

最强起底“阿尔法狗”前世今生,后世的创业狗们加油

DeepMind伦敦总部。

钛媒体注:在周二4:1击败李世石之后,韩国棋院给AlphaGo(阿尔法狗)颁发了一张名誉九段证书,并且给出了一个让人瞠目的世界排名——世界第二,仅次于柯洁,积分也仅比柯洁的3621分少了35分而已。

20年前,1997年5月11日,IBM的电脑“深蓝”在6轮比赛中以2胜1负3平的成绩打败了当时的国际象棋冠军卡斯帕罗夫,这一新闻席卷了当时的各大报纸头条。许多人工智能专家预言,电脑在围棋比赛中也可以打败人类,但至少得等到几十年之后。

而今仿佛历史重演,AlphaGo(下文均称阿尔法狗)打败世界围棋冠军李世石的报道又铺天盖地而来,但这次显然更让人们震惊,因为才过去短短20年,阿尔法狗就在人们公认的最复杂的棋类游戏中以4:1的成绩战胜了韩国围棋第一人。(你说还有我朝国粹麻将?亲爱的你真是钛搞了。)

不管下一战结果如何,阿尔法狗也都已经写入传奇。它究竟是谁,它是如何诞生的,如何长大的,它有缺陷吗,它的缔造者又是谁,后阿尔法狗时代,它又将给创业狗们带来多少机会,钛媒体英文团队历时多日,深度挖掘,起底这只让人类惶惶不安的“阿尔法狗”。

一家人才汇聚的公司

在伦敦国王十字车站后的一座六层大楼里,几个房间以阿兰·图灵、达芬奇和尼古拉·特斯拉等巨匠命名,这里就是精英汇聚的DeepMind总部,人们安静地进行计算,朝着DeepMind的二十年发展大计前进。

DeepMind的联合创始人兼CEO德米斯·哈萨比斯(Demis Hassabis)向来把DeepMind视为一项人工智能领域的阿波罗登月计划,乃至是研发原子弹的曼哈顿计划,“100名科学家,来自40个国家,一起尽可能快地实现一项具有远见卓识的事业。”

“在其他一般的创业公司里,我们的一名高级研究员就能撑起(他们的)一家公司。”

这并非大放厥词,DeepMind内部人才济济的程度可能远超你的想象。这家人工智能先驱公司的成就并非仅凭哈萨比斯一人之才撑起来的。大卫·希尔文(David Silver)的个人网站上列出了29篇已发表的研究文章;艾利克斯·格雷福斯(Alex Graves)曾跟谷歌的AI专家吉奥夫·辛顿(Geoff Hinton)一起研究神经网络;瓦拉德·尼(Vlad Minh)也在辛顿的指导下完成了机器学习的PhD学位。阿尔法狗的胜利乃至DeepMind的发展,离不开这些籍籍无名的幕后功臣。

其他年轻创业公司大多雇佣二十多岁的年轻人,而DeepMind不同之处在于,这里的员工平均年龄为三十多岁,绝大部分成员都有一个甚至多个博士学位。根据哈萨比斯的说法, DeepMind的伦敦办公室比谷歌“稍微更复杂老到一些”。这里没有倒在坐垫上睡觉的程序员,只有“严肃的沙发供(大家)严肃地思考。”

全能的超人CEO

当然,身为CEO的哈萨比斯自有其过人之处,他在少年时期就是神童。跟他们办公室以之命名的达芬奇一样,哈萨比斯也是这样一位全能型人才。他在13岁的时候就成了国际象棋大师,多次参与Mind Sports奥林匹克竞赛,主办方形容他“或许是史上最优秀的选手”。五次拿到Pentamind国际象棋锦标赛冠军、玩腻了西洋棋之后,他开始自己开发游戏,和游戏开发公司牛蛙公司(Bullfrog)和狮头公司(Lionhead)一同开发了《主题公园》(Theme Park)和《黑与白》(Black&White)等几款具有强烈AI色彩的游戏。棋赛经历为日后的职业生涯定下了两个让他始终魂牵梦萦的问题:

大脑是如何学会掌握复杂任务的?

电脑也能做到同样的程度吗?

1994年,他到剑桥攻读计算机科学,但很不满意一些老师所教的狭义人工智能,也就是让程序员给数据“贴标签”,计算机才能理解信息,乃至有一次当面离开老师的讲堂。就在那个时期,哈萨比斯决定创立DeepMind这样的机构,当时将其模糊地定位为研究项目与科技创业的融合体。

“事实上我的整个职业生涯,包括我开发游戏的时候,都是为了最终成立AI公司。少年的时候我就决定,AI会是最有趣和最重要的事业。”

——2015年1月,《连线》主编Steven Levy专访哈萨比斯

哈萨比斯曾说,他当时就知道这会是一项长达二十年的计划。首先,他需要得到足够的经验才能成立一个理想团队,因此在1998年先成立了游戏工作室Elixir,开始在商界摸爬滚打。2005年,28岁的他重返校园,在UCL拿到了认知神经科学的PhD学位。2011年,他终于跟谢恩·雷格(Shane Legg)和穆斯塔法·苏雷曼(Mustafa Suleyman)共同创立了DeepMind,并在此后的2014年1月接受谷歌出价四亿英镑的收购,至今还是谷歌在欧洲最大的一起收购案。

“我开始思考DeepMind——那是2004年——但我认识到,我们还没有足够的资源来快速前进。(当时)深度学习还没出现,计算能力还不够强大。 所以我就去看我的PhD应该研究什么,然后觉得研究神经科学比AI好,因为我想学习全新的一套观点,而我已经认识世界一流的AI人才了。

——2015年1月,《连线》主编Steven Levy专访哈萨比斯

在接受谷歌收购的时候,DeepMind在一点上毫不妥协——总部要继续留在伦敦。哈萨比斯认为,“如果你从剑桥拿到PhD毕业,想干点改变世界的科技,(除了伦敦)没啥别的选择,而硅谷的机会遍地都是。 但是如果你关注的是长期目标,硅谷可能就是泡沫——人们总是希望下一秒创造出另一个Snapchat,整个体系里有很多噪音。”

哈萨比斯决定接受谷歌邀约的原因也很简单:为了更好地搞研究。投资了DeepMind的马斯克向谷歌CEO拉里·佩奇(Larry Page)介绍了这家决定专攻AGI的公司,几个月后,当时的谷歌高级副总裁阿兰·尤斯塔斯(Alan Eustace)就给哈萨比斯发了邮件,邀请他与佩奇会面。

“我们协商了一年。选择谷歌的原因,一个是文化上双方很投契,另一方面在于佩奇自己也非常热衷于AI。”哈萨比斯说。一开始,他就希望把DeepMind建立成人工智能界的谷歌。然而创业三年,他花了大量时间募集资金,只有10%的时间能够投入研究。他意识到,这样下去即使花费一生的时间也建不成谷歌,别说解决AI问题了。这时候佩奇告诉他:“我花了15年建立谷歌——你为什么不直接来利用我们现有的机会呢?”

“谁都不会拒绝谷歌的邀约。”

他们到底想干什么?

DeepMind网站上挂出的公司的愿景很简单,“解决智能问题(solve intelligence)”。根据哈萨比斯的描述,他们真正要攻破的是通用人工智能(AGI,artificial general intelligence)。他的目标不在于让机器理解语言、识别人脸或是声音,而是通过机器学习和系统神经科学让网络学会自己决策,就像人类一样。

“AI的梦想是让机器变得聪明。今天的大部分AI都是关于给机器编程的。我们的方法是给它程序,让它能够自己学习。这要远为强大;这就是生物学习的机理。”

另一名联合创始人、现应用人工智能主管苏雷曼曾在去年六月的伦敦机器学习大会上就曾公开介绍DeepMind。“我们的系统是自主学习的,没有预先的编程,也没有手动操作。我们给算法提供尽可能大量的原始信息,让系统自己学习,学会采取行动、分类或预测。”

“我们设计的系统本质上是通用的。也就是说,同样的系统能够用来完成大量不同的任务。”

最强起底“阿尔法狗”前世今生,后世的创业狗们加油

DeepMind联合创始人穆斯塔法·苏雷曼。图片来自Wired UK。

DeepMind专攻的是深度学习和强化学习研究,这些技术能让机器自己进行大量学习。被谷歌收购之前,DeepMind团队已经搭建了一些会玩经典雅达利视频游戏(比如,Pong,Breakout以及Space Invaders)的系统。 人工智能之父马文·明斯基曾提出一个假设:人类与机器之间并没有真正的区别。人类实际上也是一种机器,大脑由许多半自治但很愚蠢的“代理”(agent)组成,而“不同的任务需要完全不同的机制。” 根据苏雷曼的描述,DeepMind的测试机制也是让系统中的“代理”从原始数据中学习并找出最优方法、得到最大产出。

强化学习将系统能做的事情向前推进一步。一旦搭建起一个很善于玩游戏的神经网络,你就能让它和自己对战。随着两个版本的神经网络彼此对阵数以千计次后,系统就能追查出哪些招数回报最高——也就是说,得分最高——并以这种方式学会以更高的水平玩游戏。再次重申,这种原理同样适用于其他决策。

阿尔法狗的开发使用了这一切成果,而且还远不止此。Hassabis和他团队添加了一个二级“深度强化学习”,预测每一步的长效成果。他们还采用了过去驱动围棋游戏人工智能系统的传统人工智能技术,包括蒙特卡洛树搜索。借鉴新旧技术,他们搭建起能够击败顶级职业选手的系统。

AI的应用前景有多广?

哈萨比斯表示,五年以内,DeepMind能够让我们的日常工具更聪明、适应能力更强,“更好地搜索,更好地理解你的意图——你大可以含糊其辞,它也能够明白你到底想干什么。”而在二十年之内,“科学界当然会获益,无论是药品研发还是蛋白质折叠,任何需要大量探索的领域都可以……可能就有AI科学家在《Nature》上发表文章了。”

“气候,疾病……有了AI的协助,科学就能够加快发现新知的过程。”

人工智能潜在的应用领域非常广泛,包括医疗健康、智能手机助手和机器人技术等。围棋大赛几周前,DeepMind已和英国全民医疗服务(NHS)达成伙伴关系,准备开始建立可以运用机器学习的平台。医疗方面的人工智能通常应用于医疗诊断图像、生命特征的长期纵向追踪、自我量化及帮助人们建立更健康的生活方式,而阿尔法狗的强化学习能力刚好非常适合应用于这些方面。

赢了李世石不过是通往下一个里程碑的开始。DeepMind团队已经把目光继续放在游戏上,而星际争霸可能就是他们投入应用的第一个游戏。不过,星际争霸跟围棋是截然不同的两回事,要求玩家基于有限的信息做出决策。同样的道理,智能手机和围棋游戏需要学习的东西完全不同,DeepMind公司在接下来的几个月里要尝试开发阿尔法狗的算法,让程序在无人预定学习起点的情况下完全进行自主学习,也就是从零学起。这将成为一种“纯学习”模式,完全脱离人类的监控。

相比佩奇对DeepMind、对AI的浓厚兴趣,哈萨比斯认为同样在开发AI的Facebook更多地把它作为工具;毕竟,Facebook的目标是连接世界,而DeepMind的目标就是AI本身。话虽如此,哈萨比斯还是预计,在未来2至3年内,人们就能开始看到在智能手机助手方面的变化,比如可以用来改进语音搜索、定义Youtube的视频推荐、控制谷歌的无人驾驶汽车等。现在,DeepMind已将核心系统应用在谷歌的语音识别中,“Tool AI”(深度学习网络)应用于欺诈检测、图片搜索、街景识别、谷歌翻译等。

AI是福还是祸?

不过,“我认为人工智能就跟其他强大的新科技一样……不负责任地利用就可能带来害处。”哈萨比斯接受BBC采访时表示。他也十分关注其他业内人士对AI的担忧,比如投资了DeepMind的马斯克,比如认为AI可能“终结人类”的霍金。

因此,DeepMind内部成立了道德与咨询委员会,成员均为科学和哲学领域的顶尖人物,他们会对DeepMind的研发成果进行监管,不过跟马斯克不同的观点在于,哈萨比斯要求现阶段保持隐私、不对外公开,因为“不想因为人们在Twitter等社交媒体上的意见而选择妥协”、“此前从未有这方面的尝试,因此在被强加上公共监督的枷锁之前,我们还有许多探索性的工作要进行。”

苏雷曼的态度则更为乐观。他认为,过分悲观乃至恐惧的态度对AI的发展毫无助益,从前人们担心的是AI研究会不会失败,现在却反而担心AI太成功会给人类带来恶果。

“研发AI是用来加强人类能力,而不是毁灭我们自己。”

现在,有一点起码可以放心,就是DeepMind坚持所有成果不会用于军事或情报搜集用途。

但是,显然研究AI的不只谷歌一家。事实上,相当多的互联网巨头都开始大量投资人工智能领域并争夺人才。

前文提到的Facebook,其实在谷歌向DeepMind抛出橄榄枝时就对后者产生兴趣。现在,在纽约大学终身教授、“深度学习”专家Yann LeCun的带领下,Facebook人工智能实验室正蓬勃发展。

微软研究院大概是商业公司内少数纯以学术为目的的研究机构了,在旧金山的Build 2015开发者大会上,微软提出一组称为“Project Oxford“的技术,让开发人员通过微软云计算平台Azure开发并实现图像理解、人脸识别、语音识别与合成等功能。

代表IBM在认知计算领域最核心的技术Watson也是一个强大的AI平台。2011年2月,Watson在美国问答节目《Jeopardy!》上战胜两位冠军选手,被认为和“深蓝“战胜卡斯帕罗夫一样,是人工智能历史的一个里程碑。随着IBM转型为认知解决方案与云平台公司,Watson的商业化价值日益显现。

除了自家的公司,扎克伯格和投了DeepMind的马斯克一样,都跟投了声称要“复制大脑皮层“的人工智能公司Vicarious。百度也并非像大家吐槽的那样只做外卖,它的超级计算机Minwa有着全世界一流的图像识别能力。

后阿尔法狗时代,创业狗该怎么走?

毫无疑问,在这场全球大秀之后,人工智能又将成为下一个创业风口。然而创业向来是“行百里者半九十”,大浪淘沙之后,怎样的人才能留在历史舞台?

去年二月份,哈萨比斯回到剑桥大学做了一个演讲,分享公司的成立故事和他对深度学习算法的研究、对人工智能的看法、以及身为创业者的经验。

最强起底“阿尔法狗”前世今生,后世的创业狗们加油

在剑桥演讲的哈萨比斯。图片来自cutec.org。

1. 你不需要比世界领先太多,五年就够了

创业需要新颖和智慧,持续学习和改进能够帮助你找到自身的优势所在。此外,在主科之外进行跨界能够打开视野,让你脱颖而出,就像哈萨比斯结合计算机和认知神经科学一样。不过,比一般人领先五年左右就好了,因为你需要让他们理解你的技术与愿景。

2. 充满热情,热爱你的目标

开始创立新事业,尤其是一些乍一看遥不可及的目标时,你必须充满热情、持续前进、保持领先,因为一旦势头停下来,你就很难继续鼓励你的团队乃至你自己,也就更难募资了。

3. 要在短期内多拿一些投资

在DeepMind之前的创业项目中,哈萨比斯也跟普通人一样,经历了几轮融资。但是到了DeepMind,他采取了完全不同的策略,就是不断寻找更多的投资,而不满足于某一轮融到多少钱,于是很短时间内就确保拿到六千万投资。这不仅能加快实现目标的进程,也是在给团队打鸡血,保证前进的势头。

4. 从懂你的人那里拿钱

许多投资人和VC都希望几年内拿到十几倍的回报,但哈萨比斯知道DeepMind不能做出这样的承诺,他们注定是需要长期投入的研究团队。因此,哈萨比斯找的都是彼得·蒂尔、马斯克、李嘉诚这样的投资人,因为他们懂得DeepMind的使命,深知这场技术革命的巨大影响及其潜在的财务回报。

他们注定要仰望星空,然后脚踏实地。

2015年初,哈萨比斯接受了金融时报记者的午餐采访。当时的他形容自己希望留下一些遗产,“当你问我,下棋的时候赢得比赛对我来说重要吗?非常重要,从实现个人潜力的角度来说的话。 而遗产的重要性在于,终有一天,我希望我的人生能完成一些足够重大的事情,通过技术,我能够给社会带来一些良好、深刻的改变。

(本文首发钛媒体)

转载本站任何文章请注明:转载至神刀安全网,谢谢神刀安全网 » 最强起底“阿尔法狗”前世今生,后世的创业狗们加油

分享到:更多 ()

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
分享按钮