你好,游客 登录
背景:
阅读新闻

现有人工智能都是二流的

[日期:2017-11-06] 来源:量子位  作者: [字体: ]

目前在用的所有人工智能都是二流的,就像一个愚蠢的蜥蜴大脑,对世界的复杂性一无所知。所以,它才需要大量的数据。我们想要构建的更像是哺乳动物的大脑。

说出这番话的,是哈利·瓦尔普拉(Harri Valpola),44岁,人工智能创业公司The Curious AI Company创始人。

△ 哈利

对目前人工智能进步速度充满失望的哈利,有着似乎遥不可及的目标:他做梦都想创造一个思维互联网,一个由相互连接的人工智能组成的互联网。

“从我们的角度来看,它就像一个巨型大脑。”他说。

他创立的Curious AI位于芬兰赫尔辛基,有20名员工,刚刚获得了367万美元融资。这样的数字和众多科技公司相比简直不足挂齿,但考虑到这家公司什么实际产品都没有,完全着眼于研究,可以算是一笔不小的投资。

给一家不接地气的研究所,投入几百万美元,背后有什么道理可讲?

公司投资者Balderton Capitald的合伙人Daniel Waterhouse说,他们寄希望于研究的过程中可能出现一些产品和商业机会,而且,哈利也已经组建了世界级的团队。

在这种语境下,“世界级”意味着具有学术天赋的人才。

哈利自己,就有着无可挑剔的学术背景。他是芬兰神经网络先驱Tuevo Kohonen的学生,曾在阿尔托大学(Aalto University)研究人工大脑长达20年。

但是,直到2007年离开学术界,将自己的理论应用到现实问题中的“脏数据”时,他才意识到自己的研究中缺少什么。

未成功的革命

哈利想将20年的理论研究付诸实践,为它们找到用武之地。

于是,他参与创立了ZenRobotics,一个专门为智能机器人开发“大脑”的创业公司,想要在人工智能领域掀起一场革命。

△ ZenRobotics

不过,“掀起革命”只是创业之初的“计划”,面对种种残酷的物理现实,实验室里效果一流的技术难以应对。

他们遇到的第一个问题是数据。

在计算机模拟的环境做研究时,机器人可以“看到”周围的一切。但放到公司的业务上,就需要让机器人在混乱而复杂的物理世界中工作,遇到的都是派不上用场的“脏数据”,可见度远没有那么高。

第二个问题,是以往训练机器人的方式并不可取。

在模拟环境中训练机器人,总是要运行上百万次测试来找到有效的方法,但这在现实世界中根本行不通。

就像它们的造物主——人类一样,现实世界中的机器人行动迟缓,拥有笨重的形体。还没来得及发展出什么技能,就被禁锢在了反复的日常之中。

走出象牙塔的哈利终于认识到:“在现实世界中,交互是一种非常稀缺的资源。我做出不少惊人结果的那些技术,都局限在模拟环境里。”

革命是掀不起来了,ZenRobotics改变方向,为机器人找了一个更简单的目标:从工业废料中筛选有用的原材料。

找到新目标的ZenRobotics融资1100万英镑,还吸引了一批全世界规模最大的回收公司,但是,哈利还是很失望。

解决数据问题

2015年,哈利揣着原本的梦想离开了ZenRobotics,想再试一次。

于是,就有了Curious AI。

△ Curious AI的三位联合创始人,从左到右分别为:CTO Antti Rasmus、CEO Harri Valpola和COO Timo Haanpää,还有一位联合创始人Mathias Berglund没有出现在照片中

在这家新公司,哈利和他的同事们解决了在ZenRobotics遇到的很多难题。

首先,是数据上的困难。

哈利的应对方法很简单:“清洗脏数据的最佳方法,就是让电脑去做。”在他2015年发表的一篇论文中,描述了一个“阶梯网络(ladder network)”,这种神经网络可以通过向结果中注入噪声的方式,来训练自己应对复杂的情形,就像老师在测试中故意留下错误,借此让学生保持警惕一样。

借助这个阶梯网络,电脑即使没有大量预先标记的样例,依然可以进行学习。业内人士将这类技术称作“半监督式学习”。

在用业内常用的基准数据集MNIST测试时,哈利等人的系统只使用了100个经过标记的训练样例,却准确识别了几乎99%的图像。顶尖计算机科学家称赞其“令人印象深刻,具备顶尖水准”。

这篇论文的题目是Semi-Supervised Learning with Ladder Networks,感兴趣的同学可以去arXiv阅读:https://arxiv.org/abs/1507.02672

哈利继续开发这项技术,想把它用到更多的数据集上。在今年的NIPS会议上,他会展示这个阶梯网络的“堂弟”,名叫“刻薄的老师”(Mean Teacher)。

这一次,他们改进了原来的系统,用来自谷歌街景的房屋编号图片进行测试,结果显示,效果超过了之前的程序,而使用的训练样例甚至更少。

“我在论文中看到的结果很好,半监督式学习仍在继续改进,还打破了另一项纪录。”蒙特利尔大学计算机科学教授Yoshua Bengio说,他是深度学习领域的领军人物之一。

“刻薄的老师”论文标题很长,它叫做:Mean teachers are better role models: Weight-averaged consistency targets improve semi-supervised deep learning results,感兴趣的同学还是可以去arXiv:https://arxiv.org/abs/1703.01780

 

不再依赖试错

哈利在ZenRobotics还遇到了另一个问题,那就是人工智能对试错法的依赖。

目前最先进的人工智能系统要找到解决问题的正确方法,需要运行上百万次测试。

这种模式在视频游戏中效果很好,系统可以在里面尝试数十亿种不同的场景,逐渐了解哪些方式能够奏效。

但在物理世界里,就没这么简单了。

哈利说,为了让机器人顺利学会解决现实世界中的问题,人工智能需要具备根据相对较少的信息进行推理的能力:完成人类所谓的“规划”任务。

可问题在于,虚拟神经网络并不擅长这种任务。让一个深度学习系统快速给大熊猫、长颈鹿分类打上标签,是很容易的。但如果你问:“你会把什么样的图片标记成熊猫?”它就不知所措了。

人类,和不少其他动物,都很擅长这样的推理。比如说你为了换灯泡,可能会纠结一下拿椅子还是拿梯子,但你一定会为了这个结果,在意识中描绘出整个方案。

但对于现在的人工智能来说,它们顶多会在看到你站在梯子上、手伸向灯泡的时候,推断出你要换灯泡。但怎么换、分几步,人工智能没法转过头来做规划。

“要制定任何智能决策,这一点都至关重要。”

哈利说:“我们已经解决了这个问题。我们可以调用能够生成自然语言的神经网络。我们的AI可以为了达到一个目标,进行一些活动。”

这项研究还没有公布,但哈利说也快了。

真正的思维互联网

△ Curious AI的研究方向

当然,对哈利来说,解决这两个问题只是前奏。在真正创造出思维互联网之前,他不会满足。

这一次,他的方案仍然来自于对人类思维流程的模仿,尤其是“相关性推理”。

什么是相关性推理呢?低头看看你的手。为了理解它的存在,你会把它和其它对象关联起来,比如说你的另一只手、身体的其它部位、房间里的物品等等。

而神经网络看待世界的方式截然不同。要理解一只手,你得给它拍一张照片,将其分解成一个个的像素。然后,神经网络会查看像素,为每一个区域分配一组数字,也就是根据它们和不同物体的相似程度来打分。

这样的过程,让它可以认出物体的特征,但却不明白哪个特征属于哪个物体,也不知道物体之间如何相互关联。

正因如此,它才需要那么多数据:它无法推断关系,因此每次都注定要重新学习新的环境。

哈利说,从本质上来看,神经网络就无法真正了解哪些东西与哪些东西结合在一起构成了一个物体。而没有这种能力,人工智能根本掀不起什么风浪。

很多业内专家都认同这种观点。

“我见过哈利几次,我们对人工智能和机器学习持有相似的观点。”帝国理工学院认知机器人教授Murray Shanahan说,“我认为他是对的。”

Bengio则补充道:“我自己也启动了一个有着相似目标的研究项目。从我们在感知上取得的突破发展到更高层次的认知,是未来进步的重要元素。”

问题是,如何进步?

Alphabet旗下人工智能研究部门DeepMind最近发表了两篇论文,阐述了如何使用神经网络来应对这种挑战

但哈利对此有些不屑。“我做这项工作已经很长时间,大约8年前,我们就开始从事跟他们发表的论文很相似的工作。我们做过尝试,但没用。”

哈利说,根本没用的原因是它仍然基于割裂的信息组成的数字模型。他认为,想要克服物体之间的关系问题,人工智能就需要具备处理连续数据信号的能力——具有讽刺意味的是,这意味着人工智能需要变得更加模拟化(analogue)。

“这是人类学习的基础。”瓦尔普拉说。也是他想打造的“哺乳动物大脑”的关键所在:“这种大脑与当前的深度学习具备相同的感知能力,但除此之外,还具有与生俱来的符号处理和模拟推理能力。”他不肯透露具体的方式。“这是机密。”但他从刚踏入学术界就开始研究这个课题。

“第一批原型是10年前做的。我们一直在做这件事情。所以我们正在开发互动更加丰富的神经网络。我认为人们还没有意识到其中蕴含的意义。但我认为,未来一年,我们会在这个领域实现很有趣的发展。”

未来

思考如何让人工智能理解关系,也有助于我们预测它们究竟会变成什么样子。

哈利对于人工智能可能所引发的各种伦理问题一笑了之。相反,他认为人工智能会把自己视作一个与其他智慧生物相连的复杂关系网络的一部分:

不只是作为思维互联网组成部分的人工智能,还包括人类智能。无论是好是坏,它们都将具有社会性。

 

“我们目前开发的人工智能将具备一个很好的模型,”瓦尔普拉说,“不仅会做回形针,还能了解人类在思考什么。有个老掉牙的问题:如何过上好的生活?我认为人工智能可以理解这个问题。”

“在第一波人工智能时代,你必须是程序员。到了第二波,你必须是数据科学家。到了第三波——你的品行越端正越好。”

原文地址:http://www.wired.co.uk/article/harri-valpola-curious-ai-artificial-intelligence-third-wave

— 完 —

收藏 推荐 打印 | 阅读: