汉山特稿：面对人工智能，人类应敬畏不应恐惧

夺标 · 发表于 2016-4-5 11:34:47

深度学习神经网络的迷幻之梦译者：myia 原作者：KIMBERLEY MOK
发表时间：2016-03-14浏览量：1519评论数：2挑错数：0

如果机器会做梦，那会是一种什么样的情景呢？这是科幻作家和人工智能专家之流一直在探讨的问题。而今，得益于谷歌工程师们的努力，我们对电脑白日梦的情境终于能够一瞥端倪。那些迷幻而扭曲的画面，最近正在网上盛传。生成这些迷幻图像的程序叫做“深梦”（Deep Dream），谷歌日前已公开了其源程序代码。人们开始使用这个程序来处理平凡普通的照片。转换后的结果，取决于不同的视角，有些人认为是充满迷幻的艺术品，而另一些人则认为是扭曲可怖的图像。

人工神经网络的深层梦想

这些光怪陆离的视觉效果来自谷歌人工神经网络（ANN）的图像识别技术。神经网络实际上是一系列基于统计的学习模型，它使用看上去极为简单的算法来模拟生物进化的过程。研究人员训练这些神经网络学习的方法，是给它提供数百万张图像样本，同时逐步调整矫正网络参数，直到得出合意的图像归类。

你可以把这个网络想像成一叠过滤信息的筛子：神经网络通常包括10到30层紧密相联的人工神经元。这些神经元分别被指定为“输入层”、“输出层”、和中间的“隐层”。（在这里，“深度学习神经网络”指的是包含超过五层神经元的系统。）低层输入层的任务是解释图像的基本特征属性，比如图形边缘或角落——这和人类婴儿辨识熟悉面容的隐约轮廓相类。中间层在这些基本特征属性的基础上进一步寻找整体形态。最后，输出层将这些形态整合汇总在一起，形成一个最终诠释，这就是神经元系统辨识图像样本的“答卷”：它究竟描绘的是一所房子、一个动物、还是一个水果。

由于这些系统的非线性属性，研究人员迄今仍然无法回答，到底神经网络经历了一个怎样的过程才能产生出这种梦幻般的输出结果。不过现在已经有些工具能帮助我们破译这个谜团。谷歌在其研发博客中写到：“神经网络研究的挑战之一就是去了解每层神经元的准确功能。我们知道，经过机器学习训练之后，每层神经元能够逐步提取越来越高阶的图像特征，直到最后一层对图像表现的是什么作出最终判断。”

夺标 · 发表于 2016-4-5 11:35:08

逆向致幻技术

为了更好地审视神经网络的内部运作，研究者们决定将整个过程颠倒过来，做一个逆向研究。他们要求机器自由发挥，解释并强化输入的图像样本，以得出某种诠释。通过这个研究，他们希望能了解神经网络在培训学习中究竟学会了哪些特征属性，还有哪些特征没有学会。

接下来发生的事情令人震惊：研究者发现，这些神经网络不但能够识别图像，它们也拥有足够的信息来生成图像，从而产生这些计算思维的惊人呈现。例如，当研究团队以诸如蚂蚁、香蕉、海星等等普通物体为题进行查询，神经网络会生成下面这些相当特立独行的图像。

将图像输入到低层神经元会生成比较柔和婉转的呈现形式，因为它们的识别重心是图形边缘及角落。研究团队表示：“每层神经元处理不同抽象程度的图形特征，因此，如果我们选择强化不同层次的神经元，生成图像特征之复杂性也会有所不同。”

继续深入下去，将图像输入到更抽象的高层神经元之后，尤其是当研究团队要求神经网络“强化所有你所感知到的东西！”的时候，更细致而出人意料的结果便浮现出来。

这样做创造了一个反馈回路：如果一朵云彩看上去有点像只鸟，神经网络会让它变得更像鸟。那么，在接下来的一轮里，神经网络会更有把握辨识出这只鸟来。如此循环往复，一只细节完美的鸟儿就这样从虚空之中冒将出来。

研究团队把这种逆向致幻技术称为“盗梦”——用电影“盗梦空间”来表达深度神经网络那卓有成效的“计算视觉架构”。使用这种技术，神经网络创造出了意想不到的结果：树木化为晶体结构，树叶变成魔幻的鸟虫。从根本上来说：这些由反馈回路促成的“过度诠释”，是神经网络过去学到的抽象而碎片化的图像特征之融合。更令人瞩目的是，从一张最初空空如也，只有些随机波形的图像开始，通过在依次生成的图像上反复使用算法，神经网络可以最终创造出难以置信、丰富多彩的景观。

对这种数据驱动的大面积错视的研究，谷歌这类公司占有独一无二的主导地位。训练大型神经网络需要大量数据。如果说谁能获取超量的数据，同时又拥有无与伦比的计算力，那也只有谷歌才能做到了。这些发人深省的图像看上去奇妙无比，然而，对于人们在此领域的疑问，它们并没有能提供完美的回答，相反却提出了更多问题。问题之一就是：我们可以看出深度神经网络很容易被人误导。反过来说：这些复杂的图像也的确突显了新兴神经网络之未知性。更深一点来说，这一现象让我们认识到，对视觉的认知复杂性，以及人类大脑及创造过程本身，我们都还所知甚少。

下一个问题将是如何进一步开发这些深度神经网络，在视觉识别和自然语言处理等人工认知能力的基础上，使用更多的无监督学习以及更自动化的方法来处理原始数据。再往远看，我们将进入令人大开眼界的量子机器学习领域。在这里，量子神经网络可以同时处理0和1这两个状态，从而使他们能够真正“看到”大局。

研究者认为，梦是一种无风险的学习方式，人脑的这种自适应机制帮助推动了人类向更复杂的层次进化。那么，对于机器是否也是如此呢？现在还很难有定论。我们可以肯定的是，这些图像所带来的现实令人兴奋，同时也令人不安。机器智能的可能缺陷意味着我们对它日益加深的依赖无疑会导致不可预见的后果。一些专家警告，也许有一天，我们会陷入一个智能杀手机器横行的战争。但是，在目前此刻，这些图像本身仍然充满着光怪陆离的魅力。你可以从GitHub下载DeepDream代码，自己生成机器盗梦图像，或着，你也可以上传图像到Psychic VR Lab，或在推特上用#deepdream词条查询追踪。在谷歌研究博客网页你可以看到更多关于这方面的消息。

		自动登录	找回密码
密码			立即注册