逆向致幻技术 为了更好地审视神经网络的内部运作,研究者们决定将整个过程颠倒过来,做一个逆向研究。他们要求机器自由发挥,解释并强化输入的图像样本,以得出某种诠释。通过这个研究,他们希望能了解神经网络在培训学习中究竟学会了哪些特征属性,还有哪些特征没有学会。 接下来发生的事情令人震惊:研究者发现,这些神经网络不但能够识别图像,它们也拥有足够的信息来生成图像,从而产生这些计算思维的惊人呈现。例如,当研究团队以诸如蚂蚁、香蕉、海星等等普通物体为题进行查询,神经网络会生成下面这些相当特立独行的图像。 将图像输入到低层神经元会生成比较柔和婉转的呈现形式,因为它们的识别重心是图形边缘及角落。研究团队表示:“每层神经元处理不同抽象程度的图形特征,因此,如果我们选择强化不同层次的神经元,生成图像特征之复杂性也会有所不同。” 继续深入下去,将图像输入到更抽象的高层神经元之后,尤其是当研究团队要求神经网络“强化所有你所感知到的东西!”的时候,更细致而出人意料的结果便浮现出来。 这样做创造了一个反馈回路:如果一朵云彩看上去有点像只鸟,神经网络会让它变得更像鸟。那么,在接下来的一轮里,神经网络会更有把握辨识出这只鸟来。如此循环往复,一只细节完美的鸟儿就这样从虚空之中冒将出来。 研究团队把这种逆向致幻技术称为“盗梦”——用电影“盗梦空间”来表达深度神经网络那卓有成效的“计算视觉架构”。使用这种技术,神经网络创造出了意想不到的结果:树木化为晶体结构,树叶变成魔幻的鸟虫。从根本上来说:这些由反馈回路促成的“过度诠释”,是神经网络过去学到的抽象而碎片化的图像特征之融合。更令人瞩目的是,从一张最初空空如也,只有些随机波形的图像开始,通过在依次生成的图像上反复使用算法,神经网络可以最终创造出难以置信、丰富多彩的景观。 对这种数据驱动的大面积错视的研究,谷歌这类公司占有独一无二的主导地位。训练大型神经网络需要大量数据。如果说谁能获取超量的数据,同时又拥有无与伦比的计算力,那也只有谷歌才能做到了。这些发人深省的图像看上去奇妙无比,然而,对于人们在此领域的疑问,它们并没有能提供完美的回答,相反却提出了更多问题。问题之一就是:我们可以看出深度神经网络很容易被人误导。反过来说:这些复杂的图像也的确突显了新兴神经网络之未知性。更深一点来说,这一现象让我们认识到,对视觉的认知复杂性,以及人类大脑及创造过程本身,我们都还所知甚少。 下一个问题将是如何进一步开发这些深度神经网络,在视觉识别和自然语言处理等人工认知能力的基础上,使用更多的无监督学习以及更自动化的方法来处理原始数据。再往远看,我们将进入令人大开眼界的量子机器学习领域。在这里,量子神经网络可以同时处理0和1这两个状态,从而使他们能够真正“看到”大局。 研究者认为,梦是一种无风险的学习方式,人脑的这种自适应机制帮助推动了人类向更复杂的层次进化。那么,对于机器是否也是如此呢?现在还很难有定论。我们可以肯定的是,这些图像所带来的现实令人兴奋,同时也令人不安。机器智能的可能缺陷意味着我们对它日益加深的依赖无疑会导致不可预见的后果。一些专家警告,也许有一天,我们会陷入一个智能杀手机器横行的战争。但是,在目前此刻,这些图像本身仍然充满着光怪陆离的魅力。你可以从GitHub下载DeepDream代码,自己生成机器盗梦图像,或着,你也可以上传图像到Psychic VR Lab,或在推特上用#deepdream词条查询追踪。在谷歌研究博客网页你可以看到更多关于这方面的消息。
|