不止图像识别,Facebook谷歌正教机器人成为抽象画家

图灵汇官网

神经元网络:人工大脑的应用与挑战

2014年11月,谷歌研究院发布了一篇博文,提到未来的图形识别引擎不仅能识别照片中的对象,还能对整个物理场景进行简短而准确的描述,即“图像识别神经网络”(简称“神经元网络”)。Facebook也在进行类似的研究。近期,两家公司分别披露了该项目的最新进展。

神经元网络是一种人工智能系统,能迅速识别照片中的人物、车辆、建筑物等物体。然而,该系统的局限性依然存在。

该网络基于机器语言翻译的成果:通过递归神经网络(RNN)将一种语言的句子转换为向量表示,再利用另一个RNN将向量表示转换为目标语言的句子。

该网络不仅能够识别语音、实现语言翻译、定向投放广告,甚至还能教会机器人完成一些基本任务,如开启瓶盖。如果将这一过程逆转,人们可以使该系统具备新能力,不仅能识别图像,还能生成图像。

Facebook正致力于训练自家的神经元网络生成包括飞机、汽车和动物在内的图像。在大约40%的情况下,生成的图像足以让人误以为是真实照片。

与此同时,谷歌的研究团队则在探索相反的方向:他们通过神经元网络将真实照片转换成超现实主义风格。该网络首先识别照片中的熟悉模式,然后进一步强化这些模式,最终生成一种由神经元网络创作的抽象艺术作品。

谷歌的实验过程

研究人员将图像输入图像识别神经网络,并指示它识别特定特征并强化这些特征。修改后的图像随后被再次输入神经网络,继续强化其他特征。经过多次迭代,图像会被大幅改变。

在较低层次上,这种神经元网络可用于检测图像的边界,类似于Photoshop滤镜的效果。然而,当网络需要识别更复杂的图像时,生成的图像可能变得奇幻且令人不安。

此外,网络还能识别随机噪声并生成独特的图像。例如,当一个专门识别建筑物的神经元网络被应用于无特征的图像时,它会生成一些令人惊讶的图像。

这些图像不仅是展示用途,也揭示了神经网络的一个重要特性:它不是通过编程来识别特定图像,而是通过大量图像的学习,整合关键特征。

然而,这也可能导致一些意外情况。例如,当研究人员要求神经元网络在随机噪声图像中识别哑铃时,发现它认为哑铃必须有手臂握住。为解决这个问题,研究人员需要输入更多地面上的哑铃图像,直到网络理解手臂并非哑铃的一部分。

谷歌表示,通过逆向操作,使神经元网络生成图像,可以帮助人们更好地理解其工作原理。研究人员可以观察网络识别图像中的具体特征,从而更深入地理解网络的运作机制。

尽管Facebook和谷歌在神经元网络的应用上有所不同,但两者都能通过多层人工神经元完成特定任务。通过这种方式,研究人员可以量化特定层级的神经元是如何理解图像的,进而优化网络架构并评估其自我学习的能力。

总之,神经元网络的发展不仅提升了图像识别的准确性,还带来了全新的图像生成能力,为人工智能领域开辟了新的可能性。

本文来源: 图灵汇 文章作者: chengran518