科学家帮助解释了视觉系统识别复杂物体的非凡能力

科学家帮助解释了视觉系统识别复杂物体的非凡能力
左起:这是约翰·雷诺兹,阿尼万·南迪和塔季扬娜·夏皮。图源:索尔克生物研究所

人类的眼睛怎么可能分辨出那些以疯狂的方向扭曲和循环的字母,就像互联网用户经常在网站上接受的小安全测试那样?

这对我们来说似乎很容易做就是了。但这项任务表面上的简单是一种错觉。这项任务实际上非常复杂,没有人能够像神经网络那样编写计算机代码来翻译这些扭曲的字母。这就是为什么这个被称为CAPTCHA的测试被用来区分人类的反应和试图窃取敏感信息的计算机机器人。

现在,一个团队索尔克生物研究所的研究员接受了一项挑战,即探索大脑是如何完成这一非凡任务的。几天内相继发表的两项研究表明,对大脑来说,解码验证码(CAPTCHA)或任何由简单和复杂元素组成的图像是多么复杂的视觉任务。

这两项研究的结果发表在6月19日的《科学》杂志上神经元6月24日美国国家科学院院刊PNAS),在理解视觉方面迈出了重要的两步,并重写了被认为是既定的科学。结果表明,神经科学家认为他们所知道的拼图的一部分太简单了,不可能是真的。

这项研究的资深合著者,索尔克神经科学家Tatyana Sharpee和John Reynolds说,他们深入而详细的研究——包括数百个神经元的记录——可能也有未来的临床和实际意义。

“了解大脑如何创造一个可以帮助那些大脑以各种不同的方式出现故障的人,比如那些失去视力的人,”计算神经生物学实验室的副教授Sharpee说。解决这个问题的一种方法是弄清楚大脑——不是眼睛,而是大脑皮层——如何处理关于世界的信息。如果你有这种密码,那么你就可以直接刺激大脑皮层的神经元,让人们看到东西。”

雷诺兹是系统神经生物学实验室的教授,他说,了解大脑工作方式的一个间接好处是,有可能构建可以像人类一样运作的计算机系统。

他说:“机器识别我们周围事物的能力之所以有限,是因为我们并不真正理解大脑是如何做到这一点的。”

科学家们强调,这些都是他们正在努力实现的长期目标,一步一个脚印。

将部分整合为整体

在这些研究中,索尔克神经生物学家试图弄清楚视觉皮层的V4区是如何区分不同的视觉刺激的,即使刺激在空间中移动。V4负责图像神经处理的中间步骤。

“视觉系统中的神经元对空间区域很敏感——它们就像通向世界的小窗户,”雷诺兹说。“在处理过程的最初阶段,这些窗口——被称为接受域——很小。他们只能在有限的空间内获取信息。这些神经元中的每一个都会发送大脑信号,对一小块空间区域的内容进行编码——它们对物体的微小、简单元素做出反应,比如空间中的边缘,或者一小块颜色。”

V4的神经元有更大的它还可以计算更复杂的形状,如轮廓。他们通过整合来自皮层中早期视觉区域的输入来实现这一点,即靠近视网膜的区域,它为视觉系统提供输入,视觉系统有小的接受域,并将信息发送给更高层次的处理,使我们能够看到复杂的图像,如人脸,他说。

这两项新研究都调查了翻译不变性的问题——神经元在其感受野内识别相同刺激的能力,无论它在空间的哪个位置,无论它恰好落在感受野的哪个位置。

神经元论文通过分析V4中93个独立神经元对直线和曲线等形状图像的反应来研究平移不变性,而研究人员则通过分析V4中93个独立神经元对直线和曲线等形状图像的反应来研究平移不变性PNAS这项研究观察了V4神经元对充满复杂轮廓的自然场景的反应。

该领域的教条是V4神经元都表现出平移不变性。

Sharpee说:“公认的理解是,个体的神经元被调整为识别相同的刺激,无论它在他们的接受区。”

例如,一个神经元可能会对验证码图像中数字5中的一点曲线做出反应,而不管5在它的接受域中处于什么位置。研究人员认为,神经元的翻译不变性——识别任何刺激的能力,无论它在空间的哪个位置——随着图像在视觉处理层次中的上升而增加。

她说:“但这两项研究都表明,事情远不止如此。”“在刺激的复杂性和细胞从一个地方移动到另一个地方时识别刺激的程度之间存在权衡。”

一个更深层的谜团有待解开

索尔克大学的研究人员发现,神经元对更复杂的形状(如5或岩石的曲线)有反应,其平移不变性就会降低。雷诺兹说:“他们需要在一个更有限的范围内发现复杂的曲线,并理解它的含义。”“喜欢这种复杂形状的细胞还没有能力在任何地方识别这种形状。”

另一方面,V4中的神经元被调整为识别更简单的形状,比如数字5中的直线,具有更高的平移不变性。Sharpee说:“他们不关心他们被调到哪里的刺激,只要它在他们的接受区域内就行。”

“之前关于物体识别的研究假设,无论物体图像的基本视觉转换如何,视觉处理后期的神经元反应都保持不变。我们的研究强调了这种假设在哪里被打破,并提出了可能导致对象选择性的简单机制,”索尔克研究科学家裘德·米切尔说,他是该研究的资深作者神经元纸。

“重要的是,这两项研究的结果彼此相当兼容,我们在第一个实验中研究的直线和曲线与我们在大脑体验现实世界时看到的结果相匹配,”Sharpee说,他以开发出一种计算方法来从自然图像中提取神经反应而闻名。

雷诺兹说:“这告诉我们,还有一个更深层次的谜团有待解开。”“我们还没有弄清楚平移不变性是如何实现的。我们所做的是将机器的一部分拆开,以实现部分整合为整体。”

所提供的索尔克研究所
引用:科学家帮助解释视觉系统识别复杂物体的非凡能力(2013年7月2日),检索自2023年3月18日//www.pyrotek-europe.com/news/2013-07-scientists-visual-remarkable-ability-complex.html
这份文件受版权保护。除为私人学习或研究目的而进行的公平交易外,未经书面许可,不得转载任何部分。内容仅供参考之用。

进一步探索

视觉注意力:大脑如何充分利用可见世界

股票

对编辑的反馈