人工智能的世界是什么样的?
几十年来,研究人员一直对此感到困惑。现在,人们更加想知道这个问题的答案。尤其是,从医疗保健到自动驾驶汽车,越来越多的生活领域开始应用机器视觉系统。而且这些领域直接和人的生命息息相关。
但是让机器眼睛真正“看到”谁是行人谁是路标,仍然是一个挑战。做不到这些可能会产生严重甚至致命的后果。
图丨神经网络使用一层相互连接的人工神经元来处理数据。不同的神经元对图像的不同部分起作用(来源:OpenAI / Google)
当神经网络处理数据时,神经网络中的不同神经元会因响应不同图像而亮起,并通过这种模式连接到图像的标签。正是通过这种关联,神经网络才能“学习”事物的样子。神经网络经过训练后,用户就可以向它展示以前从未见过的图片,并且能激活神经元,然后将用户的输入与特定类别相匹配。
但是,像许多机器学习程序一样,视觉算法本质上只是模式匹配而已。这给了它们一定的优势(例如,只要你拥有必要的数据和计算能力,就可以直接进行视觉算法训练)。但它们也有某些弱点,例如它们很容易被之前从未见过的输入陷入混乱。
研究人员在 2010 年初发现了神经网络在处理视觉任务方面的潜力,他们一直在完善相关研究,试图弄清楚神经网络是如何做的。
早期的一项实验是 DeepDream 程序,这是 2015 年发布的计算机视觉程序,它能将任何图片变成幻觉版本。DeepDream 的视觉效果肯定是有趣的,比如在某些方面,它定义了人工智能美学,但该程序也是算法的早期尝试。“某种程度来说,这一切研究都始于 DeepDream 程序,”Olah 说。
图丨与“潜水管”(左)和“带水肺的潜水员”(右)相关的激活响应。(来源:OpenAI / Google)
我们可以一目了然地看出一些明显的颜色和图案。在顶部,看起来像鱼的鲜艳斑点和条纹,而在底部,有看起来像是面具的形状。但右侧突出显示了一种不寻常的激活响应,与蒸汽机车密切相关的激活响应。研究人员对此感到困惑,为什么这些关于机车的视觉信息对识别潜水员很重要?
“所以我们测试了它,”Carter 说。“我们想,'好吧,如果我们输入一个蒸汽机车的图片,是不是会识别为带水肺的潜水员图片分类或潜水员分类图片?'现在看来确实如此。”
图丨三个图像显示了如何重新分类相同的图片。在左边,它被确定为潜水员分类; 中间,随着机车图片的增加,它变成了带水肺的潜水员分类; 当机车足够大时,它变成了机车分类。(来源:OpenAI / Google)
该团队最终找到了原因:这是因为机车的光滑金属曲线在视觉上类似于潜水员的空气罐。因此,对于神经网络来说,这是带水肺的潜水员和潜水员之间的一个明显区别。为了节省区分这两个类别的时间,它只是从其他地方借用了所需的识别视觉数据。
这种例子出人意外地揭示了神经网络的运作方式。而对于怀疑论者,它揭示了这些系统的局限性。他们表示,视觉算法可能是有效的,但他们学到的信息实际上与人类如何理解世界无关。这使他们容易受到某些诡计的影响。例如,如果将一些精心挑选的像素投射到图像中,可能就足以使算法对其进行错误分类。
但对于 Carter、Olah 和其他研究人员来说,Activation Atlases 和类似工具所揭示的信息显示了这些算法的惊人深度和灵活性。例如,Carter 指出,为了使算法区分带水肺潜水员和潜水员,它还将不同类型的动物与这两个类别联系起来。
“在深水中像海龟一样的动物,被分为 scuba 类,地面上出现的鸟类一样,被分为 snorkel 类,”他说。他指出,这是系统从未指导学习的信息。相反,它是自学的。“这有点像是神经网络对世界更深刻的理解。这真的很令人兴奋。“
研究人员希望通过开发这样的工具,将有助于推动人工智能整个领域的发展。通过了解机器视觉系统如何看待世界,理论上我们可以更有效地构建它们并更彻底地检查它们的准确性。
“现在的人工智能是一个有局限的工具箱,”Olah 说。他表示,我们可以在系统上用测试数据来试图欺骗它们,但这种方法总是受到我们的认知限制。“Activation Atlases 给了我们探索未知问题的新工具,感觉每一代人工智能工具都让我们更接近真正理解这些神经网络中正在发生的事情。”
相关文章
猜你喜欢