b2科目四模拟试题多少题驾考考爆了怎么补救
b2科目四模拟试题多少题 驾考考爆了怎么补救

AI图像识别: 人类着眼于形状,算法着眼于纹理

电脑杂谈  发布时间:2020-04-23 23:13:56  来源:网络整理

图像识别用什么算法_图像 颜色识别_图像颜色识别

人类会注意图片中物体的形状. 深度学习计算机系统使用的算法不同. 它将研究对象的纹理.

图片中的动物轮廓是猫,但是猫被大象的皮肤所覆盖,并且将图片交给了一个人进行识别. 一个人会说那是猫. 如果通过计算机视觉算法对其进行处理,则将其称为大象. 德国研究人员认为,人们关注形状,而计算机关注纹理.

这个发现很有趣,但是它证明计算机算法离人类的视野还很远.

当您查看猫的照片时,无论照片是黑白,斑点图像识别用什么算法,磨损还是褪色,您都可以轻松知道猫是否有条纹,可以轻松识别它. 无论宠物是curl缩在枕头后还是在工作台上跳动,只要在拍照时留下阴霾,您都可以轻松识别它. 如果它被机器视觉系统(由深度神经网络驱动)识别,则准确率甚至高于人类,但是当图片略显新颖或有噪点和条纹时,机器视觉系统将是愚蠢的.

为什么会这样?

德国研究小组给出了一个出乎意料的原因: 人类会注意图片中物体的形状. 深度学习计算机系统使用的算法不同.

德国的发现告诉我们,人与机器“思考”问题之间存在明显的区别,并且可能还揭示了人类视觉进化的秘密.

图像识别用什么算法_图像颜色识别_图像 颜色识别

深度学习算法如何“起作用”?

首先,人类向算法展示了大量图片,有些图片带有猫,有些则没有. 该算法在图片中找到“特定图案”,然后使用该图案做出判断,以查看应将哪些标签粘贴到从未见过的图片上.

神经网络架构是基于人类视觉系统开发的. 网络各层连接在一起,以从图片中提取抽象特征. 神经网络系统通过一系列连接获得正确答案,但是整个过程非常神秘. 人类通常只能在事实形成后解释这个神秘的过程.

俄勒冈州立大学的计算机科学家Thomas Dietterich说: “我们正在努力寻找使深度学习计算机视觉算法成功的因素以及使它们易受攻击的因素. ”

该怎么做?研究人员修改了照片并欺骗了神经网络以查看会发生什么. 研究人员发现,即使进行很小的修改,该系统也会给出完全错误的答案. 修改较大时,系统甚至无法标记图片. 其他研究人员追踪该网络,以查看单个神经元如何响应图像并了解系统已学到的知识.

由德国蒂宾根大学的科学家盖尔霍斯(Geirhos)领导的团队使用一种独特的方法进行研究. 去年,该团队发表了一份报告,报告说他们使用特殊的噪音来干扰图像,使图像降级,然后用图像训练神经网络. 研究发现,如果将新图像移交给系统进行处理,则这些图像会失真(相同的失真). 当识别失真的图像时,该系统的性能要优于人类. 但是,如果图像失真方法略有不同,则神经网络将无能为力. 即使图像失真方法与人眼无异,该算法也会出错.

如何解释这样的结果?

研究人员深入思考: 发生了什么变化,即使只添加一点噪音,也会发生如此大的变化?

图像识别用什么算法_图像颜色识别_图像 颜色识别

答案是纹理. 长时间添加大量噪点时,基本上不会影响图片中物体的形状;但是,即使仅添加少量噪声图像识别用什么算法,本地位置的体系结构也会快速失真. 研究人员提出了一项政变,以测试人类和深度学习系统如何处理图片.

研究人员故意制作出相互矛盾的图片,也就是说,将一种动物的形状与另一种动物的纹理相结合来制作图片. 例如: 图片中的动物轮廓是猫,但猫被大象纹理覆盖;或者它是熊,但它们是由铝罐组成的;或轮廓是飞机,但飞机由重叠的钟面组成.

研究人员制作成百上千张拼凑而成的图片,然后为它们贴上标签,例如猫,熊和飞机. 用4种不同的分类算法进行测试,最后给出的答案是大象,铝罐和钟表,这表明该算法与纹理有关.

哥伦比亚大学的计算机神经科学家Nicolaus Kriegeskorte评论道: “这一发现改变了我们对深