生活哲学

什么是计算机视觉?

计算机视觉是人工智能和计算机科学中的一个领域,旨在帮助计算机拥有像人类一样的视觉和理解能力。

创造一个看起来像人的机器并不简单,不仅因为这样的机器很难制造,甚至我们也不真正了解过程是什么样子.

没有人认为这很容易,也许除了 AI 先驱马文·明斯基,他在 1966 年以指导他的学生“将相机连接到计算机并让它描述它”而闻名看到'。但那是 50 年前的事了,现在研究还不完整。

这个人类视觉模拟礼物分为3个连续的阶段(类似于人的样子):眼睛模拟(习得-难度),模拟视觉皮层(处理-非常困难)并模拟大脑的其他部分(分析-最困难)。

收到

眼睛模拟是我们取得最大成功的领域。在过去的几十年里,人们创造了传感器、微处理器,它们看起来(并且在某种程度上更好)的能力人眼可以看到。

更大、光学完美的镜头和小至纳米的半导体亚像素为当今的相机提供了令人难以置信的精度和灵敏度。相机每秒可以远程捕获数千张图像识别准确率高。

尽管保真度很高,但这些设备不过是通过 19 世纪针孔拍摄的相机。它们只是记录光子在指定方向上的分布情况。最好的相机传感器无法认出一个球,更不用说接住它们了。

也就是说,没有软件的情况下,硬件是有限的——这仍然是最大的问题。但是,今天的相机也相当灵活,可以作为一个很好的研究平台。

描述

大脑是从零开始构建的,图像逐渐填满大脑,它比其他任何工作都执行更多与视觉相关的任务,而这一切都归结为细胞水平。数十亿细胞联合起来采集样本,捕捉信号。

一组神经元会告诉另一组当沿着直线(在某个角度,例如更快的运动或不同的方向)存在差异时。高级合成这些模式的神经网络形成超模型:圆圈,向上移动。其他信息将逐渐添加:白色圆圈,那条彩色线,尺寸增加。添加新信息时将显示图像。

什么是计算机视觉?
该图描述了大脑图像区域中的路径、寻找边界和其他特征

第一个关于计算机视觉的研究表明,神经网络非常复杂,以至于从上往下逼近时难以理解:这本书长这样>所以会有这种模式>否则会是这个样子。

对于某些主题,这也是有效的,但是在描述每个物体时,从多个角度,颜色,运动等许多方面的变化,想象它是多么困难。即使是一个婴儿的意识水平需要大量数据。

自下而上的方法模仿大脑的工作方式似乎更有希望。计算机可以将变换序列应用于图像并找出轮廓、它所指的对象、视角,运动等。这个过程需要大量的计算和统计数字,但只能通过图像数量。他曾经被教导的图片-就像人脑一样。

什么是计算机视觉的图片 2?
对计算机图像的认识

上图(来自普渡大学的电子实验室)显示了一台计算机,该计算机显示(根据其计算)具有外观和属性的突出显示的对象作为该对象的其他示例,根据对统计数据有一定程度的确定性。

这种方法的支持者可以说'我告诉过你',直到最近几年,人工神经网络的创建和操作都非常困难,因为计算量太大。并行计算的进展解决方案降低了这一难度。过去几年,该系统在模拟人脑方面的研究和使用呈爆炸式增长。模式识别的过程仍在加速,我们仍在取得进展。

理解

当然你仍然可以建立一个系统来识别一个苹果,从任何角度,在任何情况下,无论是站立还是移动,无论是被咬还是完好无损,但仍然无法接收到橙色。

它也不能告诉你苹果是什么,吃多少,用多大或小。这意味着即使是好的硬件和软件也无能为力没有操作系统。

这就是大脑的其余部分:短期/长期记忆、感官数据、注意力、意识、与世界互动时的课程。以我们无法理解的方式写在连接的神经元网络上,比我们见过的任何东西都复杂。

这就是计算机科学和人工智能相遇的地方。在计算机科学家、工程师、心理学家、神经科学和哲学家之间,仍然没有关于大脑如何工作的定义,更不用说模拟了。

虽然在早期很新,但计算机视觉仍然非常有用。它存在于你的 Face ID 摄像头和微笑中。它可以帮助自动驾驶汽车识别标志和行人。它在工厂的机器人中,识别产品,传递给人类。

在他们看起来像人之前,这条路还很长,但在这条路上,他们所做的事情令人惊叹。

查看更多:

  1. 面向新学习者 AI 的说明:神经网络网络
  2. 人工智能革命如何帮助我们回答最基本的哲学问题?(完)
  3. 使用 Google 的新工具在不了解代码的情况下训练 AI 工具

相关资讯

评论

回复