人工智能的五大理念——6-8年级

1. 感知(中学指南)

侦测:生物(1-A-1)

  • 学习目标: 举例说明人类如何整合来自多种模态的信息。
  • 基本理解:人们能够利用多种感官(如视觉和听觉)之间的相关性,来理解模糊的信号。
  • 详细说明:在嘈杂的环境中,当能看到说话者的嘴巴时,话语会更容易理解。人们会学习与各种动作(比如掉落一个物体)相关的声音,并且能够识别出声音与他们的预期不相符的情况。

侦测:计算机传感器(1-A-2)

  • 学习目标: 举例说明智能体是如何将来自多个传感器的信息进行整合的。
  • 基本理解:自动驾驶汽车将计算机视觉与雷达或激光雷达成像、全球定位系统(GPS)测量数据以及加速度计数据相结合,从而形成对周围环境及其在环境中运动情况的详细描述。

侦测:数字编码(1-A-3)

  • 学习目标:解释声音在计算机中是如何以数字形式表示的。
  • 基本理解:声音通过在离散点对波形进行采样来进行数字编码(通常每秒采样几千次),从而生成一系列的数字。

加工:侦测与感知(1-B-1)

  • 学习目标:举例说明不同类型的计算机感知,这些感知能够从感官信号中提取意义。
  • 基本理解:有许多用于感知任务的专用算法,例如人脸检测、面部表情识别、目标识别、障碍物检测、语音识别、语音应力测量、音乐识别等等。

加工:特征提取(1-B-2)

  • 学习目标:通过模拟边缘检测器来说明从图像中进行特征提取的概念。
  • 基本理解:图像中边缘的位置和方向是一些特征,这些特征可以通过在一个小的(局部)区域内寻找亮像素和暗像素的特定排列方式来检测到。

加工:抽象流水线-语言(1-B-3)

  • 学习目标:通过研究单词之间的契合方式,说明即便某些单词不清晰,单词序列也能被识别为短语。
  • 基本理解:在语言抽象流程中,较高层次表征的信息可用于解决较低层次的歧义问题。
  • 详细说明:在一个由三个单词组成的短语中,如果第一个单词可能是 “seat(座位;就座)”、“sea(大海)” 或者 “see(看见)”,第二个单词可能是 “the(定冠词,这;那)”、“a(不定冠词,一个)” 或者 “of(属于;关于)”,第三个单词可能是 “moody(喜怒无常的)” 或者 “movie(电影)”,那么最有可能的短语是 “see the movie(看电影)”,因为它既符合语法规则,在统计上也较为常见。像 “seat a moody” 这样的组合听起来类似,但既不符合语法规则,在统计上也不常见。

加工:抽象流水线-视觉(1-B-4)

  • 学习目标:描述如何将边缘检测器组合起来,以形成更复杂的特征检测器,例如用于检测字母或形状的检测器。
  • 基本理解:从信号到含义的转变是分阶段进行的,在每个阶段都会提取出越来越复杂的特征。
  • 详细说明:举例:通过寻找三条具有特定方向的边缘的组合来检测字母 “A”。边缘是通过查看像素来检测的。

领域知识:领域知识的类型(1-C-1)

  • 学习目标:对给定的图像进行分类(例如,“交通场景”“自然场景”“社交聚会场景” 等),然后描述一台计算机要理解这类场景所需具备的各类知识。
  • 基本理解:视觉领域的专业知识包括了解哪些类型的物体可能会出现在一个场景中,这些物体相对于其他物体可能出现的位置,以及遮挡和阴影会如何改变物体的外观。
  • 详细说明:在交通场景中,汽车出现在道路上,一些交通标志出现在道路旁边而非道路上,一些标志出现在道路上方,行人出现在人行道、人行横道上,偶尔也会出现在道路上。在自然场景中,图像的上方很可能是蓝天,图像的下方很可能是绿色的草地或树木。

领域知识:包容性(1-C-2)

  • 学习目标:描述如果一个视觉系统缺乏对在其创造者所处文化中不存在的物体的认知,它可能会如何表现出文化偏见。
  • 基本理解:如果一个人工智能应用程序要为不同群体服务,那么领域知识必须考虑到多种文化因素。
  • 详细说明:一辆只了解美国交通标志的自动驾驶汽车将无法识别欧洲或亚洲的交通标志。