2. 感知(小学指南)

侦测:生物(1-A-1)

  • 学习目标:比较人类和动物的感知。 
  • 基本理解:一些动物体验世界的方式与人类不同。
  • 详细说明:蝙蝠和海豚使用声呐。蜜蜂能看到紫外线。老鼠没有颜色视觉;狗是红绿色盲。狗和老鼠能听到比人类更高的频率。

侦测:计算机传感器(1-A-2)

  • 学习目标:阐述计算机侦测与人类传感的不同之处。 
  • 基本理解:大多数计算机没有味觉、嗅觉或触觉,但它们可以侦测人类无法感知的一些事物,例如红外线辐射、极低或极高频率的声音,或磁性。

侦测:数字编码(1-A-3)

  • 学习目标:解释图像如何在计算机中以数字方式表示。
  • 基本理解:图像被编码为像素的二维数组,其中每个像素是一个数字,指示图像该部分的亮度;或者是一个RGB值,指示该部分红色、绿色和蓝色分量的亮度。

加工:侦测与感知(1-B-1)

  • 学习目标:使用语音转录或视觉对象识别演示等软件工具来演示机器感知,并解释为什么这是感知而非仅仅是侦测。
  • 基本理解:感知是从侦测信号中提取意义。
  • 详细说明语音识别和面部检测是感知的例子。由压力垫或超声波传感器激活的自动门不表现出感知,因为它只是对原始信号做出反应,而不是使用知识从信号中提取意义。

加工:特征提取(1-B-2)

  • 学习目标:通过提取面部特征,阐述面部检测的工作原理。
  • 基本理解:面部检测器使用特殊算法来寻找眼睛、鼻子、嘴巴和下颌轮廓。
  • 详细说明:面部识别更进一步,试图确定检测到的是谁的脸。识别基于可量化的属性,例如眼睛之间的距离或下颌轮廓的形状。

加工:抽象流水线-语言(1-B-3)

  • 学习目标:阐述如何将声音序列识别为候选词,即使某些声音不清晰。
  • 基本理解:从声音到词语是语音理解抽象流水线中的一个步骤。
  • 详细说明:考虑这样一个问题,在仅给出每个位置声音的部分信息的情况下,猜测一个四个字母的单词,例如,第一个声音是“f”或“d”,第二个声音是“l”或“n”。关于单词中相邻声音之间约束的知识可以用来缩小可能性。在这种情况下,只有“fl”是英语中有效的词首序列。

加工:抽象流水线-视觉(1-B-4)

  • 学习目标:阐述图像中部分遮挡(阻挡)物体的轮廓与物体的真实形状有何不同。
  • 基本理解:理解复杂场景需要考虑到遮挡的影响,才能正确识别物体。
  • 详细说明:考虑两个麦片盒,一个在前面并部分遮挡另一个。可以要求学生在另一张纸上画出每个盒子在图像中呈现的轮廓。遮挡的盒子将是一个矩形,而被遮挡的盒子将是一个凹多边形。然后可以要求学生在原始图像中用虚线画出盒子的真实轮廓。他们应该意识到他们正在推断真实的轮廓;盒子可能有缺陷,并且在他们看不到的区域具有不同的形状。

领域知识:领域知识的类型(1-C-1)

  • 学习目标:演示文本转语音系统如何根据上下文解决歧义,以及当输入不符合语法或无意义的内容时,其错误率如何上升。
  • 基本理解语音识别系统经过数百万条语音的训练,使其能够区分常见和不常见的词语序列,这有助于它们选择信号最可能的解释。
  • 详细说明:比较对 "the jockey reined in the horse"(骑师勒住了马)和 "the king reigned in the horse"(国王统治着马)的转录结果。或者,用 "which witch is which"(哪个女巫是哪个)或 "two ways to go is one too many"(两条路走是太多了)来测试系统。为了探索语法的影响,比较以正常语序朗读的句子与以词序(不是单个词语)颠倒的相同句子的转录准确率,例如,"see the view"(看风景)与 "view the sea"(看海)。

领域知识:包容性(1-C-2)

  • 学习目标:讨论领域知识需要足够广泛,以涵盖应用程序旨在服务的所有群体。
  • 基本理解语音识别系统需要适应不同的口音和替代发音。音乐识别系统必须了解不同的音乐流派。