3. 教学指南

教学要点:

让学生理解分类问题,了解训练数据在分类精确度中的作用。

教学材料:

  • 幻灯片
  • 学习单×3
  • 电脑(笔记本电脑最佳)
  • 狗/猫卡片

教师活动:

导入:还记得我们上节课讨论的人工智能的定义吗?我们谈到的三个组成部分是什么?

【等待学生回答数据集、学习算法、预测】

       回答得很好!今天我们将更多地讨论训练数据集,并深入研究人工智能的“学习”算法方面。我们将特别讨论一种非常常见的人工智能形式——监督机器学习

       在监督机器学习的系统中,计算机是通过例子进行学习的。你们见过父母教婴幼儿学习颜色吗?他们通常和孩子一起坐在一本印有彩色形状或动物的纸板书上,指着图片说这是“棕色的熊”或“红色的鸟”。这种方法的思想就是孩子们将通过这些标记的例子学习。

       今天我们关注的是分类问题,但回归问题非常相似。回归,不是尝试预测新数据所属的类别,而是尝试预测该数据的某个数值。例如,尝试预测明天的温度。

但今天我们的重点是分类,谁能举出一些你生活中用到的或在学校学到的关于分类的例子呢?

      【等待学生回答。如果学生需要提示,就询问他们科学课上有哪些分类系统,例如动物分类;或问他们是如何在学校图书馆中找到想要的书的(小说/非小说,或按流派)?歌曲/电影的类型也是很好的答案。提问2-3的学生即可。】

好的,现在我给大家介绍一些分类技术的示例:

  • 人脸检测——是不是人脸?
  • 垃圾邮件检测——是不是垃圾邮件?
  • 手写检测之将支票存入银行——是26个字母还是10个数字之一?

现在让我们建立我们自己的分类器吧。现在我来演示百度EasyDL AI平台

百度EasyDL AI平台使用教程微课:

        演示时要主题强调训练数据和测试数据之间的区别,可以这么说:“现在输入与之前看到的相似但略有不同的数据,测试一下我的算法”
        现在你们来试试!与同伴一起按照教程进行操作,并记录在老师刚刚分发的活动表上。我会四处走走看看每个人的进度。
      【给学生大概5-8分钟的实践。你可以四处走走,提示学生:请学生告知他们的训练和数据集测试。当他们改变姿势时发生了什么?与同伴一起出现在相框里会发生什么?】
讨论:

  • 如果你只训练一个类别会怎样?
  • 随着你的数据集增大会出现怎样的结果?
  • 当你测试数据集和训练数据集不一样时怎么办?

很好,现在我们要用一个新版本的百度EasyDL AI平台来建立一个猫-狗分类器。

【至少演示一个分类器】

       我希望你和你的同伴一起建立一个可以对猫和狗进行分类的机器。你们已经在笔记本电脑上加载了训练的数据集,现在可以使用卡片和网络摄像头进行测试。

【给学生一些时间去建立他们的分类器并记录信息】

你们的分类器运行得如何?

提示:
如果这个分类器只适用于猫,它能否算得上有用?
为什么你认为它对猫/狗更有效?
        我们如何利用我们训练的数据使这个分类器更有效?(如果学生回答这个问题有困难,让学生注意数据集中存在的相似之处,例如:狗毛茸茸的像猫一样/数据没有那么多样化)

【给学生一些时间重新整理他们的数据集】

现在每个人的分类器工作得如何?

提示:
       你们做了什么让它更好地工作?如果学生说他们训练了更少的数据,启发他们进一步思考是数据更多好还是更少好?

【播放性别阴影面部检测视频】

讨论:

乔伊在视频中提出了什么问题?

【等待学生回答人脸识别系统没有识别出肤色较深的女性面孔及肤色较浅的男性面孔】
如果学生需要提示,就提问乔伊所用的技术是否对所有人都一样。

为什么这是一个问题?

等待学生提及不同群体之间不平等的用户体验——除非技术适用于任何人,否则它不起作用。
        如果学生需要提示,就询问他们是否都希望能够使用抖音的过滤器。如果不是所有人都可以使用该技术,这算是错误的吗?

乔伊建议我们如何处理这个问题?

【等待学生回答更好的数据集管理】
如果学生需要提示,询问他们在百度EasyDL AI平台活动期间是如何改进分类算法的。
可选(时间允许且教室环境安全的条件下):

你如何找到图像以更好地管理数据集?

       提示学生思考照片存在的地方——社会媒体,大头照,身份证。其中哪些可以用作信息来源?哪些可能导致更多偏见?哪些可能会侵犯隐私?

       乔伊研究的人脸识别系统的最大问题是,它们在处理肤色较深的女性面孔时不如较白的男性面孔。但并非每个人都不是男性就是女性,而那些面部识别系统无法捕捉到这一点。这是我们在分类时始终需要注意的事,以确保我们的分类不会将任何人排除在外。