4. 活动2:人工智能数据收集与应用

    在这项活动中,学生们思考如何在共享数据的同时,从人们日常生活中使用的人工智能技术中获得利益或便利。然后,他们会考虑共享数据的潜在风险和意外后果。

    1. 通过以下内容介绍小组活动:

     1)说:“在我们之前观看的视频中,我们看到,就像对待人类婴儿一样,机器学习需要大量的数据来学习。它还需要来自用户或环境的数据,以便应用它所学到的知识、交流、生成新数据、预测结果或做出决策。人工智能拥有的数据集越好,它在执行任务时的表现就越好。作为个人或社会,我们已经决定放弃我们的一些隐私或自由,以换取人工智能技术提供的好处,如方便、个性化或自动化。这是一个权衡的例子。

    2)让学生观看TED演讲视频 Your social media “likes” expose more than you thinkby Jennifer Golbeck.

    3)说:“正如你从视频中看到的,我们有很好的理由更仔细地考虑这种权衡。无论何时收集数据,都需要考虑数据使用和隐私问题。”

    4)比如,哈尔·艾贝尔森(Hal  Abelson)、肯·利登(Ken Leedon)和哈里·刘易斯(Harry Lewis)合著的《支离破碎:数字爆炸后的你的生活、自由和幸福》(Blown to Bits: Your Life, Liberty, and Happiness after the Digital Explosion)一书中,作者描述了两种由技术收集的数据:足迹和指纹。

  • 足迹——有时被称为主动的数据收集(active data collection——是您知道将要留下并可能期望被其他人看到或使用的数据。例如,如果你在一个网站上创建了一个新帐户,你可能会告诉他们你的名字、电子邮件、地点或生日。
  • 指纹——有时也称为被动的数据收集(passive data collection——是指您可能不会想到或希望留下的数据,但应用程序正在收集或跟踪这些数据。例如,跟踪你点击了什么链接,查看了谁的资料,甚至跟踪你没有选择但没有停止自动播放的视频。

    2. 在这个活动中,学生以三到四人为一组,思考下面列出的每一种人工智能技术工具,并分别指出收集的数据哪些称为足迹,哪些称为指纹,以及用户从分享这些数据中得到了什么。在课堂上一起分析第一个技术,然后从列表中给每个小组分配两到三个技术。小组学生进行10-15分钟的头脑风暴并写下他们的想法,再在整个班级中讨论每一个技术。将学生的答案记录在白板或数字表格中。为了支持您实施这项活动,对每种技术可能答案可以在下表中找到。

技术

足迹

(主动数据收集)

指纹

(被动数据收集)

用户收益

社交媒体平台(FacebookInstagramTikTok)

点赞、帖子、朋友/关注者、带标签的地点、照片、视频、信息、用户标签、使用的标签、你属于哪个组、私人信息的内容、性格测试中你最喜欢的答案

你查看的资料,你查看的广告,你点击的链接,你在应用上花费的时间,你在一天中的什么时间使用应用,在哪里使用应用

与朋友联系,人们喜欢你的内容,发现新事物

搜索引擎/网页浏览

访问网站的搜索历史

你浏览或点击的广告,你点击的链接,浏览所花的时间,你的物理位置,你的语言,搜索的位置,搜索时使用的设备类型

发现新事物;访问你喜欢的网站;个性化搜索结果;基于你的预期年龄、性别、兴趣或位置的定向广告或产品推荐

音乐和视频APP(SpotifyYouTube)

你的喜欢,你关注或订阅的账户,播放列表内容,听或查看历史记录

你播放某歌手、歌曲或视频的次数;你喜欢类型;你喜欢的话题或标签;一天中你听或看的时间;你听或看多久

享受你最喜欢的歌曲和视频;发现新媒体;轻松地组织你的整个音乐库在一个地方;保存和共享播放列表;与朋友分享媒体

GPS /地图APP

你想要到达的位置,你搜索的位置,你当前的位置

你住在哪里,你的日常生活,经常去的地方,你开车的速度,基于位置的兴趣(食物,娱乐,等等),你到达和离开地点的时间,你和谁在一起(从你和谁一起的位置数据)

很容易到达你要去的地方,获得实时交通信息

自适应教育APP(如可汗学院)

姓名,老师,学校,年级,你正在学习的课程,你对练习问题的答案,你在不同学校科目中的表现,你正在上的课程

掌握一个主题需要多长时间

 

帮助你学习课程,关于掌握和进步的信息,在学习了一个主题后尽快浏览材料,而不是完成所有的问题

网上购物

你买了什么,你存了什么,你的生日(为了促销)

你在看什么,你购物车里有什么,你或你父母的信用卡信息,你的地址,你在他们的网站或应用上花了多少时间

送货上门,方便快捷,个性化推荐

智能家居设备(如门铃、智能恒温器、Echo或谷歌home)

谁在你的门口;你给它什么命令或提示;您喜欢什么温度?

当你从家里出来或来的时候;你在自己家里私下谈论什么

方便,家庭安全,节能

可穿戴技术(如苹果手表、Fitbit、睡眠跟踪器、智能眼镜、智能医疗设备)

一天的步数,心率,血糖水平,快速眼动周期

传感器融合数据,如工作时的心脏BPM(心率监测器+ GPS)

实时获取健康数据,方便抬头显示。


    3. 通过考虑他们列出的分享数据带来的可能风险或意外后果,扩展学生对他们在网上分享数据的思考。

    1)说:“当我们在网上共享数据,我们总是不知道怎么样,或者为什么我们共享的数据——脚印或指纹——被计算机程序或公司使用——甚至被卖给政府或第三方用于完全不同的目的。有时,我们分享自己认为无害的信息,但就其本身或与其他信息结合时,可能会导致意想不到的后果或用途。”

    2)设计一个信息图“What Information Are You Driving Around?”给全班同学看。仔细阅读每个保险杠贴纸所揭示的信息,以及人们可能无意中理解、使用或滥用这些数据的方式。

What Information Are You Driving Around?

    3)回顾你的学生在上表中列出的有关技术的足迹和指纹,或者他们想到的其他技术。问:“除了你们刚才列出来的共享数据提供的用户收益之前,个人、公司或政府还可能如何使用或滥用你所说的每项技术收集的数据?”当他们聚合或合并这些应用程序共享的数据来创建你的数字档案时,他们可能会知道或做什么?如果他们提供或出售这些数据给其他公司和政府,会发生什么呢?” 例如,当学生发布他们的照片和他们最喜欢的东西的列表时,有人可能会利用这些信息猜测他们的密码,找出他们的安全问题答案,或模仿他们。或者,一家公司可能会根据用户的行为或他们所消费的媒体主题来评估他们的医疗或心理健康状况。

    4)告诉学生,条款和条件是了解APP应用程序或公司可能如何使用他们的数据,以及该APP应用程序或公司是否在保存、删除、共享甚至出售他们的数据的一种方法。询问学生是否阅读过他们下载的APP应用程序的条款和条件。讨论为什么或为什么不,以及有选择地使用APP应用程序和共享哪些数据的好处。

    5)通过揭示所有人工智能技术在设计和使用中存在的权衡来总结活动。虽然您和您的学生能够列举每种技术的许多优点和用户利益,但使用这些相同的技术也有潜在的缺点和意想不到的负面后果。当我们选择使用人工智能技术时,我们对相关的权衡做出了决定,比如使用APP地图应用程序的便利性,但放弃了我们在哪里和我们要去哪里的隐私。