视频标签:大数据及其应用
所属栏目:信息技术优质课视频
视频课题:教科版高中信息技术基础必修《大数据及其应用》江苏省优课
本视频配套资料的教学设计、课件 /课堂实录及教案下载可联本站系客服
大数据及其应用
【学科核心素养】
1.信息意识:自觉、主动地寻求恰当的方式获取与处理信息;能够分析数据中所承载的信息。
2.计算思维:在信息活动中能够采用计算机可以处理的方式界定问题、抽象特征、建立结构模型、合理组织数据;通过判断、分析与综合各种信息资源,运用合理的算法形成解决问题的方案。
3.数字化学习与创新:掌握数字化学习系统、学习资源与学习工具的操作技能,用于开展自主学习、协同工作、知识分享与创新创造,助力终身学习能力的提高。
4.信息社会责任:具有一定的信息安全意识与能力,能够遵守信息法律法规,信守信息社会的道德与伦理准则。 【课程标准要求】
1.在运用数字化工具的学习活动中,理解数据、信息与知识的相互关系,认识数据对人们日常生活的影响。
2.针对具体学习任务,体验数字化学习过程,感受利用数字化工具和资源的优势。
3.根据任务需求,选用恰当的软件工具或平台处理数据,完成分析报告,理解对数据进行保护的意义。 【学业要求】
1.掌握数字化学习的方法,能够根据需要选用合适的数字化工具开展学习(信息意识、数字化学习与创新)。
2.了解数据采集、分析和可视化表达的基本方法,能够利用软件工具或平台对数据进行整理、组织、计算与呈现(信息社会责任、计算思维)。 【教学内容分析】
本节课内容是《普通高中信息技术课程标准2017年版》必修课程的模块1“数据与计算”部分的内容,针对数据(包括大数据)在信息社会中的重要价值,分析数据与信息的关系,强调数据处理的基本方法和技能,发展学生利用信息技术解决问题的能力。通过学习,学生能认识到数据在信息社会中的重要价值,合理处理与应用数据,根据需要运用数字化工具解决生活与学习中的问题,认识到人工智能在信息社会中越来越重要的促进作用,逐步成为信息社会的积极参与者。 【学情分析】
教学对象是高二年级学生,学生已经掌握了表格数据的加工处理,能够通过计算、排序等操作对数据进行简单处理,并且能够图形化展示表格数据,但学生可能对大数据的认识还比较局限,对大数据挖掘的作用体会还不深刻,对大数据应用场合的了解也不够全面。 【教学目标】
1.了解大数据的概念以及几种不同类型的大数据; 2.简单运用程序设计语言(如Python),调用相应的接口函数,完成一定的大数据处理任务,得出大数据分析结论;(核心素养:计算思维)
3.理解文本大数据的处理,学会运用大数据技术支持的APP解决实际问题;(核心素养:
信息意识)
4.从实际生活中发现大数据应用的价值,认识有效的大数据处理对于提高大数据价值的重要意义;
5.大数据技术虽然给我们生活学习带来便利,但是数据安全问题不容忽视,应用大数据时需要遵循大数据应用的道德规范,树立正确的信息社会责任感。(核心素养:信息社会责任)
(核心素养:数字化学习与创新贯穿整节课) 【教学重点】
能从实际生活中发现大数据应用的价值,认识到有效的大数据处理对于提高大数据价值的重要意义。 【教学难点】
运用程序设计语言,调用相应的接口函数,完成一定的大数据处理任务,得出大数据分析结论。 【教学策略分析】
本节课中运用到的教学策略主要有创设情境、任务驱动、自主探究、支架式教学等。 创设情境:从学生身边的数据入手,有目的地创设趣味和内容并存的学习情境,激发学生兴趣,调动积极性。如课前查询学生参与的运动会的成绩数据、课上挖掘分析校园卡大数据、从识别校园植物体验图片大数据、从识别校园歌曲体验音频大数据等。
任务驱动、自主探究:以教师为主导,学生为主体,任务驱动,充分发挥学生的学习主动性。如体验文本大数据环节,利用Python程序语言,调用接口函数,分析唐诗300首。
支架式教学:在学生自主探究环节,提供自主学习支架,帮助学生高效率的完成任务。如分析唐诗300首文本大数据时,提供学习引导单,指引学生完成分析任务。 【教学环境】
硬件环境:网络机房。
软件环境:教学网站、Python开发平台(Spyder),手机APP。 教学素材:Focusky课件,学习引导单。 【教学流程图】
上课前学生登录 教学网站查询运动会成绩
开始
大数据的概念
视频:“大数据融入社会各领域”了解大数据,对比普通数据与大数据,理解大数据
结构化大数据
挖掘分析校园卡大数据,获取感兴趣、有价值的信息,作为学校管理决策的依据
【教学过程】【核心素养:数字化学习与创新】
课前:课前热身
学生用姓名登陆教学网站,登陆上以后查询校运动会的成绩。提示:点击对应的班级、项目可查看相应的成绩。
【设计意图】:通过对学生刚参与的运动会成绩的查询,吸引学生注意的同时感受身边的数据。Focusky课件中图片(上课班级运动会的镜头,增强带入感)解释学生所看到结果的来源与过程:学生比赛→裁判计分→数据录入→平台分析→呈现结果,学生了解普通数据的分析处理过程,引入大数据。
上课:
第一环节:结构化大数据
师:数据无处不在,我们每天都在产生大量的数据,比如用餐、洗澡、买文具、借书等行为都会产生校园卡数据,据统计,我们开学到现在,已经产生四十多万条校园卡数据了,那么从我们刚开始使用校园卡到现在,数据量已经很庞大了。这些大数据存放在这里,只是作为我们校园卡的消费凭证,为了让这些大数据更有意义,我们能不能从中挖掘一些对我们
大数据安全问题 体验音频大数据:听歌识曲APP
视频:大数据时代,我们还有隐私吗?
结束
体验图片大数据:拍照识花APP
体验文本大数据:Python分析唐诗三百首
非 结 构 化 大 数 据
总结
大数据及其应用,大数据未来的发展
有用或者我们感兴趣的信息。比如,我们可以看看班里哪些同学最喜欢逛图书馆?我和我的同桌谁最喜欢去书店?我们餐厅哪个窗口最受欢迎?……下面我们就重新打开浏览器,根据操作提示,从校园卡大数据中挖掘你想发现的信息吧。
【活动体验一】
生:打开教学网站,根据操作提示,从校园卡大数据中挖掘自己比较感兴趣或者觉得比较有价值的信息。
师:同学们从中发现了什么比较有趣的信息呢?
生1:查询医务室的消费情况,我发现我们班同学在医务室的消费记录都为0。 师:说明我们同学们都很健康,是我们喜闻乐见的。 生2:我们所有消费记录中,用餐的消费占的比重最多。
师:这说明了民以食为天。大家从校园卡大数据中挖掘到了很多信息,信息是具有价值性的,那么我们获取到的信息有哪些价值呢?比如,我们医务室,根据同学们的刷卡记录来跟踪大家的健康。
生:我们食堂,可以根据窗口消费情况,分析判断同学们爱吃什么菜,不爱吃什么菜,作为食堂菜谱调整的参考。
师:没错,我们通过对校园卡大数据的挖掘,获取很多信息,这些信息对我们学校教育教学管理提供决策的依据,这才是我们对校园卡大数据挖掘分析的意义所在。
【设计意图】:从学生每天都接触的校园卡大数据入手,吸引学生的注意,激发学生的兴趣。通过对学生自己感兴趣的消费情况查询,发现一些信息,教师引导学生从这些信息中分析出这些信息的价值。通过对校园卡大数据的挖掘分析,体验结构化大数据,同时让同学们意识到,从校园卡大数据中挖掘到的信息,用于学校教育教学管理的决策依据,这才是大数据挖掘的意义所在。
第二环节:大数据的概念 师:说到大数据,最近很火,那么什么是大数据呢?简单来说,大量的数据就是大数据,那么大到什么程度呢?大数据是指所涉及的数据资料量巨大,以致无法通过人脑,甚至常规
软件工具进行捕捉、管理和处理的数据集合。是指无法通过人脑和常规软件无法分析的数据。
师:可能大家对这个概念还有些模糊,我们通过一则视频更直观的来了解一下大数据。 生:看视频,了解大数据在社会各领域中的应用。
师:我们从视频中看出,大数据已经融入我们生活的各行各业,方便了我们的交通、购物,还能帮助警察抓逃犯。为了加强同学们对大数据的理解,我们现在将大数据与普通数据库进行比较:数据规模、处理对象、数据类型。
师:从数据类型来看,普通数据库基本是结构化数据,而大数据则包括结构化数据和非结构化数据。什么是结构化数据呢,简单来说就是数据库,比如我们之前学习的Excel二维表,我们刚刚分析的校园卡大数据就是结构化大数据。
【设计意图】:上一环节中体验了校园卡大数据,没有具体说明什么是大数据,从学生熟悉的校园卡大数据引出大数据的概念和应用。通过视频——“大数据在社会各领域中的应用”,帮助学生更加直观的感受日常生活中的大数据。紧接着通过大数据与普通数据的对比,利用池塘和大海两个比喻,加深学生对大数据的理解,并说明大数据的类型分为结构化大数据、非结构化大数据,引出下一环节:非结构化大数据,承上启下。
第三环节:非结构化大数据
师:非结构化数据的数据结构是不规则的,比如办公文档、网页内容、文本、图像、音视频、报表等等属于非结构化数据。那么我们就以文本大数据来感受一下非结构化大数据。
【设计意图】:由上一环节大数据的类型分类引出这部分内容,通过举例说明什么是非结构化数据,并以文本大数据、图片大数据、音频大数据展开体验非结构化大数据。
1.文本大数据
师:唐诗是大家比较熟悉的,大家知道全唐诗一共有多少首吗? 生:唐诗300首。
师:据资料显示,全唐诗一共有五万首左右,假如你每天背诵10首唐诗,背完 全唐诗你需要13年的时间,数据量是相当大的。大家有没有思考过全唐诗里出现频次最多的字是什么?
生:……
师:诗人们最爱哪个季节? 生:(有说秋季,有说春季)。 师:出现最多的颜色是什么颜色? 生:绿色,黄色。
师:诗人情感抒发的最多的是什么情感? 生:忧愁,哀思。
师:经过大数据语义分析技术,我们发现全唐诗里出现最多的字是人,昨天是重阳节,关于重阳节的诗中有“遍插茱萸少一人”。大数据分析结果显示,四季中出现最多的是春季,唐诗中不乏伤春、惜春的诗句,从标题里就可以看出很多。经过对色系分类,将碧、绿、苍、翠等词归类为绿色系之后,我们发现唐诗中,绿色出现的最多。诗人们抒发情感最多的是悲伤,悲离别、悲情感。
生:观看课件,了解大数据对全唐诗的分析结果。
师:我们从全唐诗中除了获取这些信息外,我们还能挖掘出什么呢?比如全唐诗里出现最多的地名是哪里?哪种类型的诗最多?作品数排在前十名的诗人都有谁?十二生肖哪个生肖出现的频次最高?……这些我们也都能挖掘出来。但是大数据的处理需要依托于云计算的分布式处理、分布式数据库、云存储技术、专业的分析平台,而我们课堂上时间和设备都有限,是做不到对全唐诗的分析的。
师:不过没关系,我们可以利用Python对唐诗三百首进行数据分析,体验大数据分析处理的过程。
师:我们打开桌面“Spyder”软件;第二步,点击工具栏里面的运行按钮,完成数据载入;第三步,根据导学案选择你最感兴趣的2-3个项目完成,复制对应的代码,粘贴至右侧操作台,按回车键三次,获取你从唐诗三百首里挖掘到的信息。
生:打开Spyder,根据操作引导单,体验对唐诗300首的分析。
生:打开教学网站,浏览大家生成的分析结果。
师:我们一起看看大家提交上来的分析结果,首先是对唐诗300首标题进行词频统计分析,生成的云图,最开始我们生成了这张图,我们发现里面有很多一首、二首之类的词,这是唐诗标题里常出现的,但是对我们的分析意义不大,所以,我们尝试在stopwords中添加了这些不需要的词,进行大数据清洗操作,之后再生成的就是这张图了。
视频来源:优质课网 www.youzhik.com