京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据来了,教育如何站位_数据分析师培训
维克托·迈尔-舍恩伯格,牛津大学互联网研究所教授,担任微软、世界经济论坛等大公司和组织的顾问,是大数据领域公认的权威,写过《大数据时代》等八本书和上百篇论文。
读完维克托·迈尔-舍恩伯格和肯尼思·库克耶的《大数据时代:生活、工作与学习的未来》(华东师范大学出版社),我开始理解了什么叫大数据。在作者眼中,大数据“是当今社会所独有的一种新型能力:以一种前所未有的方式,通过对海量数据进行分析,获得巨大价值的产品和服务,或深刻的洞见。”联想到购物网站推荐的各类产品以及旅游网站上各种优惠信息,我很容易地理解了大数据带来思维变革、商业变革和管理变革的社会现实。作为一名教育工作者,我更希望能够通过他们的新书,在一定程度上回答“大数据离我们有多近”和“大数据离我们有多远”这两个问题。
大数据离我们有多近
不论我们喜不喜欢,教育领域正在开展的一些教育实验,如微课程、翻转课堂、慕课、电子书包等都是当前寻求教育变革的一些尝试。仔细分析这些实验不难发现它们都离不开——数据,类似的教学改革都围绕一个主题,即为学生提供学习资源,并在学生学习过程中获取学习数据,随后积累、分析和应用这些数据,然后为他们提供评价与反馈,也就是说基于数据的教与学实际上是当前众多教育变革的方向。
《与大数据同行:学习和教育的未来》这本书让我们看到了互联网时代的我们通过教育平台能够获得的数据之大,“它们能够告诉我们什么是最有效率的,并且揭示那些过去无从发现的。”他们认为:“在某些方面,慕课仍然等同于强调‘讲台上的贤能者的传统教育’……而慕课的其中一个构成要素却是崭新而强大的,那就是它能产生大数据。因此,虽然在每一门慕课课程中流失的学生非常厉害,但是就像吴恩达教授的教学结果那样,即使只有10%的学生完成课程学习,那这个数字也是1.3万人,“如果凭借传统的教学手段,则需要他终其一生才能达成”。
细细想来,类似的海量数据不单单为可汗学院的在线平台所拥有,并且也为很多政府部门、搜索平台、在线教育机构所拥有,因此有关未来教育的关键词中一定会有基于数据的决策。有关学习行为、学习喜好与风格、学习动机与态度的数据等,都将成为教育决策的依据,而且每个利益相关的群体和个人都能从中获益。如政府部门制定政策、教师调整教学策略、学生进行自我分析、家长了解孩子成长、社会机构分析教育现状等,都可能因为有大数据的帮助,逐步从基于常识的决策走向基于数据的决策,减少盲目性,正如作者所说的那样:“可以打破‘一个尺寸适合所有人’的同质性”(P36),把有效努力从无效努力中分离出来。”这样看来,大数据离我们并不远。然而,普通老师、教育管理者或者家长看到了大数据的教育应用价值吗?或者说,大数据的影响有作者说的那么大吗?
大数据离我们有多远
《与大数据同行:学习和教育的未来》并不是那么容易读明白的书,它富于感性色彩的六个标题语让我在略读阶段经常迷失,在精读时,我全面梳理了这本书的结构,如左下图所示:当我一部分一部分去审视这些内容时,不难发现,作者提到的大数据在教育领域中产生的众多影响似乎都是刚刚开了头,甚至还很难想清楚普通老师和管理者从哪些渠道可以得到自己想要的数据,我们的教与学也还没开始大规模地从大数据中获得有用的信息,更不用说有效应用大数据做到教育创新了。本书实例很典型,但数量比较有限,让我感觉大数据似乎离我们还很远。
在阅读过程中,我尝试跟着作者的思路看看我所关心的教育领域与大数据有效应用之间的距离。
1.关于教师的角色转变
“大数据帮助教师确定最有效的教学方式,这非但不会剥夺他们的工作,反而会提高工作的效率和趣味性”(P9)。“教师不再需要凭借主观判断选择最适合教学的书籍,大数据分析将指引他们选出最有效的、支持进一步完善和私人定制的教材……教材是可以进行个性化处理的(P40-41)”。
教育变革时代教师角色的转变是很多人的共识。过去教师们一直在利用各种各样的数据,特别是测验数据、自己观察到的数据、家长那里得到的数据等进行教学并关注学生的成长。这些数据往往是个人性的,评价重点基本上落在学习成绩和课堂行为上,缺乏大视野下对学生发展整体水平的判断,因此特别强调统一标准和齐头并进。然而大数据将这些数据放大了很多倍,成千上万个体互动的正式或非正式的学习数据都会成为教师可以分析和利用的数据,他们可以从对这些数据的分析中获取让学生学得更好、更有效率的信息,了解不同学习内容、学习方式对不同类型学生学习的帮助,从而在进行教学设计时从宏观上把握大局,设计有益于学生自主与合作学习的教学活动,在教学实施与评价方面则发挥每个学生的能动性,将个性化与差异化教学变成现实。教师们的角色也因此从讲台上的传授者逐步转化为学生学习的指导者、助学者。
但是,我们的老师能得到这样做的机会吗?或者都有能力这样做吗?
2.关于学生的学习
“然而我们在其他行业见到的类似的多样性和定制化,尚未在教育领域大规模地显现”(P33).“学生们受到同样的对待、使用同样的教材、做同样的习题集,这不能称为个性化学习”(P34).“我们可以对知识的传递进行个性化处理,使之更好地适应特定的学习环境、偏好和学生能力”(P36)。
学习对每个个体而言都不是一个线性进步的过程,从大数据中,人们可以发现一个人在学习过程中所经历的所有学习体验和学习结果,对教育者来说,有可能了解学生学习的探索和发现历程,提供更有效的学习支持;对学生自己来说,可以有效地反思学习策略与方法,并不断完善它们;对家长而言,了解自己的孩子,发现孩子的长处,也能够更好地帮助孩子树立面对未来的信心……而所有这些学习分析,都建立在学生互动交流的数据基础上,它们是动态变化的、及时反馈的、多方面的,大数据一方面避免了我们从时间维度上仅以某个阶段的学习数据对学生作出一成不变评价,另一方面,也避免了在空间维度上仅仅观察学生的某些方面,如学业成绩、课堂表现等就给学生一个评价结论的情况,因为学生在线的交流水平,对自己学习掌控,对知识和技能的贡献,学习的视野和能力等都会成为动态分布数据的一部分,这样,学生真正的个性化学习需求和水平就能得到全面的考察与衡量,针对性的个性化学习辅导也才有可能落到实处。但是我们常常做的是不是提出统一的要求,让学生机械地按照我们指定的内容和方式学习?我们观察的数据是不是仍然要以学生的学业为主?
3.关于大数据的分析视角
“质量控制通常交由专门机构负责,其任务是还原事实,而不是把情况描述成管理者希望的样子”(P56)。“大数据有能力将数据的生成与处理、利用分隔开来——在信息上与教育松绑,同时将学校和课本转化为数据平台,促进学习的改善”(P59)。
从教育的视角看,大数据分析主要关注两大领域:学习领域和学术领域(Anirban, 2015)。如果期望从大数据中获得关于学生成长的全面数据,分析的视角十分重要。姜强等人认为:“教育中的大数据分析应以崭新的思维和技术重点对学习过程中的微观表现进行测量,从多个维度,如努力程度、学习态度、智力水平、领域能力、交互协作等深层次挖掘有价值数据信息,揭示其中隐藏的学习行为等模式并以可视化方式呈现。”这其实也反映了基于大数据的学习分析是对学习者群体与个体的众多方面进行全面的数据整合,发现规律,根据规律提出合理的预测,从而指导学习者改进学习。
因此,它需要专业人士(算法专家)来做这样的工作,并避免单一视角或不全面的分析,特别是对数据的流动要敏感,以避免本书两位作者所提到的现象:运用大数据给一部分学生贴上了标签,使“我们的社会倒退为一种近似种姓制度的新形式——精英和高科技封建主义的古怪联姻。”(P90)然而我们当前使用大数据是不是基本局限于信息管理和评价学业成绩呢?
4.关于基于大数据的教育创新
“当下面临的变革并不是技术层面上的。这种改变影响着我们能够收集的数据类型以及我们对这些数据的挖掘方式,促使我们对学习、教学和获取知识的过程展开全新的理解(P102)。
不论什么时代,变革往往都不是线性的,教育变革也不是一级一级向上升的过程。尽管今天的在线教育已经成为教育创新的孵化器,但是仅仅依靠在线教育去思考教育创新是远远不够的。传统教育与在线教育并非非此即彼的关系,很多教育工作者更加强调混合学习模式下的教与学,认为学习者准确提供从大数据中获得的形成性反馈信息才是大数据的优势所在,因为教师们是无法做到一直为学生们提供形成性反馈的具体信息的,只有网络平台才可以做到。所以无论是可汗学院,还是慕课平台,他们是教育创新的重要示范。
如何将在线课程与教师组织的课堂教学有机结合起来?如何充分利用混合学习模式的优势开展教与学?如何把从这种混合学习模式中得到的学习大数据有效分析和利用?
5.关于大数据带来的风险
“它还有可能加深教育鸿沟,使社会和经济上的鸿沟持续存在,更多的妇女和少数族裔将被上层淘汰”(P88)。
和任何崛起的技术一样,大数据带来的风险也是显而易见的,如谁拥有大数据、个人隐私如何保护、从哪个视角去分析大数据、从大数据中获得的信息如何被恰当分析并有效反馈给学习者和公众等,都是应用大数据会碰到的问题。此外,有些人有更多机会获取和利用大数据,而有些人缺乏获取大数据的渠道,还有人缺乏一定知识技来理解和应用大数据,所以大数据确有可能导致更加不平等的现象出现,这本身有违大数据让更多人更便捷、更公平使用网络资源的初衷。要解决这样的问题,仅靠努力改善大数据的应用环境是远远不够的,因此作者指出:“如果教育中的大数据看起来在造就不公平和促成新的不平等,那么公共政策就要跟进了。(P123)公共政策如何跟进?
由于本书的容量不是很大,作者对大数据与教育的关系进行的是初步、广泛的分析,它对于我们特别关注的大数据在教育中的多方面应用,只是提供了一些基本的线索。然而作为一本教育大数据的启蒙读本,它还是值得我们阅读,并且能够启发我们思考。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22