
教育大数据的三大颠覆性应用
大数据对教育领域的冲击是全面性的。针对不同层次的需求,教育大数据应用形成了各种产品和服务。从适应性教学到动态跟踪测评,从管理模型构建到数据共享门户,各种类型的应用勾勒出了大数据影响教育领域的整体图景。我们不妨通过国际范围内典型的技术、产品和服务,从适应性教学、教育规律发现和精准管理支持三个方面,对有较大影响的教育大数据国际应用进行分析,以期对我国教育大数据发展应用提供借鉴。
图1 教育大数据的应用
适应性教学支持
适应性教与学是教学的最优化状态。适应性教学中的内容、方法和过程都可以根据学习者的状况来进行定制,让每个学习者都有可能获得适合自己的最大程度的发展。适应性教学的实现,需要基于学习者的个体特征和学习状况的全面分析。大数据为追踪和整合这些数据,并对学生进行个性化支持提供了可能。
图2 适应性教学的构成
最为常见的适应性教学系统来自在线学习领域。在各种学习管理系统和在线学习平台中,学习者的学习过程能够得到完整记录。学习过程的记录结合人口学和学习风格等学习者特征数据,可以清晰地表征学习者的学习路径和学习者特征,在有效记录学习过程、综合评价学习状况的基础上,进行诊断和推荐,开展有针对性的教学。
适应性学习支持几乎已经成了在线学习的“标配”,在每一个商业在线学习平台中,都有不同程度的适应性。内容推荐是适应性的一种主要形式。然而,真正有效的适应性教学系统需要整合三个系统,即知识系统、行为系统和特征系统。通过知识系统来描绘知识体系;通过行为系统来记录学习、练习和反馈过程;通过特征系统去分析学生的个体特征和学习特质。
当前,最具代表意义的适应性学习系统当属Knewton和可汗学院(Kehan Academy)。此类适应性学习系统重点支持了学生的学。学习系统试图扮演教师的角色,对学生的学习进行自动化记录、诊断和干预。适应性学习的另一个层面是对教师教的支持。在大数据技术支持下,教师可以根据自身的需求对学生的学习进行监测,并通过自己设定的标准,对学生进行自动化或半自动化的评价。在数据的支持下,教师可以结合自身的教学经验对学生进行诊断和干预。在教师的训练下,大数据工具将对教师的教提供更有力的支持。大数据工具将成为教师最好的帮手,而不是竞争者。
以Masteryconnect为例,Masteryconnect对教师的教提供了全面的数据化支持,它从教师的日常工作出发,提供了数据采集、分析、呈现和基于数据的协作支持。教师可以在其支持下采集各种教学数据,包括课堂观察数据、答题卡数据、量表数据和在线测试数据。在采集数据之后,Masteryconnect可以进行自动化分析和可视化呈现。分析的结果可以通过该系统分享给其他教师,教师可以在数据的基础上进行交流和协作。Masteryconnect为各种形成性评价提供了全面的支持,教师可以自行建立教学内容的结构,并为各个模块和知识点设计问卷、练习、试卷等各种测评方式。测评可以发布到PC和移动设备,学生可以选择自己喜欢的方式完成测评。同时,测评结果可以形成定制报告,并发送给家长。
教育规律发现
教育研究是一项复杂的系统性研究。在大数据的驱动下,教育研究将出现不同的态势,通过挖掘、分析教育大数据,研究者可以量化学习过程,表征学习状态,发现影响因素,找到干预策略,从更深的层次揭示教育规律。
图3 通过大数据揭示教育规律
这里可以通过对美国的三个大数据教育应用的案例,即“预测分析报告项目(Predictive Analytics Reporting,PAR)、数据商店(Data Shop)和Data.gov”的介绍与分析,充分了解大数据标准化研究和数据门户对教育规律探索的意义。
美国的预测分析报告项目(PAR)对高校学生的学习状况进行了全面分析,在学生辍学等重要风险的预测方面进行了探索。从2011年开始,该项目与美国的高校合作,建立了标准化数据收集框架,通过对学生学习数据的收集和分析,发现影响因子并构建预测模型。该项目分析的原始数据包括学生人口学数据、教学管理数据、学习过程数据、成绩数据和学生财务信息数据等。通过分析,该项目建立了通用分析标准和风险预测模型,并为各个学校提供了定制化风险因素模型。
教育大数据研究需要大量汇集数据,数据汇集需要大量研究者的群策群力,也需要行之有效的组织机制。匹兹堡大学学习科学中心(Pittsburgh Science of Learning Center)的数据商店(Data Shop),是美国自然科学基金支持建立的学习科学数据库,具有数据存储和数据分析两大类功能:一方面,它为全球学习科学研究者提供安全的数据存储与共享工具;另一方面,它提供了数据分析工具和调用接口,便于分析应用。数据商店中的数据,分为公开数据和私有数据,研究者可以根据需要选择自己的数据是否要公开。数据商店中的数据,包括教学软件应用数据、在线课程数据、智能教学系统(Intelligent Tutoring Systems)、虚拟实验室数据、协作学习系统数据等。在数据汇集和分享功能的基础上,数据商店提供了丰富的数据分析功能,支持探索性统计分析和数据挖掘,提供Web Service支持远程调用,以及R语言、Excel等工具的接口。
美国教育部在教育研究与实践数据汇集方面开展了大量工作,汇集了大量数据。截至2016年5月,在其数据门户Data.gov中,汇聚的数据包含了325个大型数据集。数据包含范围很广,涉及人口统计、学习成绩、贷款情况、校园安全等情况。Data.gov针对各类数据提供了多种数据格式,同时,提供了在线数据分析功能,它可以实现灵活便捷的在线数据可视化。同时,Data.gov还为每个数据集提供了API,便于外部调用与分析。
精准管理支持
在学校和教育机构中,管理者时常面对无法及时掌握教学与管理综合状况的困境。这也导致了教育管理常常是粗放的、由直觉驱动的现状。以Learnsprout、Calarity、Altschool等为代表的数据化管理应用,体现了数据建模对于精准管理的重要支撑作用。
图4 数据支持下管理模型构建
Learnsprout能够整合学生信息系统和学习管理系统的数据,对学生日常表现进行监测,通过构建模型对学生综合状况进行分析,并对管理和教学提出建议。例如,Learnsprout能够对高中学生进入大学的准备情况等进行评价,对存在问题的学生进行早期预警,提出教学干预建议,并评估干预效果。Learnsprout不仅提供了自动化分析,还建立了有教育专家和数据专家构成的团队对数据进行深入挖掘,并形成分析报告。Learnsprout已经在美国42个州、200多个学区的2500多所学校中得以广泛应用。该公司于2016年1月被苹果公司收购,这也从一个侧面说明了市场对其应用效果的认可。
Calarity是通过构建模型提供管理支持的另一个典型案例。Calarity旨在评估学校应用信息化技术促进教学的状况,并提出改进建议。它针对学校师生的技术应用情况,采集了280个数据点,建立82个变量,形成21个指标,进而聚合成了4个维度,分别为课堂学习、技术应用、信息化技能和信息化环境。在模型化数据分析的基础上,Calarity对存在的问题进行了分析和诊断,并提出了解决方案建议。
Altschool是学校层次上进行整体性数据采集、分析与应用的代表。这所由前谷歌工程师Max Ventilla创办的学校,将教育教学和工程化思维密切结合,将提供个性化的教育作为办学宗旨。在教育教学过程中采用全方位数据采集和分析,成为了这所学校提供适应性教与学的重要依据和支撑。Altschool构建了独特的信息化基础设施进行数据采集,它为教室设计的Alt Video系统,通过各种传感器、摄像头和麦克风采集学生行为数据,这些数据每天都将被分析,用来改进教学过程和教学系统。Altschool还开发了Stream等教学系统和移动应用,在支持教学过程的同时,其基于数据开展教学研究,并通过研究结果支持教学和管理。不同于传统教育研究,Altschool的研究周期非常短,教学设计更新以周为单位,教学管理调整速度极快。快速迭代的工程化思维、系统化信息技术环境支持、完整的数据采集与分析,构成了Altschool在精准教学管理方面的整体解决方案。
可见,通过系统化数据采集,采用科学方法建立的数据模型,可以帮助教育管理者对学校和机构的管理状况进行持续动态监控和综合性评价。在数据支持下,管理者能够更容易地发现管理和教学问题,设计可能的解决方案,并追踪问题解决的成效。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01