京公网安备 11010802034615号
经营许可证编号:京B2-20210330
教育大数据的三大颠覆性应用
大数据对教育领域的冲击是全面性的。针对不同层次的需求,教育大数据应用形成了各种产品和服务。从适应性教学到动态跟踪测评,从管理模型构建到数据共享门户,各种类型的应用勾勒出了大数据影响教育领域的整体图景。我们不妨通过国际范围内典型的技术、产品和服务,从适应性教学、教育规律发现和精准管理支持三个方面,对有较大影响的教育大数据国际应用进行分析,以期对我国教育大数据发展应用提供借鉴。
图1 教育大数据的应用
适应性教学支持
适应性教与学是教学的最优化状态。适应性教学中的内容、方法和过程都可以根据学习者的状况来进行定制,让每个学习者都有可能获得适合自己的最大程度的发展。适应性教学的实现,需要基于学习者的个体特征和学习状况的全面分析。大数据为追踪和整合这些数据,并对学生进行个性化支持提供了可能。
图2 适应性教学的构成
最为常见的适应性教学系统来自在线学习领域。在各种学习管理系统和在线学习平台中,学习者的学习过程能够得到完整记录。学习过程的记录结合人口学和学习风格等学习者特征数据,可以清晰地表征学习者的学习路径和学习者特征,在有效记录学习过程、综合评价学习状况的基础上,进行诊断和推荐,开展有针对性的教学。
适应性学习支持几乎已经成了在线学习的“标配”,在每一个商业在线学习平台中,都有不同程度的适应性。内容推荐是适应性的一种主要形式。然而,真正有效的适应性教学系统需要整合三个系统,即知识系统、行为系统和特征系统。通过知识系统来描绘知识体系;通过行为系统来记录学习、练习和反馈过程;通过特征系统去分析学生的个体特征和学习特质。
当前,最具代表意义的适应性学习系统当属Knewton和可汗学院(Kehan Academy)。此类适应性学习系统重点支持了学生的学。学习系统试图扮演教师的角色,对学生的学习进行自动化记录、诊断和干预。适应性学习的另一个层面是对教师教的支持。在大数据技术支持下,教师可以根据自身的需求对学生的学习进行监测,并通过自己设定的标准,对学生进行自动化或半自动化的评价。在数据的支持下,教师可以结合自身的教学经验对学生进行诊断和干预。在教师的训练下,大数据工具将对教师的教提供更有力的支持。大数据工具将成为教师最好的帮手,而不是竞争者。
以Masteryconnect为例,Masteryconnect对教师的教提供了全面的数据化支持,它从教师的日常工作出发,提供了数据采集、分析、呈现和基于数据的协作支持。教师可以在其支持下采集各种教学数据,包括课堂观察数据、答题卡数据、量表数据和在线测试数据。在采集数据之后,Masteryconnect可以进行自动化分析和可视化呈现。分析的结果可以通过该系统分享给其他教师,教师可以在数据的基础上进行交流和协作。Masteryconnect为各种形成性评价提供了全面的支持,教师可以自行建立教学内容的结构,并为各个模块和知识点设计问卷、练习、试卷等各种测评方式。测评可以发布到PC和移动设备,学生可以选择自己喜欢的方式完成测评。同时,测评结果可以形成定制报告,并发送给家长。
教育规律发现
教育研究是一项复杂的系统性研究。在大数据的驱动下,教育研究将出现不同的态势,通过挖掘、分析教育大数据,研究者可以量化学习过程,表征学习状态,发现影响因素,找到干预策略,从更深的层次揭示教育规律。
图3 通过大数据揭示教育规律
这里可以通过对美国的三个大数据教育应用的案例,即“预测分析报告项目(Predictive Analytics Reporting,PAR)、数据商店(Data Shop)和Data.gov”的介绍与分析,充分了解大数据标准化研究和数据门户对教育规律探索的意义。
美国的预测分析报告项目(PAR)对高校学生的学习状况进行了全面分析,在学生辍学等重要风险的预测方面进行了探索。从2011年开始,该项目与美国的高校合作,建立了标准化数据收集框架,通过对学生学习数据的收集和分析,发现影响因子并构建预测模型。该项目分析的原始数据包括学生人口学数据、教学管理数据、学习过程数据、成绩数据和学生财务信息数据等。通过分析,该项目建立了通用分析标准和风险预测模型,并为各个学校提供了定制化风险因素模型。
教育大数据研究需要大量汇集数据,数据汇集需要大量研究者的群策群力,也需要行之有效的组织机制。匹兹堡大学学习科学中心(Pittsburgh Science of Learning Center)的数据商店(Data Shop),是美国自然科学基金支持建立的学习科学数据库,具有数据存储和数据分析两大类功能:一方面,它为全球学习科学研究者提供安全的数据存储与共享工具;另一方面,它提供了数据分析工具和调用接口,便于分析应用。数据商店中的数据,分为公开数据和私有数据,研究者可以根据需要选择自己的数据是否要公开。数据商店中的数据,包括教学软件应用数据、在线课程数据、智能教学系统(Intelligent Tutoring Systems)、虚拟实验室数据、协作学习系统数据等。在数据汇集和分享功能的基础上,数据商店提供了丰富的数据分析功能,支持探索性统计分析和数据挖掘,提供Web Service支持远程调用,以及R语言、Excel等工具的接口。
美国教育部在教育研究与实践数据汇集方面开展了大量工作,汇集了大量数据。截至2016年5月,在其数据门户Data.gov中,汇聚的数据包含了325个大型数据集。数据包含范围很广,涉及人口统计、学习成绩、贷款情况、校园安全等情况。Data.gov针对各类数据提供了多种数据格式,同时,提供了在线数据分析功能,它可以实现灵活便捷的在线数据可视化。同时,Data.gov还为每个数据集提供了API,便于外部调用与分析。
精准管理支持
在学校和教育机构中,管理者时常面对无法及时掌握教学与管理综合状况的困境。这也导致了教育管理常常是粗放的、由直觉驱动的现状。以Learnsprout、Calarity、Altschool等为代表的数据化管理应用,体现了数据建模对于精准管理的重要支撑作用。
图4 数据支持下管理模型构建
Learnsprout能够整合学生信息系统和学习管理系统的数据,对学生日常表现进行监测,通过构建模型对学生综合状况进行分析,并对管理和教学提出建议。例如,Learnsprout能够对高中学生进入大学的准备情况等进行评价,对存在问题的学生进行早期预警,提出教学干预建议,并评估干预效果。Learnsprout不仅提供了自动化分析,还建立了有教育专家和数据专家构成的团队对数据进行深入挖掘,并形成分析报告。Learnsprout已经在美国42个州、200多个学区的2500多所学校中得以广泛应用。该公司于2016年1月被苹果公司收购,这也从一个侧面说明了市场对其应用效果的认可。
Calarity是通过构建模型提供管理支持的另一个典型案例。Calarity旨在评估学校应用信息化技术促进教学的状况,并提出改进建议。它针对学校师生的技术应用情况,采集了280个数据点,建立82个变量,形成21个指标,进而聚合成了4个维度,分别为课堂学习、技术应用、信息化技能和信息化环境。在模型化数据分析的基础上,Calarity对存在的问题进行了分析和诊断,并提出了解决方案建议。
Altschool是学校层次上进行整体性数据采集、分析与应用的代表。这所由前谷歌工程师Max Ventilla创办的学校,将教育教学和工程化思维密切结合,将提供个性化的教育作为办学宗旨。在教育教学过程中采用全方位数据采集和分析,成为了这所学校提供适应性教与学的重要依据和支撑。Altschool构建了独特的信息化基础设施进行数据采集,它为教室设计的Alt Video系统,通过各种传感器、摄像头和麦克风采集学生行为数据,这些数据每天都将被分析,用来改进教学过程和教学系统。Altschool还开发了Stream等教学系统和移动应用,在支持教学过程的同时,其基于数据开展教学研究,并通过研究结果支持教学和管理。不同于传统教育研究,Altschool的研究周期非常短,教学设计更新以周为单位,教学管理调整速度极快。快速迭代的工程化思维、系统化信息技术环境支持、完整的数据采集与分析,构成了Altschool在精准教学管理方面的整体解决方案。
可见,通过系统化数据采集,采用科学方法建立的数据模型,可以帮助教育管理者对学校和机构的管理状况进行持续动态监控和综合性评价。在数据支持下,管理者能够更容易地发现管理和教学问题,设计可能的解决方案,并追踪问题解决的成效。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27