京公网安备 11010802034615号
经营许可证编号:京B2-20210330
教育大数据的三大颠覆性应用
大数据对教育领域的冲击是全面性的。针对不同层次的需求,教育大数据应用形成了各种产品和服务。从适应性教学到动态跟踪测评,从管理模型构建到数据共享门户,各种类型的应用勾勒出了大数据影响教育领域的整体图景。我们不妨通过国际范围内典型的技术、产品和服务,从适应性教学、教育规律发现和精准管理支持三个方面,对有较大影响的教育大数据国际应用进行分析,以期对我国教育大数据发展应用提供借鉴。
图1 教育大数据的应用
适应性教学支持
适应性教与学是教学的最优化状态。适应性教学中的内容、方法和过程都可以根据学习者的状况来进行定制,让每个学习者都有可能获得适合自己的最大程度的发展。适应性教学的实现,需要基于学习者的个体特征和学习状况的全面分析。大数据为追踪和整合这些数据,并对学生进行个性化支持提供了可能。
图2 适应性教学的构成
最为常见的适应性教学系统来自在线学习领域。在各种学习管理系统和在线学习平台中,学习者的学习过程能够得到完整记录。学习过程的记录结合人口学和学习风格等学习者特征数据,可以清晰地表征学习者的学习路径和学习者特征,在有效记录学习过程、综合评价学习状况的基础上,进行诊断和推荐,开展有针对性的教学。
适应性学习支持几乎已经成了在线学习的“标配”,在每一个商业在线学习平台中,都有不同程度的适应性。内容推荐是适应性的一种主要形式。然而,真正有效的适应性教学系统需要整合三个系统,即知识系统、行为系统和特征系统。通过知识系统来描绘知识体系;通过行为系统来记录学习、练习和反馈过程;通过特征系统去分析学生的个体特征和学习特质。
当前,最具代表意义的适应性学习系统当属Knewton和可汗学院(Kehan Academy)。此类适应性学习系统重点支持了学生的学。学习系统试图扮演教师的角色,对学生的学习进行自动化记录、诊断和干预。适应性学习的另一个层面是对教师教的支持。在大数据技术支持下,教师可以根据自身的需求对学生的学习进行监测,并通过自己设定的标准,对学生进行自动化或半自动化的评价。在数据的支持下,教师可以结合自身的教学经验对学生进行诊断和干预。在教师的训练下,大数据工具将对教师的教提供更有力的支持。大数据工具将成为教师最好的帮手,而不是竞争者。
以Masteryconnect为例,Masteryconnect对教师的教提供了全面的数据化支持,它从教师的日常工作出发,提供了数据采集、分析、呈现和基于数据的协作支持。教师可以在其支持下采集各种教学数据,包括课堂观察数据、答题卡数据、量表数据和在线测试数据。在采集数据之后,Masteryconnect可以进行自动化分析和可视化呈现。分析的结果可以通过该系统分享给其他教师,教师可以在数据的基础上进行交流和协作。Masteryconnect为各种形成性评价提供了全面的支持,教师可以自行建立教学内容的结构,并为各个模块和知识点设计问卷、练习、试卷等各种测评方式。测评可以发布到PC和移动设备,学生可以选择自己喜欢的方式完成测评。同时,测评结果可以形成定制报告,并发送给家长。
教育规律发现
教育研究是一项复杂的系统性研究。在大数据的驱动下,教育研究将出现不同的态势,通过挖掘、分析教育大数据,研究者可以量化学习过程,表征学习状态,发现影响因素,找到干预策略,从更深的层次揭示教育规律。
图3 通过大数据揭示教育规律
这里可以通过对美国的三个大数据教育应用的案例,即“预测分析报告项目(Predictive Analytics Reporting,PAR)、数据商店(Data Shop)和Data.gov”的介绍与分析,充分了解大数据标准化研究和数据门户对教育规律探索的意义。
美国的预测分析报告项目(PAR)对高校学生的学习状况进行了全面分析,在学生辍学等重要风险的预测方面进行了探索。从2011年开始,该项目与美国的高校合作,建立了标准化数据收集框架,通过对学生学习数据的收集和分析,发现影响因子并构建预测模型。该项目分析的原始数据包括学生人口学数据、教学管理数据、学习过程数据、成绩数据和学生财务信息数据等。通过分析,该项目建立了通用分析标准和风险预测模型,并为各个学校提供了定制化风险因素模型。
教育大数据研究需要大量汇集数据,数据汇集需要大量研究者的群策群力,也需要行之有效的组织机制。匹兹堡大学学习科学中心(Pittsburgh Science of Learning Center)的数据商店(Data Shop),是美国自然科学基金支持建立的学习科学数据库,具有数据存储和数据分析两大类功能:一方面,它为全球学习科学研究者提供安全的数据存储与共享工具;另一方面,它提供了数据分析工具和调用接口,便于分析应用。数据商店中的数据,分为公开数据和私有数据,研究者可以根据需要选择自己的数据是否要公开。数据商店中的数据,包括教学软件应用数据、在线课程数据、智能教学系统(Intelligent Tutoring Systems)、虚拟实验室数据、协作学习系统数据等。在数据汇集和分享功能的基础上,数据商店提供了丰富的数据分析功能,支持探索性统计分析和数据挖掘,提供Web Service支持远程调用,以及R语言、Excel等工具的接口。
美国教育部在教育研究与实践数据汇集方面开展了大量工作,汇集了大量数据。截至2016年5月,在其数据门户Data.gov中,汇聚的数据包含了325个大型数据集。数据包含范围很广,涉及人口统计、学习成绩、贷款情况、校园安全等情况。Data.gov针对各类数据提供了多种数据格式,同时,提供了在线数据分析功能,它可以实现灵活便捷的在线数据可视化。同时,Data.gov还为每个数据集提供了API,便于外部调用与分析。
精准管理支持
在学校和教育机构中,管理者时常面对无法及时掌握教学与管理综合状况的困境。这也导致了教育管理常常是粗放的、由直觉驱动的现状。以Learnsprout、Calarity、Altschool等为代表的数据化管理应用,体现了数据建模对于精准管理的重要支撑作用。
图4 数据支持下管理模型构建
Learnsprout能够整合学生信息系统和学习管理系统的数据,对学生日常表现进行监测,通过构建模型对学生综合状况进行分析,并对管理和教学提出建议。例如,Learnsprout能够对高中学生进入大学的准备情况等进行评价,对存在问题的学生进行早期预警,提出教学干预建议,并评估干预效果。Learnsprout不仅提供了自动化分析,还建立了有教育专家和数据专家构成的团队对数据进行深入挖掘,并形成分析报告。Learnsprout已经在美国42个州、200多个学区的2500多所学校中得以广泛应用。该公司于2016年1月被苹果公司收购,这也从一个侧面说明了市场对其应用效果的认可。
Calarity是通过构建模型提供管理支持的另一个典型案例。Calarity旨在评估学校应用信息化技术促进教学的状况,并提出改进建议。它针对学校师生的技术应用情况,采集了280个数据点,建立82个变量,形成21个指标,进而聚合成了4个维度,分别为课堂学习、技术应用、信息化技能和信息化环境。在模型化数据分析的基础上,Calarity对存在的问题进行了分析和诊断,并提出了解决方案建议。
Altschool是学校层次上进行整体性数据采集、分析与应用的代表。这所由前谷歌工程师Max Ventilla创办的学校,将教育教学和工程化思维密切结合,将提供个性化的教育作为办学宗旨。在教育教学过程中采用全方位数据采集和分析,成为了这所学校提供适应性教与学的重要依据和支撑。Altschool构建了独特的信息化基础设施进行数据采集,它为教室设计的Alt Video系统,通过各种传感器、摄像头和麦克风采集学生行为数据,这些数据每天都将被分析,用来改进教学过程和教学系统。Altschool还开发了Stream等教学系统和移动应用,在支持教学过程的同时,其基于数据开展教学研究,并通过研究结果支持教学和管理。不同于传统教育研究,Altschool的研究周期非常短,教学设计更新以周为单位,教学管理调整速度极快。快速迭代的工程化思维、系统化信息技术环境支持、完整的数据采集与分析,构成了Altschool在精准教学管理方面的整体解决方案。
可见,通过系统化数据采集,采用科学方法建立的数据模型,可以帮助教育管理者对学校和机构的管理状况进行持续动态监控和综合性评价。在数据支持下,管理者能够更容易地发现管理和教学问题,设计可能的解决方案,并追踪问题解决的成效。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16