京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代的学习与评价:学习证据源自何处
大数据技术已逐步进入学校教育当中。数据量的大小不是我们判断其是否为“大数据”的唯一依据,我们还应从数据收集源头、数据节点规模、测量对象、机器作用及数据分析者职责等角度对其进行综合认识。

数据收集源头
得 益于信息技术的迅猛发展,人们可以将学习证据的收集嵌入到整个学习过程中。这些嵌入式数据节点可能很小,或是为学习者提供的反馈;或是个性化学习环境中为 个别学生下一步学习做出的决策;它们或聚合到更高层次,为学习者特征分析提供依据;或在学校、班级、小组、个体层面生成数据,为教育管理中的问责服务。
坐 拥更全面的数据源,人们有可能超越传统的测试手段。嵌入式评估将模糊形成性评价与总结性评价的界限。当学习过程嵌入了数据收集功能时,人们可以追踪学习者 的学习活动、记录学习过程、分析学习成果的成因和品质。学习分析与数据挖掘可以归纳出学习进展的总结性信息;它同时又能全方位地深入到具体项目以及学习者 所产生的任何一个数据节点中,浏览过程性信息。在此背景下,“反思性教学法”将取代传统的“教学—评价”二元教学法。传统的形成性评价与总结性评价是不同 目的、不同形式的数据收集方式;未来,我们可能需要“前瞻式学习分析”与“回顾式学习分析”,它们所处理的不是不同批次的数据,而是针对同一批数据从前瞻 或回顾的角度进行分析和利用。
数据节点的规模
与 大教育中大数据的“大”一样重要的是,其数据节点的“小”。事实上,这是数据变得更“大”的唯一原因。“小”节点可能表现为学习者回答的一个问题、在模拟 情境中的一个动作,或在论坛当中的一次评论。更“小”的形式,还可能是一次按键、一个时间戳、导航路径中的一次点击、维基百科或博客中的某次编辑历史。学 习本身并没有变得更“大”,只是我们可以附着记录的学习事件变得更“小”了,它们的总和也因此前所未有地变大,以至于如果没有计算机综合技术的支持,人类 是难以处理和驾驭它们的。
测量的对象
经 典测试大多沿袭以下路线:学习中的认知发展——测试中的观察——将测试结果作为认知的证据进行解释。传统的测试对象单独位于学习过程之后,并支持回顾式解 释。然而,在以机器为中介的学习中,人们对学习证据的关注点已经转移到真实的知识人工制品上,并倾向于记录学习者利用学科知识所进行的实践,因为知识表征 可能存在于学科知识实践的人工制品及其建构过程之中。换句话说,我们分析的重点不在于学习者所能思考的内容,而在于他们所做的知识表征。
这 些人工制品含纳了许多复杂认知的表现,具体如科学实验报告、人类或社会现象报告、历史学论文、带有注释的艺术品、视频故事、商业案例研究、发明或设计的物 品、数学或统计案例、田野研究报告或根据用户故事编写的可执行的计算机代码等。这些人工制品是可识别的、可评估的、可衡量的。它的源起是可被验证的,其构 建过程中的任何一个步骤都是可被追溯的。围绕知识加工展开的数据收集范围也被极大地拓展:自然语言处理、任务所花时间、同行或自我回顾、同行评议、编辑历 史和导航路径等。
机器的作用
大 数据并不完全依赖由机器生成,尽管机器可以通过人格化的用户界面表现出非凡的智力。计算机仅是一种人类沟通的技巧、对原有文本结构的扩展。它是人类认知的 补充体、社会思想的延伸、文明传承史中的一部分。在大数据时代,通过收集和计算大量前人的判断,人类的智慧得以放大。数以百万计的、微小的人类事件被记录 在可以聚合的数据节点之中,为教师、教育项目设计师或研究人员提供重要证据。机器看起来十分聪慧,但它们聪慧的意义仅限于它们所收集并计算的众多人类智 慧,就像书籍、图书馆和教师过去所做的那样,只不过它们比真人教师和学习者所能处理的数据量更大罢了。计算机的智慧是有限的,它们只不过是记录和外化人类 思想的机器而已。
数据分析师职责
现 如今,人人都是数据分析师。在软件工程师和用户界面设计师创造的环境中,用户没有必要掌握其中的模糊统计公式,因为突出的学习信息将以可视化的方式呈现, 用户可以利用它们深入追溯具体的学习序列。教师通过访问数据来了解学生并调整教学。在这种证据化的环境下,教师可以也应该是位研究者。这可能需要他们具备 一种新型的数据读写能力,掌握数据分析知识,以支持基于证据的决策。这些数据也可以呈现给学生,有助于他们进行迭代反馈、形成性评价和进展概述,学生将成 为掌控自己学习进程的研究者。此外,专业研究者也可以使用同批数据。大数据时代,传统的研究者与实践者、观察者与被观察者之间的区别逐渐模糊。这种特性彰 显的是大数据的可访问维度,在某种程度上也决定了数据的外观、形式与目的。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22