
南大大数据算法 “算出”室友
校方称近八成新生填写了调查问卷 以习惯爱好匹配室友是为了降低产生矛盾的概率
近日,南京大学采用大数据算法,为今年入学的新生匹配室友的消息引发关注。日前,北京青年报记者从该校学生工作处获悉,约3300名新生中,近八成学生填写了问卷。根据问卷中涉及到的生活习惯、个人卫生情况、个性化选择及个人兴趣爱好等选项,学校用大数据算法分析学生的相似程度,以此划分寝室、匹配室友。学生工作处负责人解释,这样做,一方面是为了帮助新生更好地适应集体生活,另一方面降低室友之间产生矛盾的概率。
开学在即,如何尽快适应大学校园生活,在集体生活中与室友和谐相处,是每个新生面临的第一道“门槛”。按照惯例,不少学校在为学生分配宿舍时,会考量新生的生源地、年龄,或是自由匹配产生室友。但近日,南京大学采用大数据算法,考量学生的生活习惯和兴趣爱好,并以此匹配室友的方式,为新生提供了一种新的可能。
对此,大多数网友认为学校的做法是人性化的,可以接触到趣味相投的人,也可以避免一些不必要的矛盾。但也有网友担心:匹配时会不会把一些生活习惯不好的学生聚集到了一起,产生负面影响。还有学生认为,集体生活应该和性格不同的人相处,以提前适应未来的社会生活。
|
南大2018级人文科学实验班的学生刘韵(化名)告诉北青报记者,此前,学校新生手册里专门提到会对住宿问题进行问卷调查。“学长学姐和迎新公号也提醒新生这件事。填写的时候,觉得问题都挺实际的,而且每个同学有3次填写更改的机会。”刘韵说,南大分宿舍的方式也引来不少高中同学的羡慕,“他们分宿舍都是按照学号或者姓氏来的,很少按照兴趣爱好分。”刘韵说,自己喜欢打篮球、看综艺,之前特别担心遇到乱拿东西、不讲卫生的室友,填完问卷“心里踏实多了”,他希望能遇到性格开朗的学霸型室友。
北青报记者了解到,这项活动经南大校方牵头,具体操作由该校学生工作处负责。学生工作处郭亚敏老师介绍,去年学校通过网络问卷调查,给新生按照生活习惯分宿舍,效果显著。在此基础上,学校经过一年多的调研,在老生间征集方案,产生了今年的优化升级版本,新添加了如“是否愿意为室友拿快递”、“听歌声音大不大”、“空调喜欢开多少度”这类细节问题。
对话
校方:让学生更好地适应集体生活
谈及大数据分配宿舍室友一事,郭亚敏老师在接受北青报记者采访时说“这样的方式不是拍脑袋想出来的”,而是有一定依据。至于网友的担心,郭老师解释,匹配时会冲淡单一方面的考量,不是要将习惯和爱好完全一致的学生分在一起,而是将差异特别大的学生区分开。
问卷新增“兴趣爱好”的选项
北青报:新生什么时候报到,寝室已经分好了吗?
郭亚敏:8月25日、26日报到,马上就来了。新生大概有3300人左右,八成学生是按照大数据算法给他们分配的宿舍和室友,因为他们在新生网上提前填写了问卷调查。余下的学生采取了随机分配的方式。不过,要等他们入学以后,才能进一步反馈对宿舍和室友是否满意。
北青报:大数据算法匹配室友,具体怎么操作?
郭亚敏:学生先填写问卷,收集到问卷选项的信息后,学校使用大数据推荐算法,通过系统对信息进行量化处理,然后给学生分配室友。
北青报:问卷具体包含哪几个方面的内容?
郭亚敏:第一是生活习惯。包括你的作息时间,冬天夏天使用空调的习惯,是希望热一点还是冷一点。第二是卫生习惯。比如:什么时候整理内务、清理桌椅、打扫垃圾、什么时候洗澡。第三是个性化的问题。比如,是否吸烟,愿不愿意帮室友拿快递、外卖,电费是均摊还是轮流支付,你的肥皂、洗衣粉别人拿来用你有没有意见。第四是个人爱好。(我们)希望宿舍里学生之间有共同话题。比如说一个学生喜欢看电影另一个喜欢听音乐,他们两个能不能放一起,有多大概率可以放一起,这个是要算的。
降低学生入校后产生矛盾的概率
北青报:问卷选项的设置和这种匹配室友的方式,有什么依据吗?
郭亚敏:2017年新生入学时,学校就给部分新生用大数据算法匹配了室友,但参与的新生只有3成左右,规模没有今年这么大。那么这个效果到底怎么样?从后来的跟踪反馈的结果来看,用大数据匹配宿舍的学生,整体满意度比随机分配的学生,高出10个百分点。
因为效果不错,加上学生们最清楚宿舍生活中哪些因素容易造成矛盾,之后我们对16、17级的所有学生做了调研,丰富了问卷。比如,补充了包括听歌声音大小,愿不愿意帮室友拿快递,自习的时间,空调温度高低的细节,都是学生自己总结的,相对来说更真实可信。
北青报:为新生匹配室友的初衷是什么?
郭亚敏:因为今年的00后新生占大多数,基本上都是独生子女,从小到大没有什么集体生活的经验,这样做是让学生更好地适应学校的集体生活。从学校管理上来说,也是为了降低学生入校后产生矛盾的概率。他们要在这里待4年,宿舍矛盾对孩子的负面影响是很大的,学生宿舍存在的隐患、矛盾,也远远大于我们掌握的情况。近些年也有不少室友间互相报复的极端案例。我们希望通过前瞻性的措施,从管理上缓解矛盾,尽量消除发生极端事件的可能性。
希望将差异巨大的学生分开
北青报:大数据匹配室友的消息,也在网上引发一些争议。
郭亚敏:是的,我们也了解到网上有两种不同声音:大多数人会觉得好,认为是人性化操作。同样也有反对的声音,觉得我们剥夺了孩子多样化、差异化交友的权利。甚至有人说,如果一个宿舍的人都晚睡、都抽烟,放在一起是不是合适。
这一点需要解释一下。我们问卷的问题设置得很细,选项也不是简单的“是”和“否”,有“喜欢”、“不喜欢”、“没什么了解”、“没接触过”这些。进一步说,最终要分配时,考察两个人是不是很接近不是从单一的维度去考虑的。不会说两个孩子都写了“我晚睡”,就把他们放一起,还有很多其他因素的考量。而且四类问题的衡量权重是相当的,不会刻意突出哪一方面。因为现在引发矛盾的因素很多元化,你不帮我拿快递都有可能引发矛盾。
北青报:预期的效果是什么样的?
郭亚敏:从最终的效果来看,是要在保证宿舍里的孩子有一定差异性的同时,把两个差异性特别大的人分开,因为差异过大容易产生和激化矛盾。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23CDA 数据分析师:以指标为钥,解锁数据驱动价值 在数字化转型的浪潮中,“用数据说话” 已成为企业决策的共识。但数据本身是零散 ...
2025-09-23当 “算法” 成为数据科学、人工智能、业务决策领域的高频词时,一种隐形的认知误区正悄然蔓延 —— 有人将分析结果不佳归咎于 ...
2025-09-22在数据分析、金融计算、工程评估等领域,“平均数” 是描述数据集中趋势最常用的工具之一。但多数人提及 “平均数” 时,默认指 ...
2025-09-22CDA 数据分析师:参数估计助力数据决策的核心力量 在数字化浪潮席卷各行各业的当下,数据已成为驱动业务增长、优化运营效率的核 ...
2025-09-22训练与验证损失骤升:机器学习训练中的异常诊断与解决方案 在机器学习模型训练过程中,“损失曲线” 是反映模型学习状态的核心指 ...
2025-09-19解析 DataHub 与 Kafka:数据生态中两类核心工具的差异与协同 在数字化转型加速的今天,企业对数据的需求已从 “存储” 转向 “ ...
2025-09-19CDA 数据分析师:让统计基本概念成为业务决策的底层逻辑 统计基本概念是商业数据分析的 “基础语言”—— 从描述数据分布的 “均 ...
2025-09-19CDA 数据分析师:表结构数据 “获取 - 加工 - 使用” 全流程的赋能者 表结构数据(如数据库表、Excel 表、CSV 文件)是企业数字 ...
2025-09-19SQL Server 中 CONVERT 函数的日期转换:从基础用法到实战优化 在 SQL Server 的数据处理中,日期格式转换是高频需求 —— 无论 ...
2025-09-18MySQL 大表拆分与关联查询效率:打破 “拆分必慢” 的认知误区 在 MySQL 数据库管理中,“大表” 始终是性能优化绕不开的话题。 ...
2025-09-18DSGE 模型中的 Et:理性预期算子的内涵、作用与应用解析 动态随机一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明确:TIF 中的地名有哪两种存在形式? 在开始提取前,需先判断 TIF 文件的类型 —— ...
2025-09-17CDA 数据分析师:解锁表结构数据特征价值的专业核心 表结构数据(以 “行 - 列” 规范存储的结构化数据,如数据库表、Excel 表、 ...
2025-09-17Excel 导入数据含缺失值?详解 dropna 函数的功能与实战应用 在用 Python(如 pandas 库)处理 Excel 数据时,“缺失值” 是高频 ...
2025-09-16深入解析卡方检验与 t 检验:差异、适用场景与实践应用 在数据分析与统计学领域,假设检验是验证研究假设、判断数据差异是否 “ ...
2025-09-16