京公网安备 11010802034615号
经营许可证编号:京B2-20210330
利用移动应用软件进行众包给心理学研究带来“大数据”
根据美国心理学协会出版的一篇文章,有这样一款节奏快速的游戏应用软件以创纪录的速度为研究人员提供了数十亿项数据,游戏中玩家扮演机场安检人员操作X光扫描仪筛查旅客的行李箱包。
这是一份发表于美国心理学会期刊《实验心理学:人类知觉与绩效》Experimental Psychology: Human Perception and Performance的报告,其主要合著者杜克大学博士史提芬R.米特罗夫Stephen R. Mitroff说:“利用真实地考验认知能力或其他大脑功能的游戏应用软件,众多的移动装置(智能手机和平板电脑等)为研究人员提供了一个令人兴奋的崭新的众包一项实验的方法。过去在实验室里耗费数十年进行研究的问题,或者说根本无法在实验室里找到现实答案的问题,现在可利用在较短时间内收集的大数据得以考察。
研究人员与这款广受大众喜爱的游戏《机场安检扫描仪》Airport Scanner的开发商Kedlin Co.协作以展示移动科技收集数据的潜力,游戏考验玩家发现并指出正在通过X光扫描仪的行李里面的违禁品的能力。玩家逐件地审视箱包,点按触摸屏指出违禁品。游戏开始时玩家日志上列举了一些常见的违禁品(如枪支,手榴弹,弹簧刀等)和非违禁品(如耳机,衣服等),随着游戏的进行,这个列表会从寥寥几项扩张到数百项。
这份报告中提到,2013年1月至2014年11月期间,这款游戏提供了从超过7百万智能手机或平板电脑的超过20亿次的考验所产生的匿名数据,一直以来米特罗夫和他在“杜克认知神经科学中心”的研究团队正在对这些数据进行分析。玩家们在这款游戏安装到智能手机或平板电脑时同意提交相关数据。
游戏中有一个研究项目是考察玩家们发现罕见物品(在少于0.1%的行李中出现)的能力。
米特罗夫说:“像这样的罕见物品出现在屏幕上,意味着你在1000次考验中才能碰到1次。在实验室环境里,需要太多次考验才能统计出如此接近现实的概率(这样的工作量对于研究人员来说过于繁重)。在大型数据集中,我们能在数百件个案中找到大约30个最罕见的目标”
通过另一个实验还发现,当两件违禁品出现在同一件箱包里时,玩家们容易漏掉1件,而两件不同违禁品出现在同一件箱包里漏掉其中1件这种情况发生的可能性大于两件相同违禁品的情况。举例来说,相对于发现一个炸弹却漏掉另一个炸弹的个案,更多的情况是玩家们发现了一罐汽油却漏掉了一个炸弹。
米特罗夫说:“尽管利用游戏界面来评估认知能力对于心理学研究领域已算不上什么创新,奇迹般的移动互联技术为大规模地研究认知过程提供了可行性。早在1998年,哈佛大学医学院博士杰瑞米M.沃尔菲Jeremy M. Wolfe就分析了1百万次考验,以研究视觉搜寻。这样庞大得足以震撼人心的数据量是历时10年收集取得的。而今天我们却能够通过《机场安检扫描仪》仅仅用1天的时间就收集到超过1百万次考验的数据。”
根据这份报告,众包的优势还包括,它是一种成本低廉的自动地连续地收集数据的方法,它还能模拟现实中的复杂情况,而这些复杂情况是在实验室里难以应对的。
然而,报告的合著者们指出,为取得用于研究的数据而采取的众包方式确实存在短板。研究人员必须具备开发充满乐趣的游戏应用软件的技能,否则就需要与游戏开发商合作。收集来的大量数据未必就是高质量的,优质数据的获得有赖于精心设计的贯穿于整个游戏的留给玩家们作答的问题。以众包方式采集数据意味着研究人员无法选择玩家。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16