
大数据急需攻克的五大世界性难题
世界人民的健康记录:医学领域最急需的资源,人脑图谱:了解身体的各个部分如何运作,统筹世界范围内的铀原料供应:追踪武器化活动与能源供给等这些人们最关注的世界性难题,IBM、谷歌等巨头级企业已经开始对这类高难度挑战发起冲击,这很令人期待。
尽管计算性能、存储容量以及分析技术一直在不断进步,某些现实挑战对于大数据而言仍然过于庞大以至于无法应对。在今天的文章中,我们将探讨五个此类难题 ——看看如何才能将其解决。
如果大数据能够在传统领域之外进一步解决世界性难题,结果会怎么样?到目前为止,IBM、谷歌以及惠普等巨头级企业已经开始对这类高难度挑战发起冲击,其中包括分析繁忙的高速公路上到底会有多少车辆通过某条桥梁,或者计算会有多少用户查看网络浏览器中的一条小广告。谷歌公司甚至公布了一项雄心勃勃的计划,称将解决人类衰老这一历史性难题。
但仍有几大世界性难题等待着我们攻克。在某些情况下,分析所需要的数据根本无迹可寻。在其它情况下,足以应对如此庞大数据量的计算机还没有被发明出来。目前有五大课题值得我们关注。会有大数据技术企业站出来排忧解难吗?我们等待时间带来答案。
世界人民的健康记录:医学领域最急需的资源
大多数人都拥有一份电子健康记录(简称HER),不过其中的内容颇为有限——甚至只包含最近一次健康检查的基本结果。目前足以支撑全世界健康记录资料库的工具与技术已经到位。这样的全球性数据库一旦出现,制药企业就能对其进行分析以开发人民群众最急需的疫苗及药物——也就是说,根据供应链的实际需要进行优先选择。
既然前景一片光明,为什么我们还没有感受到由此带来的益处呢?这是由于目前还缺乏一套访问全球数据的可行机制。“健康记录被保存在一大堆彼此隔离的系统当中,而资料持有者没有足够的动力来分享这些信息,”分布式数据库供应商Cloudant公司联合创始人兼首席科学家 MikeMiller表示。“即使我们真的把所有数据都归拢在一起,也仍然需要通过机器学习算法及实时分析对其进行全面优化。这也正是我们目前正在努力钻研的课题。”
人脑图谱:了解身体的各个部分如何运作
人类大脑模型能够为科学研究带来巨大帮助。医生可以查看肿瘤的生长情况或者了解大脑如何通过一系列功能控制身体的其它器官。目前已经有包括欧洲人类大脑项目在内的多个科学项目尝试在未来十年之内创建出大脑模拟系统。
障碍何在?要完成这项工作,我们需要一台运算速度千倍于当前水平的超级计算机。大脑当中存在数以百万计的神经递质,而且它们彼此之间互相连通、共同数据我们所接触到的“数据”。
“这样的计算规模要求我们从传统的硅芯片领域脱离出来,迈向生物芯片时代——这是分子计算的前提条件,”曾任克林顿政府前副助理国务卿(负责运输体系技术政策)、现任霍华德大学教授的OliverG.McGee解释道。“从直观角度看,分子计算在数据管理方面的运算速度比传统硅芯片高750倍,只有这样的机制才能处理颅腹脑体系当中的关系认知奥秘。”
统筹世界范围内的铀原料供应:追踪武器化活动与能源供给
毫无疑问,在全球范围内收集任何数据都将是一项极为艰巨的任务,但追踪全球铀原料供应至少拥有其积极意义——当然,前提是所有信息碎片都能严丝合缝地被拼接在一起。
数据收集企业Connotate公司CEOKeithCooper指出,我们目前只能解决其中一部分难题,因为某些国家并没有公开其铀原料供应记录。“目前,很多铀储量丰富的国家虽然已经拥有便捷的互联网体系,但却仍然拒绝以标准化方式公布其资源流向。”幸运的是,计算宏观形势倒不太困难——毕竟将铀原料投入武器化领域的国家数量有限。
我们真正需要追踪并掌握的是全球可用铀原料当中最为宝贵的、仅占15%的浓缩铀,他解释道。“我们需要识别并追踪所有与浓缩铀相关的销售活动(通过黑市或者合法渠道)以及矿藏分布,并通过论坛、博客、监管机构及其它周边体系进行数据统计,包括各政府及非政府组织对于铀原料生产数据及开采活动的报道等。为了处理收集到的这些结果,我们还需要设计出一套智能化人机交流方案。”
全球实时犯罪数据:更加主动的警务处理能力
很多地方性执法机构已经掌握着非常丰富的犯罪数据,警务人员则可以在自己的警车内轻松访问犯罪记录数据库,从而根据犯罪嫌疑人的具体情况做出反应。
障碍何在?这些数据只包含过往的罪行,Cloudant公司的Miller表示,其中无法体现刚刚发生或者正在进行中的犯罪活动。由于无法在犯罪活动进行的过程中进行阻止,警方只能被迫采取更为被动的应对措施。
不过情况已经有所转变,Miller指出。举例来说,加利福尼亚州奥克兰市警方已经配备声学监控器用于识别枪声。技术人士将其称为 “ShotSpotter”,配合大数据分析机制即可用于追踪潜在的犯罪发生地点,警员则根据分析结论立即前往对应位置。实时犯罪数据所带来的易处并不局限于执法领域:TruliaLocal热点地图能够提供犯罪活动报告,从而帮助住房买家选择更友善、更安全的生活环境。
追踪儿童行踪:更好、更及时的AmberAlert
时至今日,我们已经拥有很多种通报失踪儿童的方式,例如美国所采用的AmberAlert系统。不过这些通告机制的最大问题在于,只能在事后发起提醒。追踪儿童位置所必要的技术已经存在,当下大部分智能手机都能通过谷歌位置报告功能将儿童的当前所在地发送给父母。与此同时,大众汽车的Car-Net以及福特汽车的MyKey应用也能在青少年驾车到达特殊地理位置时发送报告。
障碍何在?分析。数字营销企业RoundarchIsobar公司副总裁JaisonManian指出,预测技术能够助我们一臂之力。大数据厂商能够分析儿童的行为模式,当然前提是家长愿意分享相关数据。
“预测分析能够追踪儿童的日常行动模式,并在出现严重偏差时立即向父母发出警示,”他表示。只要满足警示条件,信息会被实时发出 ——这能有效阻止重大事故的发生。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
DSGE 模型中的 Et:理性预期算子的内涵、作用与应用解析 动态随机一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明确:TIF 中的地名有哪两种存在形式? 在开始提取前,需先判断 TIF 文件的类型 —— ...
2025-09-17CDA 数据分析师:解锁表结构数据特征价值的专业核心 表结构数据(以 “行 - 列” 规范存储的结构化数据,如数据库表、Excel 表、 ...
2025-09-17Excel 导入数据含缺失值?详解 dropna 函数的功能与实战应用 在用 Python(如 pandas 库)处理 Excel 数据时,“缺失值” 是高频 ...
2025-09-16深入解析卡方检验与 t 检验:差异、适用场景与实践应用 在数据分析与统计学领域,假设检验是验证研究假设、判断数据差异是否 “ ...
2025-09-16CDA 数据分析师:掌控表格结构数据全功能周期的专业操盘手 表格结构数据(以 “行 - 列” 存储的结构化数据,如 Excel 表、数据 ...
2025-09-16MySQL 执行计划中 rows 数量的准确性解析:原理、影响因素与优化 在 MySQL SQL 调优中,EXPLAIN执行计划是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南 在 Python 进行 HTTP 网络请求开发时(如使用requests ...
2025-09-15CDA 数据分析师:激活表格结构数据价值的核心操盘手 表格结构数据(如 Excel 表格、数据库表)是企业最基础、最核心的数据形态 ...
2025-09-15Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09