
大数据正如何帮助拯救地球_数据分析师
在惠普Vertica分析平台的帮助下,国际保育组织正利用图像处理数据监控世界各地热带森林的生物多样性。
一年多以前,国际保育组织(CI)正全力应付一个庞大的大数据问题。
非营利环保组织的使命是保护自然及其生物多样性,但监测和分析物种的健康——尤其是在热带森林中有地球上一半的动植物——是一个费体力和劳动密集的过程。
在跨越四大洲的16个地方,CI已建立1000个相机陷阱网络——当动物通过其视点区域,装配有运动传感器的摄像头就会被触发。每2000多公里设置一个站点,摄像头捕捉经过的动物的图像,并试图综合和了解气候变化和土地利用对热带陆地哺乳动物和鸟类的多样性的影响。
检查星球的生命体征
“你和我去看医生,我们检查生命体征——提问,血压,” 首席科学家CI桑迪·安德尔曼如此说道,“我们需要那些各种各样的地球生命体征,这就是我们在国际保护组织与TEAM[热带生态,评估和监测网络]和其他项目真正想做的。”
“我们所做的是制作相机陷阱,所以听起来有点像偷拍,”她补充道,“在整个森林里制作这种陷阱,如此我们就能够发现动物种类和动物行为。”
由于相机陷阱位于地球上一些更偏远的地方,那些地方没有基础设施。团队必须手动收集陷阱中的数据并上传,最关键的是CI科学家运行一系列的脚本和模型,以确定出现在图像中的不同品种。然后,他们融合气候测量(降水,温度,湿度,太阳辐射等),关于数目的数据(生长,存活,森林砍伐等等)和来自公开渠道的土地利用数据,去创造一个该区域的动物种群健康典范,并且看它们是如何随时间而变化的。
“世界上的一切都是相互关联的,” CI的热带生态评估和监测网络代理执行主任豪尔赫·阿乌马达说道,“自然不会存活于国家之间,而是作为一个整体而存在。如果我们维持这个世界,并且以一种聪明的方式,我们需要能够评估自己应该如何改进并迅速作出反应。 “
但这个过程并不简单。大约一年前,TEAM每年的能收集到一百万张图像数据。现在的数据已经超过200万。他们在CI办公室用电脑碾碎这些数据,然后手动分布许多工作。分析这些数据的进程可能需要数周,数月甚至更长时间。
“如果我们想运行我们的指标之一的迭代,就得花费几周时间,”阿乌马达说,“我们清楚我们必须根据代码和问题的数据科学来做,但我们没有足够的规模来快速实现。”
阿乌马达指出,时间至关重要。热带森林CI监控器的所在地被认为是地球上所有动植物一半的所在地,能产生地球上40%的氧气。但根据联合国环境规划署称,46万公顷的热带森林 ——约18000平方英里——正在逐年消失。
当陷阱数据仍然必须手动收集时,惠普帮助CI进行快于原来9倍的数据分析,并且能做到更准确地引导。惠普企业服务软件工程师建立了野生动物图片指数(WPI)分析系统,一个可视化人性化的项目仪表盘和分析工具,可近实时数据驱动观察。
WPI的分析系统使用Vertica和R分析软件,运用物种存在-消失数据(通过处理原始相机捕获数据)和“协变量”(气候,林缘和人类存在的数据)去估计某一区域的物种种类。
“说真的,在环境科学,我们没有驾驭大数据的能力,”阿乌马达说,“我们需要一个系统,可以无缝集成到有用的信息上。这就是我们与惠普的合作变得非常重要的原因所在。”
数据可以改变世界
“我们已经学到了很多东西[在过去的25年],”阿乌马达补充道,“作为一个非营利性的环保组织,如果我们真的想尝试改变世界,很多传统的做法是与政府共事,并努力通过各种干预措施影响改变。但是如果你想以数据驱动的方式去做,你真的需要收集大量的数据。对我们来说与有此专长的机构合作伙伴非常重要,现在在非营利世界不同组织这种情况正在出现。“
到目前为止,CI的TEAM和惠普地球洞察分析出的数据不太令人乐观。 275个TEAM监视器,其中的60个(22%)检测到现存物种要么是显著降低要么与基线水平相比有所降低。例如,西方大猩猩——在刚果共和国极度濒危的物种,从2009年的基准线来看似乎已经下降了10%。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
剖析 CDA 数据分析师考试题型:解锁高效备考与答题策略 CDA(Certified Data Analyst)数据分析师考试作为衡量数据专业能力的 ...
2025-07-04SQL Server 字符串截取转日期:解锁数据处理的关键技能 在数据处理与分析工作中,数据格式的规范性是保证后续分析准确性的基础 ...
2025-07-04CDA 数据分析师视角:从数据迷雾中探寻商业真相 在数字化浪潮席卷全球的今天,数据已成为企业决策的核心驱动力,CDA(Certifie ...
2025-07-04CDA 数据分析师:开启数据职业发展新征程 在数据成为核心生产要素的今天,数据分析师的职业价值愈发凸显。CDA(Certified D ...
2025-07-03从招聘要求看数据分析师的能力素养与职业发展 在数字化浪潮席卷全球的当下,数据已成为企业的核心资产,数据分析师岗位也随 ...
2025-07-03Power BI 中如何控制过滤器选择项目数并在超限时报错 引言 在使用 Power BI 进行数据可视化和分析的过程中,对过滤器的有 ...
2025-07-03把握 CDA 考试时间,开启数据分析职业之路 在数字化转型的时代浪潮下,数据已成为企业决策的核心驱动力。CDA(Certified Da ...
2025-07-02CDA 证书:银行招聘中的 “黄金通行证” 在金融科技飞速发展的当下,银行正加速向数字化、智能化转型,海量数据成为银行精准 ...
2025-07-02探索最优回归方程:数据背后的精准预测密码 在数据分析和统计学的广阔领域中,回归分析是揭示变量之间关系的重要工具,而回 ...
2025-07-02CDA 数据分析师报考条件全解析:开启数据洞察之旅 在当今数字化浪潮席卷全球的时代,数据已成为企业乃至整个社会发展的核心驱 ...
2025-07-01深入解析 SQL 中 CASE 语句条件的执行顺序 在 SQL 编程领域,CASE语句是实现条件逻辑判断、数据转换与分类的重要工 ...
2025-07-01SPSS 中计算三个变量交集的详细指南 在数据分析领域,挖掘变量之间的潜在关系是获取有价值信息的关键步骤。当我们需要探究 ...
2025-07-01CDA 数据分析师:就业前景广阔的新兴职业 在当今数字化时代,数据已成为企业和组织决策的重要依据。数据分析师作为负责收集 ...
2025-06-30探秘卷积层:为何一个卷积层需要两个卷积核 在深度学习的世界里,卷积神经网络(CNN)凭借其强大的特征提取能力 ...
2025-06-30探索 CDA 数据分析师在线课程:开启数据洞察之旅 在数字化浪潮席卷全球的当下,数据已成为企业决策、创新与发展的核心驱 ...
2025-06-303D VLA新范式!CVPR冠军方案BridgeVLA,真机性能提升32% 编辑:LRST 【新智元导读】中科院自动化所提出BridgeVLA模型,通过将 ...
2025-06-30LSTM 为何会产生误差?深入剖析其背后的原因 在深度学习领域,LSTM(Long Short-Term Memory)网络凭借其独特的记忆单元设 ...
2025-06-27LLM进入拖拽时代!只靠Prompt几秒定制大模型,效率飙升12000倍 【新智元导读】最近,来自NUS、UT Austin等机构的研究人员创新 ...
2025-06-27探秘 z-score:数据分析中的标准化利器 在数据的海洋中,面对形态各异、尺度不同的数据,如何找到一个通用的标准来衡量数据 ...
2025-06-26Excel 中为不同柱形设置独立背景(按数据分区)的方法详解 在数据分析与可视化呈现过程中,Excel 柱形图是展示数据的常用工 ...
2025-06-26