京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据对社会创新的作用_数据分析师培训
“大数据”一语用来描述数据的日益增长和我们不断加强的有效利用数据的的能力,并且大数据已经在科学和商业领域获得了极大的应用。但是在社会领域“大数据”的应用却是滞后的。
大数据所提供的信息和帮助解决社会问题之间存在巨大的鸿沟。有一些社会问题可以通过大数据来解决,例如利用交通流量数据来缓解高速公路交通拥堵问题;但另一些社会问题的解决却没那么容易,例如如何利用数据来解决无家可归者的问题,或者贩卖人口的问题?
社会问题之所以复杂,是因为涉及的利益相关者众多,所以目标也是多重的。不像技术问题一样,目标往往是单一的,比如说优化。但在社会问题上,到底什么叫“优化”呢?尤其是社会问题往往涉及政府的公共政策和行政机构的介入,使得社会问题又不单纯是社会问题,而成为政治问题。
大数据使用的问题
另一个问题与大数据本身的使用有关系。事实上,但切入一个社会问题时,你可能会遇上不上数字,但这些数字往往不是结构化的,很难被调用。结构化的大数据相对缺乏有四个主要的原因:数据淹没在行政系统、数据管理标准缺乏、数据往往不可靠以及数据可能导致意想不到的后果。
比如说,全球每年被贩卖的人口估计高达3000万人次,这是个约320亿美元的“产业”。要打击人口贩子,大数据当然可以帮忙。但问题是人口贩子用的手机、社交媒体、在线广告和其他网络平台产生的数据,并没有被系统的收集,更遑论共享给相关的组织。当然原始数据本身的收集就很难,并且各个组织之间的数据共享做得也不到位。
更糟的是,打击人口贩卖的各家机构经常互相争夺的稀缺资源:无论资金、捐赠还是来自媒体和社会的认同。因为这种竞争,各机构之间的数据共享几乎不可能。例如,北极星项目(the Polaris Project)一直致力于打击人口贩卖。2003年至2006年,Polaris为被贩卖的幸存者提供热线电话。2007年,美国卫生和公众服务部选定Polaris作为全国首个国家贩卖人口资源热线。多年来,Polaris记录了75000多个呼叫;然而,获得这些数据受到限制,其可靠性和来源鲜为人知。
如果Polaris信息向公众开放,并结合其他数据源,如经济指标、运输路线、教育统计和受害者服务等,能更加有效帮助打击人口贩卖。2012年Google Giving(谷歌捐赠)授予Polaris和另外两家国际反人口贩卖组织300万美元以资助将他们三条电话热线收集到的数据予以整合,并发展为国际热线。目前,三个组织都已在全球人口贩运热线网络(Global Human Trafficking Hotline Network)下联合起来。这是一个积极的迹象,但是这次的合作成果仍有待观察。
增加大数据使用的步骤
大数据于决策时充分了解信息以帮助解决世界上最棘手的社会问题有着巨大潜力。但是要做到这一点,有关数据的收集、组织和分析的问题必须首先得到解决。下列四项建议有助于创建数据集,并以此为据进行决策。
首先,在关键问题上建立全球数据银行。全球需要对复杂的问题,如贩卖人口、全球饥饿和贫穷创建大型数据银行。数据银行有处理不同数据格式和描述数据集的元数据的能力。为了做到这一点,促进专题问题的数据共享需要创建多部门的联盟。
其次,让公民参与和公民科学。大数据不是专业人士的地盘。公民也可以参与帮助创建和分析这些数据集。随着通过开放的数据平台数据激增,越来越多的公民通过“公民科学”来开创新理念和产品。
再次,建立数据管理人和分析人的框架。今天,我们不仅缺乏可以解决社会问题的数据管理人和分析师,对于接受必要培训和能力的现有人员,我们的途径也是有限。在大多数情况下,我们将数据科学留给了科学界和商界。社会科学往往给学生提供简单的统计基础知识。如果我们要利用大数据,这种做法是不可接受的。我们需要让学生和分析人员掌握必要技能,以管理数据同时也创建大型数据集。我们要开发课程,让学生了解数据的组织、保存、可视化、搜索和检索以及使用。除了这些技能,要让学生能更多地思考能利用数据做什么是至关重要。考虑数据集之间的网络关系,以及如何发现数据集中的潜在模式,是需要开发的能力。
最后,促进虚拟实验平台。为了提高我们对如何使用大数据解决社会问题的理解,我们需要推动更多的实验。虚拟实验平台,允许个人交流思想、与别人的想法交流、携手合作以找到解决问题的方法或利用机会,它能够将各个感兴趣的相关方聚集在一起共同打造大型数据集、开发创新算法来分析和可视化的数据,并开发新知识。如果我们要使用大数据解决社会挑战,虚拟实验平台是必不可少的。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在中介效应分析(或路径分析)中,间接效应是衡量“自变量通过中介变量影响因变量”这一间接路径强度与方向的核心指标。不同于直 ...
2025-12-30数据透视表是数据分析中高效汇总、多维度分析数据的核心工具,能快速将杂乱数据转化为结构化的汇总报表。在实际分析场景中,我们 ...
2025-12-30在金融投资、商业运营、用户增长等数据密集型领域,量化策略凭借“数据驱动、逻辑可验证、执行标准化”的优势,成为企业提升决策 ...
2025-12-30CDA(Certified Data Analyst),是在数字经济大背景和人工智能时代趋势下,源自中国,走向世界,面向全行业的专业技能认证,旨 ...
2025-12-29在数据分析领域,周期性是时间序列数据的重要特征之一——它指数据在一定时间间隔内重复出现的规律,广泛存在于经济、金融、气象 ...
2025-12-29数据分析师的核心价值在于将海量数据转化为可落地的商业洞察,而高效的工具则是实现这一价值的关键载体。从数据采集、清洗整理, ...
2025-12-29在金融、零售、互联网等数据密集型行业,量化策略已成为企业提升决策效率、挖掘商业价值的核心工具。CDA(Certified Data Analys ...
2025-12-29CDA中国官网是全国统一的数据分析师认证报名网站,由认证考试委员会与持证人会员、企业会员以及行业知名第三方机构共同合作,致 ...
2025-12-26在数字化转型浪潮下,审计行业正经历从“传统手工审计”向“大数据智能审计”的深刻变革。教育部发布的《大数据与审计专业教学标 ...
2025-12-26统计学作为数学的重要分支,是连接数据与决策的桥梁。随着数据规模的爆炸式增长和复杂问题的涌现,传统统计方法已难以应对高维、 ...
2025-12-26数字化浪潮席卷全球,数据已成为企业核心生产要素,“用数据说话、用数据决策”成为企业生存与发展的核心逻辑。在这一背景下,CD ...
2025-12-26箱线图(Box Plot)作为数据分布可视化的核心工具,凭借简洁的结构直观呈现数据的中位数、四分位数、异常值等关键信息,广泛应用 ...
2025-12-25在数据驱动决策的时代,基于历史数据进行精准预测已成为企业核心需求——无论是预测未来销售额、客户流失概率,还是产品需求趋势 ...
2025-12-25在数据驱动业务的实践中,CDA(Certified Data Analyst)数据分析师的核心工作,本质上是通过“指标”这一数据语言,解读业务现 ...
2025-12-25在金融行业的数字化转型进程中,SQL作为数据处理与分析的核心工具,贯穿于零售银行、证券交易、保险理赔、支付结算等全业务链条 ...
2025-12-24在数据分析领域,假设检验是验证“数据差异是否显著”的核心工具,而独立样本t检验与卡方检验则是其中最常用的两种方法。很多初 ...
2025-12-24在企业数字化转型的深水区,数据已成为核心生产要素,而“让数据可用、好用”则是挖掘数据价值的前提。对CDA(Certified Data An ...
2025-12-24数据分析师认证考试全面升级后,除了考试场次和报名时间,小伙伴们最关心的就是报名费了,报 ...
2025-12-23在Power BI数据可视化分析中,矩阵是多维度数据汇总的核心工具,而“动态计算平均值”则是矩阵分析的高频需求——无论是按类别计 ...
2025-12-23在SQL数据分析场景中,“日期转期间”是高频核心需求——无论是按日、周、月、季度还是年度统计数据,都需要将原始的日期/时间字 ...
2025-12-23