
大数据所处的时代:最好也最坏_数据分析师
4月7日消息,据国外媒体报道,所以,你正想弄清楚你的公司到底应不应该投资大数据分析。你可能是个CIO, 你也可能是做市场营销的, 但这些都无关紧要。你肯定正在观察别人的行止举动,以确定这项技术会不会像智能手机和微软软件一样风靡全球。
在“最好的时代”的这方面,常常很容易听说有企业利用大数据获得巨大优势的故事。上星期,鲍勃-里奥里罗在《信息管理》杂志中写到美国医疗保健,该机构从多个部门获得利益,包括“金融分析、欺诈和废物监管、成本管理、药房福利管理、临床改善等等”。他援引该公司负责数据科学、解决方案以及战略方向的董事拉维尚贝格的一句话,“数据在商业集团内部相互关联,我们很难找到一个领域跟这些数据不直接或不间接相关的”。
虽然该文章篇幅短小,但是可显然看出,美国医疗保健作出了很大的承诺,而且从大数据受益良多。
游戏生产商King Digital Entertainment通过推出糖果粉碎传奇这款游戏而出名。该游戏同时使用Hadoop和其他工具,由60多位数据科学家共同研发。他们分析“大片玩家的数据”,包括花在玩游戏的时间、交易方式、使用的设备等。反过来,他们根据上一周的计算数据来改善相应的设计,以留住更多的游戏玩家。
在“最坏的时代”这方面,同样能容易的找到一些评论员和调查者,他们给人们的印象是大数据比人们预想的还夸张。
甚至大数据的支持者玛丽-沙克利特上个月在《技术共和国》上写到关于为什么大数据分析师有时候会罢工,包括她所提到的未能预见的流感的爆发、油价下跌,甚至棒球赛胜利。她准确地指出:“在预测人类行为这一方面,大数据分析仍处在早期的学习阶段。现代人类已经在地球上存活了20万年,我们始终没有搞明白为什么我们会我行我素!即使通过联想“思考”和加工处理,机器在预测人类行为结果上仍会受到限制。”尽管如此,这样的前景仍会说服你的主管投资数百万美元进去吗?
据eWeek上周报道,一项由Snowflake Computing委托进行的研究显示,大数据分析被“大肆炒作,却未被有效利用”。Snowflake Computing致力于为结构化和半结构化数据开发数据仓库解决方案。研究覆盖了逾300位技术专家与数据分析专家,结果显示,只有16%的人曾投资大数据,而且,“在已所投资的公司中,5%的公司充分使用了大数据策略,11%的公司仍在试行中。”根据研究结果,41%的人表示他们“感兴趣”,但还没有进一步了解大数据。
据Computerworld几周前报道,一项覆盖了超过1100位IT经理的调查显示,经理们“对大数据的兴趣持续上升“,超过半数的经理目前正在或者准备在一年内开展以数据为主导的项目。然而,调查发起者约翰娜-安布罗西奥注意到,目前仍然面临预算约束,安全问题以及挥之不去的产品质量问题。“大约40%的人评价目前的产品和服务为优或好,但44%的人认为它们只是一般甚至差。”
当然,没有什么是完美的。
最后以一个故事来结尾。这个故事看起来似乎是这样的,但实际上却又是另一个样子。伯纳德-马(Bernard Marr)几周前在Business Insider上的一篇文章解释了为什么大数据只是一时之热。人们很同意他的观点,对云计算有相同的看法。未来某一天,我们将不再讨论云,而是关注基建,我们也将不再讨论大数据,我们将讨论的只是数据而已。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28