京公网安备 11010802034615号
经营许可证编号:京B2-20210330
做蚱蜢、蜘蛛还是狐狸?新兴大数据公司的四种理念
随着大数据概念的提出,新兴相关数据公司也犹如雨后春笋般出现,想象一下每早与大数据创业梦想一起醒来,这确实是一种美妙的感觉。粗浅地想象一下貌似处理大数据很容易,你只需要:
1)一个使一切工序“自动化”的想法
2)一伙能够拿出一个个算法的“数据科学家”
3)数据!大量的数据!
如果你已经有了一个基本的想法,而至于那些“数据科学家”们,你通常可以在和你合伙的小伙伴们中找到他们(如果没有的话,去哈佛、耶鲁、伯克利或者纽约大学这样的高校碰碰运气吧)。 万事具备,只欠东风,那么问题来了,该如何找到数据呢?通常有以下几个可以考虑的备选策略。
策略1:蚱蜢——相信开放数据吧!
蚱蜢先生是个乐天派,他总是告诉自己:“别担心,总会有可供使用的数据出现的,说不定它们之中还会有可以自由访问的呢!”不论现在或是将来,他相信开放数据,这一切都是为了提供他自己的服务。
这种开放数据策略可以在金融和运输市场中带来可盈利的成果。例如,初创公司往往可以运用商品运输信息,并且将它与货物与市场价格进行交叉关联,从而对有关的工业提供高度相关的信息。
这个方法的主要缺点是数据的开放范围往往有限。事实上,由于伦理或是经济方面的原因,当你想研究一个具体的东西,比如一个人、一个产品或一个地址时,开放的数据总是有所遗漏的。无论如何,最有用的东西往往是那些自己私有的(真是幸运)和花钱买来的(真是悲催)。
策略2:蜘蛛——编织你自己的网络吧!
蜘蛛先生总是那么一丝不苟。“没有数据?没关系,让我们去寻找它。”蜘蛛先生创建了一个网络结点以供他捕获数据,有时他从一个小结点出发,然后慢慢寻找更大的。蜘蛛先生将制造所有的接入点和链接器,并允许所有的参与者在使用他的服务的同时时把数据提供给他。
大多数的在线营销者采取这样的做法:这意味着你的“tracker”(从第三方网站获取流量的组件)都在网上,从而能够有最大化的数据量和最大的网络可能性。而如今,这一切正在向移动应用端转移,我们不在谈论如何运用“tracker”而是如何运用SDK(软件开发工具包)。在我们生活的现实世界中,Lokad公司已经构建了一个延伸到超市收银机的网络,使得大部分的专用收银机和库存管理程序间实现了简单的链接,从而为超市库存管理提供了一个有效的解决方案。
如果一切顺利,蜘蛛先生的方法将使得他足以建立一个扩张速度很快的成功企业。然而,这样的方案对以下两个风险因素极其敏感:
蜘蛛网太脆弱了(一个大的网络参与者可以决定“改变游戏规则”并摧毁一切)
足够肥美的昆虫太少了(也许那些大型客户和真正有兴趣的客户并不在这个网络的覆盖的范围内)
策略3:狐狸——狩猎“大集团”!
狐狸先生在哪里寻找“大数据”呢?答案是在那些已经把“大数据”喂得饱饱的大企业里。 狐狸先生按照以下几个步骤行动:
首先,他提出一个问题的可能的解决方案(例如,减少欺诈行为,提高你的广告购买的投入,增加你的邮件营销途径,采购性能更好的原材料,等等) 接着,他开始收集客户资料,并尝试实现解决问题的方案 最后,他将运用从第一个客户那学来的知识,对之后客户提出的问题给出更为简化的解决方案。
狐狸先生的一生十分艰辛,因为在他迈出走向成功的第一步时,就必须坚信自己能够解决那些自己从未解决过的问题。为此,他必须激发出自身强大的欲望(为了吸引大集团老总的注意),招摇自己的能力(大谈算法、职称、学历),炫耀自己所有的华丽衣冠(那些使人耳目一新的图表设计规划)。因此,“大数据”狐狸是一个吃力不讨好的角色,往往在他得到用真实的数据证明自己的机会之前,就不得不费尽心思地去说服别人。
当狐狸先生成功时,他便可以真真正正地为潜在的客户解决一个有直接价值的实际问题了。然而,这么做同样有非常显著的副作用:那些辛辛苦苦为第一个大客户建立的产品、服务和模型往往将会被卖给他们的竞争队手,一些相对较小的客户,这就相当于狐狸先生教会了自己的大客户如何更好服务于他们的竞争对手(那些小客户)。这意味着,参与其中的大集团们有时将会间接地帮助自己的竞争者去以更低廉的价格获得服务,从而无形之中充当了替罪羊的角色。
策略4 工具制造者!
既然所有人都想玩转大数据,那么为什么不把大数据分析交给工具,而我们只需成为工具制造者。
大数据分析工具市场是一个竞争化的市场,既有一些新创立的小企业的参与,也有一些类似于谷歌、微软、Oracle等的行业龙头的参与。同时,大数据分析工具市场也是一个强吸金市场,单2014年就有数十亿美元的投资额。然而,当这次大数据分析的热潮过去之后,大数据分析工具的需求是否还会持续?这是目前该市场面临的主要问题。这极其类似淘金时代过去后,对镐这种工具的生产是否还具有大规模可持续性的问题。当然,目前我们对大数据的分析尚停留在石器时代,能够进行大数据分析的“镐”还没有完全被开发出来。智能计算机系统需要更高效更可控的分析工具。就让我们先生产出“镐”吧,然后期待以后的某一天可以生产出大数据分析的“手提钻”!--cda数据分析师考试
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21 很多数据分析师每天盯着几十个指标,但当被问到“这套指标要支撑什么业务目标”“指标之间是什么逻辑关系”“业务变化时如何 ...
2026-05-21在数据驱动决策的时代,数据质量直接决定分析结果的可靠性与准确性,而异常值作为数据清洗中的核心痛点,往往会扭曲分析结论、误 ...
2026-05-20 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标在所有行业都适用”“哪些指标只对电商有意义”“二者如何搭 ...
2026-05-20Agent的能力边界,很大程度上取决于其掌握的Skill质量和数量。传统做法是靠人工编写和维护Skill,但这条路很快会遇到瓶颈。业务 ...
2026-05-20在统计分析中,方差分析(ANOVA)是一种常用的假设检验方法,核心用于分析“一个或多个自变量对单个因变量的影响”,广泛应用于 ...
2026-05-19 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“什么是指标”“指标和维度有什么区别”“如何定义指标值的计算规则和 ...
2026-05-19想高效备考 CDA 一级,拒绝盲目刷题、冗余学习?《CDA 一级教材知识手册》重磅来袭!以官方教材为核心,浓缩 13 章 103 个核心考 ...
2026-05-19在数据统计分析中,卡方检验是一种常用的非参数检验方法,核心用于判断两个或多个分类变量之间是否存在显著关联,广泛应用于市场 ...
2026-05-18在企业数字化转型的浪潮中,很多企业陷入了“技术堆砌”的误区——上线了ERP、CRM、BI等各类系统,积累了海量数据,却依然面临“ ...
2026-05-18小陈是某电商平台的数据分析师。老板交给他一个任务:“我们平台的注册用户已经突破1000万了,想了解一下用户的平均月消费金额。 ...
2026-05-18【专访摘要】本次CDA持证专访邀请到拥有丰富物流供应链数据分析经验的赖尧,他结合自身在京东、华莱士、兰格赛等企业的从业经历 ...
2026-05-15在数字化时代,企业的每一次业务优化、每一项技术迭代,都需要回答一个核心问题:这个动作到底能带来多少价值?是提升了用户转化 ...
2026-05-15在数据仓库建设中,事实表与维度表是两大核心组件,二者相互关联、缺一不可,共同构成数据仓库的基础架构。事实表聚焦“发生了什 ...
2026-05-15 很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问 ...
2026-05-15【核心关键词】互联网、机会、运营、关键词、账户、数字化、后台、客户、成本、网络、数据分析、底层逻辑、市场推广、数据反馈 ...
2026-05-14在Python数据分析中,Pandas作为核心工具库,凭借简洁高效的数据处理能力,成为数据分析从业者的必备技能。其中,基于两列(或多 ...
2026-05-14 很多人把统计学理解为“一堆公式和计算”,却忽略了它的本质——一门让数据“开口说话”的科学。真正的数据分析高手,不是会 ...
2026-05-14在零售行业存量竞争日趋激烈的当下,客户流失已成为侵蚀企业利润的“隐形杀手”——据行业数据显示,零售企业平均客户流失率高达 ...
2026-05-13