
大数据创业,绕开BAT,找准红利方可成功
随着大数据时代的到来,其中产业链的红利也将逐渐呈现,催生了诸多相关的创业项目。笔者以一家定义为大数据加工、分析、流通的创业公司“云见”为例,探讨下数据在流通过程中增值的可能性。
大数据的红利在哪?
处在大数据最上游的是数据产生端,其中最有代表性的是BAT这样的企业。与数据生存者对应的另一端是需求端,即服务主体,同样是包括政府、机构、企业、个人。而处在中间的则是数据的处理加工商,如云见这类公司。
那么,红利在哪里呢?首先,数据生产端红利已尽。BAT因为自有数据资源可以自嗨,比如百度有“百度迁徙”、“百度精算”;阿里有 “阿里云”、“支付宝-花呗”;腾讯有 “腾讯云分析”,BAT自产自销模式代表了大部分拥有数据源的玩家。
那么剩下的红利就集中在了中间部分,其中有两种模式:
模式一:与业务场景结合,做产业类平台,如同花顺、恒生电子。
模式二:数据的再加工利用,即从运营商、互联网公司获取原始数据信息来进行分析,再提供给用户关于价值和趋势的信息以换取价值。
相比于模式一的深耕,模式二因为进入门槛、资源要求度都相对较低,所以云见选择以这种形式进行切入。
既然类似云见这样的小微企业,先天没有数据源的优势,那么如何让数据在流通过程中增值呢?
让数据在流通过程中增值的方法
(1)降低数据来源的成本
最普遍的方法包括通过第三方购买数据、爬虫爬回数据、合作方授权数据、免费的开放数据。数据获取中肯定要付出人力、资金成本,所以解决数据源是大数据创业公司首要面临的问题。
目前行业做得较创新的是“数据堂”,这家作为挂牌新三板的第一个大数据资源公司,采用“众包”形式,由服务企业提出需求,数据堂直接通过众客堂采集数据。同时,众客堂用户也是处理数据的方式,可甄别数据真伪和有效性。
当然,相比于成熟型的数据公司,云见还未具备这样的数据采集实力,所以其倾向于用合作授权数据的形式,低成本获得独家数据源。
(2)着眼于未来的数据加工
数据加工包括整理合并、优化、排错等方面,数据本身庞杂无章,精炼后的数据能够发掘其中的规律性而进行精准应用。当然,这只是数据加工的通用价值,大数据创业公司关键要解决数据价值深化或兑现的问题。
云见做出两个选择:
与垂直领域对接发现价值
因为消费升级、移动互联网的人口红利消失,那些大规模的对受众社会属性不加区分的水平产品很难生产。在大数据时代,通用型信息的价值正减小,任何拥有数据加工能力的人都可说出用户画像,但针对垂直领域的数据价值需求则需深耕才能解决。
预测未来比看见现在更重要
云见从成立之初就专注在“算法”上,用模式识别的方式形成自己的经验库以预测用户的未来行为,区别于竞争对手赚解决方案服务费的方式,这也符合其技术驱动型团队的特点——更看中“稳”而不是“快”。
(3)用“mall”的形式
作为大数据元老级公司的“数据堂”15年推出了国内第一家网上数据商城“Data Mall”,数据商城的形式最大化地提高了数据交易效率,简单理解就是在通用的入口,用户可以进行重复消费;同时,平台方通过商城获得接入用户的机会,用户成为“传感器”——作为流量入口,又将数据反馈至商城上,担任消费端和供给端的双重角色。
云见也在筹建这样的“轻模式”,除了上述提及的优势,考虑到基于用户需求的非标准化特性,API接口(应用程序编程接口)本身是很难进行标准化的,所以“mall”的呈现方式在一定程度上解决了API形式上的标准化,同时,“mall”改变了传统打包服务的模式,减少在销售、推广、人力上的成本。
当然,大数据创业的成功还有一部分因素是依赖在大势上。
(4)政策上的大势
2015年7月,国务院办公厅发布《关于运用大数据加强对市场主体服务和监管的若干意见》,这是顺应大数据时代潮流,运用现代信息技术加强政府公共服务和市场监管,推动简政放权和政府职能转变的重要政策文件。
文件表示将充分认识运用大数据加强对市场主体服务和监管的重要性、运用大数据提高为市场主体服务水平、运用大数据加强和改进市场监管、推进政府和社会信息资源开放共享、提高政府运用大数据的能力和积极培育和发展社会化征信服务等。
(5)行业上的机会
目前较有代表性的大数据公司是“数据堂”和“聚合数据”,共同特点是拥有如BAT量级的大B用户。但相当部分的小B企业以及政府决策、公共服务、金融、电信等领域对数据存在需求,再加上数据供给端也出现了多元化的现状,所以大数据行业本身很难做到一家独大,类似于云见这样较小型的数据处理公司还是有机会在其中馋食大数据的红利。
创业的机会在哪里
池静若认为现在大数据产业链才开始发展,大众都把目光聚焦在大数据的两端:一是谁拥有这些数据,二是这些数据到底如何使用。但仅仅在两端是不能解决大数据问题的。
大数据产业的大量机会出现在中间环节,包括采集、聚合、机器学习加工后的数据通过智能管道合法流入到用户的手里。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29