京公网安备 11010802034615号
经营许可证编号:京B2-20210330
寻找方向:如何看准大数据行业的风潮
大数据不仅仅是一个营销词汇,大数据是一种思维,一种技术。一言以蔽之,大数据最直接的意义就是让“随机性”的事情变得可提前预测,从而提高效率和行动价值。下文主要是跟大家分享大数据领域的创业思考,大数据行业的创业机会如何,未来的创业方向又有哪些。
1 资本层面关注点
对于大数据项目,投资人到底看什么?在写这篇文章之前,我们与多家投行的投资人曾经做过访谈,下面是我们根据访谈内容整理出来的内容。
大数据没有直截了当的变现模式,那么一个新创大数据企业想要获得成功,拿什么去拼?当然是人才。这也是投资人最关注的东西。
投资人告诉笔者,对于一个大数据项目,他们最看重的是团队。那怎么看团队呢?一般从团队技术能力、背景、过往项目经验和创始人四个方面来看。大数据对技术的要求非常高,投资人看项目的时候,首先看的就是创始人的技术能力。一般情况下,投资者会更加青睐拥有技术背景的创始人和他的项目。
还有就是看项目的商业模式和变现能力。看项目方面,投资人会去看你的项目对应的国外成熟企业,或者说你的项目对应的竞争者是谁。由竞争者经营的情况来预估你在其领域的市场份额和变现能力。商业模式方面,投资者会看你的客户(用户)体量和数据源。你的客户群体有多大?你手里有哪些具体业务上的数据?这些数据如何产生价值,应用到你的客户身上?解决好这3个问题就成功了一半。
大数据项目变现方向,投资人关注的是你的项目是否能够快速直接的产生价值,而且有持续的创收能力。
解决好以上几个问题,新创大数据公司想要拿到融资就非常容易了。
2 大数据垂直领域热门的投资方向
①Hadoop 商业化
简单来说就是做Hadoop的收费版本。Hadoop本来是开源的,但是在具体业务场景中,还缺乏很多功能,那么Hadoop 商业化就是去完善这些功能,使其更好的应用于企业的业务场景。Hadoop 商业化最典型的公司就是Hadoop的三驾马车,Hortonworks,Cloudera和MapR,Hortonworks目前已经在纳斯达克上市。中国相应的做Hadoop 商业化的公司是星环科技。
用大白话来说就是基于应用场景下的数据框架 。比如说大数据架构里的查询引擎、存储引擎、计算模型等等,这个主要是基于大数据技术方向的,比如说WibiData,它提供了对Hadoop的封装,连接前端应用到Hadoop基础设施。
③NoSQL数据库
非关系型数据库和云数据库服务。典型的国外企业有MongoDB 和Datastax。目前,创业公司MongoDB的估值已超过16亿美元,而在中国,基础云服务商青云QingCloud已经推出了基于MongoDB的集群服务,名字叫做青云QingCloud MongoDB。
④分析和可视化
对应的国外企业有Tableau、Datameer。国内新创的大数据企业中,也有很多大数据企业在做可视化服务。
⑤行业大数据应用
为社交媒体、广告公司、企业客户、电子商务等行业客户提供数据分析,帮助这些行业提升数据分析的水平,如DataSift、RelateIQ、RocketFuel等创业公司。
3 大数据行业现有的商业模式
谈到商业模式,肯定就要说到2B还2C的问题。
2B是目前大数据行业主要的商业模式,将大数据变为一种服务,服务的对象是企业或机构。比如现有的大数据企业里,星图数据,Hortonworks,Cloudera,星环科技、Talkingdata 都是2B的商业模式。从他们的运营状况,不难看出,2B的商业模式,要么是做解决方案(类似外包),要么就是做工具。
预计未来所有的互联网企业也好,传统企业也好,都会在企业内部成立大数据部门,那么到那个时候,解决方案的市场份额还会多么?不肯到也不否定。对于一家企业来说,大数据就是自己的资产,相信企业更倾向于自己管理自己的内部资产。所以我们大胆的预测,解决方案只是目前大数据行业的权宜之计,未来企业会用自己的人才管理自己的大数据,用自己的人才使用自己的大数据。做工具是目前较为主流的模式。Palantir其实也是做工具。
2C方面,在整理这份内容的时候,我们发现2C的产品非常少。女性经期助手、百度指数这样勉强算是2C的大数据产品。而大数据2C方面的产品,更多的是倾向于应用。可穿戴设备其实也算是大数据应用产品之一。
说了这么多,你肯定会问我了,那么腾讯、百度和阿里巴巴这样的企业,他们的大数据又是什么样的模式呢?在笔者看来,BAT企业的大数据商业模式都是2C+2B的模式,我们可以简称为复合型的商业模式,因为他们服务的用户有企业用户也有个人用户。
总结一下,现有的商业模式里,哪个最好?笔者个人认为是2B+2C模式。这样的模式是最健康的模式,形成了一个商业闭环。
用一句话来说就是:你收集用户的数据,分析出报告,然后给到的对应的企业,对应的企业根据数据反馈,从而开发或制造出更好的产品,让用户享受更智能更美好的生活。这整个过程中,大数据是贯穿始终的。
那么,现有的大数据公司,都是如何赚钱的呢?
①广告、营销
这一类主要集中在第三方大数据营销公司里。典型的企业包括缔元信、时趣这样的公司。他们主要的业务就是帮助大数据分析能力较弱的公司来做大数据分析,优化广告和营销的路径,使市场投入的非常产生更大的价值。
②直接卖数据的公司
典型的企业有数据堂。
③做工具或者服务
目前的移动统计工具就是这一类,还有做Hadoop套件的也是这一类公司。
④卖报告或解决方案的
做大数据解决方案的公司就太多太多了,典型的公司为IBM。
⑤跨界和融合
Talkingdata联合创始人蒋奇先生告诉我们,Talkingdata后台有移动互联网各个热门手机游戏的数据,包括用户的设备数据、行为数据、日常数据和游戏里的消费数据等等。根据这些数据,可以对这些游戏用户进行用户画像。
以招行信用卡推广为例,Talkingdata通过大数据分析发现,《刀塔传奇》以及《我叫MT》这两款游戏的用户属性和招商银行信用卡中心需要的用户属性很契合,于是促成了招商银行和的合作,还支持了后续的信用卡积分的礼包和活动等。
这次合作为招行信用卡带来了5万个绑定用户。一般情况下,银行类的应用要实现转化的平均成本在两百到三百块钱之间,而这样的跨界合作,招商银行基本上没花一分钱,就达到了5万转化率,理论上省掉了上千万的费用。这就是跨界和融合。
跨界和融合,其实也是大数据思维里最重要的一环。大数据就像是钱一样,你得让它流动起来才能产生价值。
4 大数据行业的创业方向和机会
①2B方向
大数据创业的2B方向,更多的是做工具和服务,如数据可视化、商务智能、CRM等。
现有的大数据工具有着技术门槛高、上手成本高、和实际业务结合较差以及部署成本高,小公司用不起等特点。那么新创企业就可以根据以往这些产品的缺陷,来做更适合市场和客户的大数据分析工具和服务。另外,将大数据工具完整化和产品化也是一个方向。新一代的大数据处理工具应该是有着漂亮UI,功能按键和数据可视化等模块的完整产品,而不是一堆代码。
②2C方向
大数据一个很大的作用就是为决策做依据,以前做决定是“拍脑袋”决定,现在,做决定是根据数据结果。在我们的生活中,需要做决策的时候太多太多,尤其是像笔者这样选择性困难的天秤座,非常需要大数据来辅助决策。个人理财(我的钱花哪去了,哪些可以省下来)、家庭决策(孩子报考哪所大学)、职业发展/自我量化(该不该跳槽,现在薪水到底合适不合适 )以及个人健康都可以用到大数据。
5 我们的创业建议
①想清楚谁为你买单(找用户);
②痛点是什么(找需求);
③稳定/独特的数据源(找数据);
④靠谱的人做靠谱的事(找人才);
⑤考虑2C的产品方向;
⑥忘记科技行业过往经验;
⑦将大数据产品化(小而美);
⑧深耕一个领域,不断的试错和迭代。
其他新创大数据公司创始人也提出过自己的建议。九次方大数据集团总裁王参寿认为深耕大数据领域,坚持才是王道:“大数据行业创业就像爬泰山,爬不到山顶,看不到太阳。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16