
大数据创业,数据哪里来?需要跨过几道坎
这篇文章考虑了很久也没下笔,一方面想写得干货一些,一方面又想写得引人入胜一些,纠结来纠结去,终于决定还是以一个中立的用户角度去写,尽量写得大众化一些。
2013年5月10日,在淘宝十周年晚会-马云退休演讲中,马云说:这是一个变化的时代。还有人没搞清楚PC,移动互联网来了;还没搞清楚移动互联网,大数据来了。而变化的时代是年轻人的时代。
马云说的这句话很关键,他不仅提到了大数据,而且更是用一句话阐述了互联网从PC时代,进化到移动互联网时代,然后从移动互联网时代进阶到了大数据时代。有几个关键点很重要:PC时代,全球催生了大量的互联网上市企业,包括谷歌、亚马逊、新浪、搜狐、新东方等等;
移动互联网时代,中国创业热潮风生水起,不仅有大量的移动互联网(包括手游)企业赴美上市,更是诞生了无数个创业奇迹。移动互联网不仅为我们的生活带来了便利,更是把创业热潮推向了历史最高峰。
现在问题来了,大数据时代,创业热潮是不是应该比移动互联网时代更加热闹呢?大数据时代如何创业?大数据创业的门槛又有哪些呢?
先回答第一个问题:大数据时代,创业热潮是不是应该比移动互联网时代更加热闹呢?
据我了解,不是。走在中关村创业大街上,你能收到的100份融资BP里,可能有99份都是APP和O2O项目,但99家里90%以上会重视大数据。
那么大数据时代如何创业呢?请先了解一下大数据的创业门槛。
门槛一:数据
大数据大数据,没有数据怎么玩?那么数据从哪里来呢?
像百度、腾讯和阿里巴巴这样的BAT企业,本身就积累了大量的数据,所以他们玩起大数据来,多半是“闷声发大财”。当然了,也可以说几句BAT企业玩大数据的例子,比如说百度旗下的“百度迁徙”、“百度精算”、“百度舆情”、“百度大数据预测引擎”等等,都是百度的大数据产品应用;阿里巴巴的话,“阿里云”、“支付宝-花呗”、“支付宝-借呗”“芝麻信用”、“蚂蚁金服”等等,都应有了大数据技术。而腾讯方面,“腾讯广点通”、“腾讯云分析”和微信等也都引用了大数据技术。
尔等屌丝没有数据,如何玩呢?
首先,你可以通过第三方购买数据,比如说,数据堂就有很多数据出售和分享;
其次,你可以用爬虫爬回一些数据来存储;
再者,通过给企业、开发者、站长等等授权使用大数据工具来积累数据。这方面的新创企业包括Talkingdata、友盟和DataEye等。
最后,使用免费的政府、企业、和机构开放数据。比如说高德数据的API接口和微博商业数据API接口等等。
总体来说,解决好数据源是大数据创业的必要门槛。关键看你创业的项目是什么。
门槛二:硬件
在北京,我曾经参观过一家大数据初创企业,当时他们还没有拿到融资。我去他们的办公区发现一幕特别心酸的事情。他们的员工挤在一间很小的屋子里办公,而两件较大的屋子都用来安放大数据存储服务器。大数据的存储量是很惊人的,这对机房和硬件设备也提出了新的挑战。
这一点和移动互联网不太一样,你做一个APP,用电脑搞开发,服务器用云服务器就行,按需购买。但是大数据不行,你没法把自家的数据存储在别人的云服务器上,一方面是安全因素,另外一方面也有产权因素。硬件也是大数据创业的门槛之一,但不是最大 的门槛。顺便补充一句,我曾经参观过的那家大数据新创企业,目前已完成百万美元的A轮融资,现在他们家的办公区特别宽敞,恭喜星图数据。
门槛三:人才
我认为大数据创业的最大门槛在于人才。和做APP不一样,大数据创业你一个人乃至几个人都是没法玩转的。初创企业你就往10-15人这样的团队先招人吧,这样的团队要包括Hadoop工程师、算法工程师,数据建模工程师、架构师、NoSQL工程师、BI工程师等等,全都是技术要求较高、薪资要求也很高的人才。大数据人才有多贵?在美国,在R、NoSQL和MapReduce方面需求的专业人才薪水达到了每年约11万5千美元,在中国也便宜不到哪里去,没有年薪30万,你很难招到一个大数据人才。
据中国商业联合会数据分析专业委员会统计,未来中国基础性数据分析人才缺口将达到1400万,而在BAT企业招聘的职位里,60%以上都在招大数据人才。也就是说,技术很牛的大数据人才,他的选择面很宽,要么早就进入BAT企业,要么也是在不错的企业拿着高薪,你要挖这样的人才,除了钱,股票、期权、福利等等,都是必须付出的代价。
2015年-2016年是大数据人才最为匮乏的两年,原因很简单,各大刚刚开通了大数据科目的院校,学生还没毕业;而招聘市场上的大数据人才需求量远远已经供不应求。除了BAT企业,通信企业、电力企业、金融银行行业、医疗行业、工业、游戏行业等等,哪个行业不是都在招大数据人才?创业公司要在这么严峻的人才环境中找到适合自己的大数据技术人才,门槛可不止是钱。
门槛四:技术
说了人才,就要说技术了。大数据技术不是你懂C++或者R语言就够了的,大数据有一整套自己的技术体系,包括统计、编程、JAVA、数据库、Hadoop、Spark、NoSQL、机器学习、自然语言处理、算法、数据可视化等等技术。光是Hadoop需要用到的技术和编程语言就有很
多项。而且市面上的大数据工具每家用的还不一样,用开源软件(如Hadoop、Spark)或者用SAP(SAP HANA)需要的技术也不一样。技术要求较高,而拥有大数据综合技术的人才又较少,这也成为了制约大数据创业的最大问题。
门槛五:钱
其实我不想写钱,但是又必须写钱。大数据行业创业不缺资本,只要你创业项目的商业模式没问题,并且技术能力强,且团队靠谱,无论在中国还是在美国,融个A轮还是没有问题的,资本关注度很热。但是你在拿到融资之前,自己启动的资金就需要一大笔。人才、硬件
和技术成本都较高。
这么理解吧,如果说,几个好朋友凑50万花3个月可以做一个APP项目,那么要在大数据行业创业的话,请先准备600-800万再来玩。
门槛六:商业模式
中国互联网上最赚钱的行业是什么?我认为是电子商务和网络游戏。电子商务和网络游戏也是互联网变现最快的行业。而大数据,它的变现能力不如网络游戏和电子商务那般简单直接。在我拜访过的很多企业中,他们手里有钱、有数据、有人才也有技术,但是他们不知道自己手里的数据可以拿来做什么。
也就是说,大数据目前没有最明朗最直接的商业模式。大数据只有和业务场景结合,才能产生价值。
大数据就像石油原油一样,你知道它在哪里,你可以开采它,但是开采出来你还需要冶炼,并且经过减压蒸馏、加氢精制、溶剂精制、溶剂脱蜡等炼制过程,成为成品油后运送到各个加油站,让汽车加满油后产生了动力才实现最终价值。大数据也一样,需要一整套复杂 的过程才能实现商业价值。
那么你可能会问了,大数据交易算不算是商业模式呢?我个人觉得,要看交易的是什么东西?原始的非结构化的数据,后面数据清洗需要太多的工序,数据存储也是很大的成本,这样的交易代价太高。我相信无论是企业用户也好,还是个人用户也好,大家更倾向于购买“拿来就能用”的大数据数据源。
你说京东和腾讯完成首笔大数据交易,我觉得就是一个笑话,京东和腾讯的大数据不早就整合在一起了么?我用微信直接就能在京东购物,数据是互通的,何必交易?
所以说,大数据创业最难的还是在于商业模式的思考,如果你没有找到一条让大数据变现的渠道,那么千万不要忙着拉团队创业。大数据行业创业,光有idea是不够的,跑通整个商业模式才是关键。
回答最初的问题来,大数据如何创业呢?我认为是:
一、找到一个大数据商业突破口;搞清楚你要用大数据解决什么问题,你的用户是谁?商业逻辑是什么?
二、找到一笔启动资金;
三、最好自己就懂一些大数据相关技术。
四、找到几个可以与你同甘共苦的伙伴。
五、找到你的数据来源,最好是独家的数据来源。
事实上,其实我认为目前不要着急去做大数据项目,做大数据处理工具是个不错的方向,可以先从做BI(商业智能)、CRM、ERP系统开始,等你有了客户,有了数据之后,回转头来做大数据项目,会更加水到渠成。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
解析 F 边界检验:协整分析中的实用工具 在计量经济学的时间序列分析中,判断变量之间是否存在长期稳定的均衡关系(即协整关系) ...
2025-08-05大数据时代的隐患:繁荣背后的隐忧 当我们在电商平台浏览商品时,系统总能 “精准” 推送心仪的物品;当我们刷短视频时,算法 ...
2025-08-05CDA 数据分析师考试全解析 在当今数字化时代,数据已成为企业发展的核心驱动力,数据分析师这一职业也愈发受到重视。CDA 数据分 ...
2025-08-05CDA认证在国际市场上的认可度正在逐渐增长。CDA(Certified Data Analyst)认证,源自中国,面向全球,旨在提升数字化人才的数据 ...
2025-08-04本次活动市场价2000元,现面向会员免费开放,会员朋友更可以邀请一位非会员免费参加。 【活动目标】 ...
2025-08-04MySQL 统计连续每天数据:从业务需求到技术实现 在数据分析场景中,连续日期的数据统计是衡量业务连续性的重要手段 —— 无论是 ...
2025-08-04反向传播神经网络:突破传统算法瓶颈的革命性力量 在人工智能发展的历史长河中,传统算法曾长期主导着数据处理与模式识别领域 ...
2025-08-04CDA 数据分析师行业标准:构建数据人才的能力坐标系 在数据驱动决策成为企业核心竞争力的时代,CDA(数据分析师)行业标准作为 ...
2025-08-04评判两组数据与初始数据准确值的方法 在数据分析与研究中,我们常常会面临这样的情况:需要对通过不同方法、不同过程得到的两组 ...
2025-08-01通过 COX 回归模型诊断异常值 一、COX 回归模型概述 COX 回归模型,又称比例风险回归模型,是一种用于生存分析的统计方法。它能 ...
2025-08-01CDA 数据分析师报考条件详解:迈向专业认证的指南 在数据分析行业蓬勃发展的当下,CDA 数据分析师认证成为众多从业者提升专业 ...
2025-08-01K-S 曲线、回归与分类:数据分析中的重要工具 在数据分析与机器学习领域,K-S 曲线、回归和分类是三个核心概念与工具,它们各 ...
2025-07-31大数据时代对定性分析的影响 在大数据时代,海量、多样、高速且低价值密度的数据充斥着我们的生活与工作。而定性分析作为一 ...
2025-07-31CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-07-31SASEM 决策树:理论与实践应用 在复杂的决策场景中,如何从海量数据中提取有效信息并制定科学决策,是各界关注的焦点。SASEM 决 ...
2025-07-30SPSS 语法使用详解 在当今数据驱动的时代,SPSS( Statistical Package for the Social Sciences)作为一款功能强大的统计分析软 ...
2025-07-30人工智能对CDA数据分析领域的影响 人工智能对 CDA(Certified Data Analyst,注册数据分析师)数据分析领域的影响是全方位、多层 ...
2025-07-30MySQL执行计划中rows的计算逻辑:从原理到实践 MySQL 执行计划中 rows 的计算逻辑:从原理到实践 在 MySQL 数据库的查询优化中 ...
2025-07-29左偏态分布转正态分布:方法、原理与实践 左偏态分布转正态分布:方法、原理与实践 在统计分析、数据建模和科学研究中,正态分 ...
2025-07-29CDA 数据分析师的职业生涯规划:从入门到卓越的成长之路 在数字经济蓬勃发展的当下,数据已成为企业核心竞争力的重要来源,而 CD ...
2025-07-29