京公网安备 11010802034615号
经营许可证编号:京B2-20210330
国云数据CEO马晓东:没见过大数据何谈玩大数据
很坦诚,很直接,没有夹杂太多企业家、高管习以为常的官方话,这是我对马晓东的第一点印象。更进一步,作为国云数据的创始人兼CEO,马晓东的谈吐中却不时流露出对阿里的推崇,以及对在阿里巴巴工作经历的感激,可谓难得。
1986年1月出生,中国科技大学硕士毕业,早前在阿里巴巴从事大数据优化器、Hadoop、MapReduce等核心算法的研究,参与阿里大数据平台框架创建,马晓东于2011年从阿里巴巴辞职进行大数据挖掘、可视化分析领域的创业,创建苏州国云数据科技有限公司,现任创始人兼CEO。
2011年,大数据还远没有2013、2014年的火热,甚至于无人问津,“2011年选择从阿里巴巴辞职去创业,基于哪些方面的考虑?”因此我采用了直白的开场,不绕任何弯路。
当时在阿里巴巴做的大数据平台只有阿里自己能用,应用效果特别好,马晓东认准未来市场需求很大,同时难度很大,而他在淘宝这一苛刻环境成功做过大数据挖掘,有这方面的经验;其二,希望更多人、更多的企业能够应用大数据分析和挖掘,尤其是个人、中小企业很多用不起或者根本没有意识到数据分析的真正价值,他也希望真正推动产业发展,实现数据分析工具的普及,就像windows系统现在普及和造福大众一样,因而大数据大数据魔镜系列的免费版本也因此而生,目前也已服务上万家用户;其三,马晓东在校期间就拥有一支100人的精深技术团队,多次得到国家级肯定,并获得李开复老师的青睐与支持,而几年的工作经历,整个团队在实力、视野上也已经成熟;其四,“我从骨子里就想做有价值的事情”,出身于经商世家的马晓东,有着做企业的梦想。
时至今日,马晓东对创业的经历依然不胜唏嘘。2011年,当时市场还处于热炒“云计算”的阶段,大数据甚至可以说是无人问津,而理工科出身的他,创业之路可谓不足为外人道。实在的性格让他在没做出成绩之前不愿去拿投资,而在做出一定成绩之后,大数据作为一个新名词、新领域,投资人对大数据的认知可谓云里雾里。同时2B市场比2C市场更难被人认知,企业级市场总体发展不好。
发展到近两年,在对比美国大数据市场之后,在美国企业级大数据企业陆续上市之后,业内才逐渐对大数据有所认识。很多企业认为大数据等于舆情处理,去做非结构化数据,但在美国市场,结构化数据已经成熟才开始研究非结构化数据,中国却处于后知后觉的状态,结构化的东西没做好就去做非结构化数据, 所以很多企业最终走向被淘汰。
国外大数据之所以领先国内市场,还在于国外有数据环境,只有真正见过大数据才知道怎么玩,这也是国内ERP、CRM很多,但真正的数据产品并不多的原因。“没见过大数据去玩大数据,玩得好不好就可想而知了”,而国云数据的成功正是得益于见识过阿里海量的数据、玩过阿里苛刻的数据处理环境。
见过大数据的国云数据相较于国外的同类企业,优势到底体现在哪?马晓东表示稳定性、容错能力、准确性是一个有价值的大数据产品的基本要素。而国云数据因为真正经历过大数据,在这三点远强大于其他产品,基于比同类产品更强大的三大因素,国云数据更是一个数据价值提炼平台,其优势体现于以下几点:首先是功能,别的商业智能有的功能全覆盖;其二性能,渲染速度是是IBM Cognos的25倍;其三是大数据处理能力,大数据魔镜具备探索式分析、自动建模、省50%计算能力、精准营销几大特色;其四是易用性,人人都可以进行数据分析挖掘。
对于当前企业大数据市场,马晓东认为相比于13、14年,今年的市场虽然处于低谷,但其发展前景更加乐观。之前的市场可以说是病态的火热,很虚,而当概念炒到低谷,随之就会趋于理性,进而产生做实事的企业。
“国内企业大数据市场尚处于起步阶段,企业的精力更应该放在提升产品价值、产业链合作,共同对抗国外大数据产品,而不应该放在内耗上。”
马晓东对大数据市场有着独特的理解,并将大数据企业分为三类:其一是拥有数据方,比如阿里、京东、政府等;其二是大数据的纵向应用,例如行业专家,做大数据分析咨询,此类门槛较低;其三是大数据的横向应用,此类门槛较高,相当于挖金子的工具。
而大众认知中的大数据企业更多的是第三类,大数据的横向应用。而在这一产业链又拥有众多分支:可视化、可视化大屏、大数据分析挖掘、工具、存储、数据传输采集等等。相较于美国市场,以上应用尚处于起步阶段,同时企业级大数据市场很大,兵戎相接的局势不会出现,企业更应该担心的是国外的搅局者。产业链上下游应合作共赢,建立健康生态,促进市场发展,将竞争目标瞄准国外产品。
“我们有一个愿景,让人人都可以数据分析,企业都能用得起大数据”。据悉国云数据即将推出“大数据魔镜标准企业版”,面向中小企业,10万+的配置标价1万元,完全颠覆市场,也对市面上国外工具狮子大开口式的圈钱策略做了一回反攻。不管结果怎样,相信很多因工具昂贵而放弃购买的中小企业迎来了数据春天。
对于2015年及未来发展规划,马晓东透露国云数据定位于工具厂商,并且专注于工具厂商,不会涉足其他链条,在加大工具研发的同时,拓展海外市场,不会过多内耗。同时国云数据在2015年的战略重点是合作共赢,希望能与产业链上下游加大合作,推进产业发展,让人人都会、都可以数据分析。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14在Python网络编程、接口测试、爬虫开发等场景中,HTTP请求的发送与响应处理是核心需求。Requests库作为Python生态中最流行的HTTP ...
2026-04-14 很多新人学完Python、SQL,拿到一张Excel表还是不知从何下手。 其实,90%的商业分析问题,都藏在表格的结构里。 ” 引言:为 ...
2026-04-14在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09