京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代数据因分享而值钱_数据分析师考试
在过去土地是资源,人力是资源,在未来数据是非常非常重要的资源,数据可以客观帮我们分析出我们没有发现的事实,数据可以让我们生活更加美好,数据也可以创造出更多的商业模式。得数据者得天下。
“得数据者得天下,这是大数据和移动互联网时代给我们的福利。”昨日下午,在东郊记忆演艺中心,银泰中心·成都商报未来中国青年领袖大型公益演讲迎来了第二位嘉宾—飞常准创始人郑洪峰。
这位22岁开始创业,一手打造了航空业内最大资讯平台民航资源网以及被国人赞为“航班神器”飞常准的青年创业家,昨日下午以“数据的创业”为题目,给现场听众带来了一场极为真诚的演讲。因为创立的产品与人们的出行息息相关,郑洪峰的演讲吸引了不少热情的读者前来聆听,这其中有关注航空领域的专业人士,也有来自成都职业技术学院空中乘务专业的“准航空人”,还有正在进行互联网时代数据平台打造的创业者。
而郑洪峰也没有让专门为他而来的听众们失望。思路清晰、语言中肯、观点鲜明,在一个多小时的演讲和接下来的现场互动中,他畅谈了自己对行业的思考,对公司的想法和未来的期许。
演讲中,郑洪峰提及对创业的看法,“创业,顺势而为特别重要”,“大家一定要记住创业有巨大的风险,我们看到的都是成功的故事,背后一将功成万骨枯,真是这样的,所以一定要先考虑风险。”
演讲中,郑洪峰多次谈及对人才的重视,“开发资源,开发人才是最需要最需要的,尤其是有行业经验的。”郑洪峰表示,“我感觉成都是一个很好的地方,有可能我们将来会在这里放一个研发基地,人才是最重要的。”
精彩观点
关于创业
创业很多时候要跟形势走,顺势而为特别重要。
大家一定要记住创业有巨大的风险,我们看到的都是成功的故事,背后一将功成万骨枯。
关于竞争
我觉得这是好事,如果一个行业里就你一个人玩,要么是你走错了,要么是这个行业人家都不值得过来跟你一起玩,你有很多竞争对手的时候证明你走对了,所以我们也希望更多的竞争对手进来。
关于分享
现在是一个大数据时代,你的数据不是因为封闭起来值钱,而是因为你分享得越多,大家依赖你数据的程度决定了你的价值。
关于盈利
互联网行业熟知的话,你要挣钱,羊毛出在狼身上,反正你羊毛是不能出在羊身上的,就是旅客使用是免费的。我们挣钱是在业内,像携程、艺龙都是我的客户,包括招行等也是我的用户,物流行业也有我们的用户,这是挣钱的。
实录
收集数据/
就是坐在接机大屏幕下面,24小时用人手去抄,也得把这个事情做了。
今天我想说一下过去这些年我所做的事情,希望能对大家有一些帮助。
首先说一下为什么做航班延误这个事。我最早是学民航的,电信专业,也是民航最后一批学莫尔斯电码的人,民航大量的航班信息是通过电报传输的,所以我1996年毕业后做得最早的一个项目就是把电报里的航班信息提取出来,然后为当时的BB机台使用。很多年轻人可能不知道BB机是什么东西,但是那时候是非常时髦的新科技,当时我也没有想到我学习的技术会在2007年成为创业重要的技术基础。
为什么是2007年?不是更早也不是更晚?创业很多时候要跟形势走,顺势而为特别重要。当时中国航班量增长非常快,但是既有的运行体制没办法快速承担起这么大的运输量,这造成了大量航班延误。当时有一个投资人,我叫他李老师,他发了一封邮件给我们,说想一起做航班动态的事情,我们一起帮助旅客了解为什么会延误,会延误多久。
这在当时是很难的。2007年的时候,很多航空公司、机场连网站都没有,而且在民航内部,所有数据都是割裂的。航空公司、机场、空管、油料、管理局,这些信息界点都被分散到很多很多不同的领域和地方,而我们要把这些不同地方的数据全部整合起来,这是非常非常困难的一件事。
当时我们的投资人就鼓励我们说不用怕,哪怕在我们就坐在接机大屏幕下面,24小时用人手去抄,也得把这个事情做了,这当然是一句玩笑话。但也是这句话让创业团队最终把思想统一了。团队思想统一是很关键的,剩下的就是拼命去干活了。我们当时去航空公司、机场求爷爷告奶奶,一家一家“磕头”,很艰难地拿到数据,慢慢地数据就开始丰富起来了。
组织数据/ 从0到60很容易,而从95到100是最难的,需要耗费更大量的精力和时间。
在数据创业这方面,大家一定要注意一个原则,世界上没有百分之百完美的数据,所有的数据都是从0到1,从1到60,再从60到80,再从80到90。
刚开始做的时候,“飞常准”对整个中国航班数据覆盖大概也就60%左右,经过8年的不断完善,到现在我们整个国内航班动态数据覆盖已经达到99.9%以上,同时,国际航班已经覆盖到全球80%的航班动态数据。这一切都是慢慢慢慢积累起来的,而后续还有很多需要完善。因为从0到60很容易,而从95到100是最难的,需要耗费更大量的精力和时间。
有了数据之后我们怎么组织数据?这是“飞常准”吸引用户最重要的。我们当时定了一个原则,所有数据透明化,对此我们提出了一系列标准,比如精准预计起飞和降落时间,飞机的机龄,飞机座位图,相关机场天气、流量等等,一切有助于旅客分析航班延误的数据我们都提供,这些数据也成为了后来所有航空公司参考的规范、标准和原则。
有足够透明和丰富的航班信息;有运气,比如我们赶上了移动互联网时代;还有我们之前准确的形势判断,就是老百姓需要的航班信息越来越多,个人用户对“飞常准”的使用量增长非常快。我们APP上线之后,第一年就积攒了一百万用户,这个成绩是我们之前做民航资源网时万万想不到的,那时我们积累了十年才不到10万用户。而在移动互联网时代,“飞常准”能达到一年100万,而此后的增长速度还更快。
数据掘金/ 让航班动态成为所有在线旅行分销商的标配,如果没有它就会被淘汰。
用户上来了,核心的问题还是要挣钱。最早我们想挣钱的渠道,就是我们对移动运营商提供内容,它们把这些内容让用户定制,比如说当年很流行的手机报等这些服务。但这一套放在航班动态上行不通,老百姓不买账。为什么呢?因为坐飞机不是高频次的事情,不是每天都会用,而且它很随机,不像手机报每天定点推给你内容。而航班动态这种数据,旅客来花钱购买的可能性很小,但是也很幸运,正是这样的现状让我们变换思路,最终走上了正确的路—做数据平台,而不是把数据封闭起来给自己用。
我们立下一个愿望,让航班动态成为在线旅行分销商的标准配置,我们说总有一天所有的分销商的产品里边都会有航班动态,如果没有,他就会被竞争对手淘汰。有了这个愿景之后,我们一家家去谈,当时真的很可怜,因为没有人理我们,没有人相信我们可以把这个东西做出来,也没有人接受一个名不见经传的小公司。但是在坚持下,我们一家家谈了下来,现在航班动态数据已经成为整个旅行行业、保险行业、银行业、物流行业的标准配置,如果没有这块的数据,对于它们的服务来说就是很严重的缺失。
包括我们的竞争对手,他们也是拿着我们的数据起家的。这种开放的心态很重要,现在是一个大数据时代,你的数据不是因为封闭起来值钱,而是因为你分享得越多,大家依赖你数据的程度决定了你的价值。
随着原有这些目标的达成,航班信息已经足够透明了,我们现在又有一些新的目标,希望真正去提高中国民航的准点率。
数据价值/ 海量数据面前,要把用户需要的数据做好后给用户,这才是有价值的。
今天的“飞常准”,一秒钟要更新一百多个航班的数据,每秒钟将近100K这样的数据,这还只是更新数据库的频次,还不包括所有的客户调阅数据的量。我们对飞行轨迹跟踪上,一个机场、一个数据节点的数据已经达到每毫秒更新600航班的动态数据,这只是一个节点,还不含全球所有数据的汇总。
这些海量数据到来之后,我们发现一个很明显的趋势,就是你不能把这些海量数据一下推给用户,那是不值钱的,也就是说我们不能按照以前按字符收费的模式收钱。而是你要把旅客和用户需要的数据做好,然后给用户,这才是有价值的。
刚才说的是数据更新频率,换另外一个角度说数据丰富。我们最早做的时候,大家都觉得这个东西难是难了一点,但是可能也就六个数据,实际、预计、计划起飞和降落时间。实际上我们做到现在围绕航空器的时间有30多个数据节点,而且我们发现这30多个数据节点你不取全,你是没有办法分析出这个航班延误的真实原因,只有更全面的数据才能帮助我们实现下一步的愿景,也就是帮助民航行业提高准点率。
面向未来,我有一种感觉。在过去土地是资源,人力是资源,在未来数据是非常非常重要的资源,数据可以客观帮我们分析出我们没有发现的事实,数据可以让我们生活更加美好,数据也可以创造出更多的商业模式。得数据者得天下,期待更多的数据创业合作伙伴。成都商报记者 田园
反响
成都电商协会会长徐震:
郑洪峰创业对整个行业都有借鉴性
成都电商协会会长徐震昨日也专程到现场聆听郑洪峰的演讲,徐震说,郑洪峰创业给我们非常大的启示,对整个行业都有借鉴性。
首先,创业应该在一个垂直行业里深耕多年之后累积,观察问题与找对痛点,整合资源,其成功率相对也就更高,这在其他创业公司里也反复得到印证。
其次,飞常准的发展模式再次证明了中国特色商业环境里,一定要把握住行业代表性的客户也就是B端,飞常准其实是C端用户造势,B端用户买单。
最后,给我最大的一个启发就是,专注自己擅长的和想做的,而不是无限扩张团队和产品线。任何最艰难最没有资源的时候,创业者的成熟度和综合能力决定了竞争中谁走到最后。不要怕培养竞争对手,比如飞常准也面临“国家队”航旅纵横、航班管家这些对手的竞争,但它们是良性生态圈的重要组成部分。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29统计制图(数据可视化)是数据分析的核心呈现载体,它将抽象的数据转化为直观的图表、图形,让数据规律、业务差异与潜在问题一目 ...
2026-01-29箱线图(Box Plot)作为数据分布可视化的核心工具,能清晰呈现数据的中位数、四分位数、异常值等关键统计特征,广泛应用于数据分 ...
2026-01-28在回归分析、机器学习建模等数据分析场景中,多重共线性是高频数据问题——当多个自变量间存在较强的线性关联时,会导致模型系数 ...
2026-01-28数据分析的价值落地,离不开科学方法的支撑。六种核心分析方法——描述性分析、诊断性分析、预测性分析、规范性分析、对比分析、 ...
2026-01-28在机器学习与数据分析领域,特征是连接数据与模型的核心载体,而特征重要性分析则是挖掘数据价值、优化模型性能、赋能业务决策的 ...
2026-01-27关联分析是数据挖掘领域中挖掘数据间潜在关联关系的经典方法,广泛应用于零售购物篮分析、电商推荐、用户行为路径挖掘等场景。而 ...
2026-01-27数据分析的基础范式,是支撑数据工作从“零散操作”走向“标准化落地”的核心方法论框架,它定义了数据分析的核心逻辑、流程与目 ...
2026-01-27在数据分析、后端开发、业务运维等工作中,SQL语句是操作数据库的核心工具。面对复杂的表结构、多表关联逻辑及灵活的查询需求, ...
2026-01-26支持向量机(SVM)作为机器学习中经典的分类算法,凭借其在小样本、高维数据场景下的优异泛化能力,被广泛应用于图像识别、文本 ...
2026-01-26在数字化浪潮下,数据分析已成为企业决策的核心支撑,而CDA数据分析师作为标准化、专业化的数据人才代表,正逐步成为连接数据资 ...
2026-01-26数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22在数字化运营场景中,用户每一次点击、浏览、交互都构成了行为轨迹,这些轨迹交织成海量的用户行为路径。但并非所有路径都具备业 ...
2026-01-22在数字化时代,企业数据资产的价值持续攀升,数据安全已从“合规底线”升级为“生存红线”。企业数据安全管理方法论以“战略引领 ...
2026-01-22在SQL数据分析与业务查询中,日期数据是高频处理对象——订单创建时间、用户注册日期、数据统计周期等场景,都需对日期进行格式 ...
2026-01-21