京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据想做驱动多产业发展的“引擎”,还需掌握哪些技巧
早在1980年,著名未来学家托夫勒在其所著的《第三次浪潮》中就将“大数据”称颂为“第三次浪潮的华彩乐章”,到了现在,大数据的热浪已经覆盖了整个时代。
最近几年,资本一直追着大数据跑,大数据也一直在积极赋能众多产业,包括金融、医疗、教育等,有数据显示,到2020年,中国大数据产业规模或达13626亿元的高点。毫无疑问,大数据已经成为了热门投资方向之一。但是喧嚣躁动之下,传闻中的大面积收割却一直没来。这究竟是数据创业的的玩家不行,还是那些大数据全都走错了道?
一:资本加注下的大数据,行业依然是冰火两重天
据不完全统计,2017年上半年,至少有63家大数据创业企业在国内获得了融资,总融资金额超过68亿人民币,其中获得上亿元融资的企业就有17家,获得上千万元融资的大数据公司有41家,占总数的92%。显然,资本对有潜力的大数据创业公司并不吝啬。
(数据及图片来源:大数据频道)
不过大数据行业里也不尽然都是好消息。在资本狂欢之下,“大数据”开始炒概念,不少“伪数据”公司从中“沾光”,进而阻碍了整个行业的发展。除此之外,数创公司本身还面临着两个难题。
1. 离散的数据被藏在科技巨头们的黑箱中
数据收集一直是数创公司的难题,一方面,数据存在禁地,数据安全和隐私是不可逾越的高墙;另一方面,BAT等科技巨头垄断了大量的社交数据、电商数据和行为数据。也就是说,数创公司即使走出了不能被利用的数据禁地,转身就会投入被BAT们垄断的大数据海洋。
庆幸的是,BAT等科技巨头虽然有着绝对优势,但他们自身涉及的产业非常多,包括金融业务、文娱业务等等,难免会和其他机构存在竞争关系。所以,其他企业掌握的筹码是能够与各产业机构进行无间合作。
美国Palantir大数据服务公司最为人称道的一个案例是,协助多家银行追回了纳斯达克前主席麦道夫所隐藏起来的数十亿美元巨款。
而一直对标Palantir的中国企业中译语通,则是将图像识别、语音识别,包括计算机视觉自觉生成的广告、数字精准营销等技术结合到短视频应用中。
由高盛领投的数创公司Crux 主要业务则是建立信息供应链保证各个金融机构的数据隐私,确保他们不被私自售卖和利用。
从中我们可以看出,与大象共舞,数创企业显然不必用数据量和BAT等科技巨头硬碰硬,从细微之处进行创新将是个不错的选择。
2. 数据可视化是企业的薄弱环节
虽然现在数据创业公司颇多,且无论做SaaS还是做外包服务都已相当成熟,但“数据可视化”仍是大数据行业里较为薄弱的环节。
数据可视化有非常多实际运用的场景,有人觉得可视化仅仅是将数据变成图,其实那只是针对静态的数据,如果做实时数据的呈现,那就是动态的,而不同的呈现方式对背后的技术要求也会不一样。所以,数据可视化是一个技术含量高的领域。
因此,许多数创公司在展开业务,亲身接触到不同行业、不同背景客户的可视化需求后,就会发现一技术环节仍旧面临着许多挑战。所以,企业想要打造高效率、标准化、产品化的服务,就必须探究不同场景的技术解决方案,并开发相应的工具。
谷歌曾经参与创建非营利组织Global Fishing Watch,构建了一个透明可视的大数据平台,可以观察全球海上转运船只的动态。数据可视化让我们对全球商业捕鱼有了一个整体性的洞察与监测。
中译语通在2017年就发布了数据可视化应用,结合了知识图谱技术,可以在任何一个场景应用,相当于是大数据监测的部件;数创企业DataHunter也将根据各行业不同的分析理念和思路,计划在通用性的标准化之上再做行业版。
数据的分析和可视化可以说是大数据服务的“最后一公里”,但这并不是所有企业都有能力解决。毫无疑问,只有打通这一环节,数创企业才能获得不同产业的认可。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习的本质,是让模型通过对数据的学习,自主挖掘规律、实现预测与决策,而这一过程的核心驱动力,并非单一参数的独立作用, ...
2026-03-27在SQL Server数据库操作中,日期时间处理是高频核心需求——无论是报表统计中的日期格式化、数据筛选时的日期类型匹配,还是业务 ...
2026-03-27在CDA(Certified Data Analyst)数据分析师的能力体系与职场实操中,高维数据处理是高频且核心的痛点——随着业务场景的复杂化 ...
2026-03-27在机器学习建模与数据分析实战中,特征维度爆炸、冗余信息干扰、模型泛化能力差是高频痛点。面对用户画像、企业经营、医疗检测、 ...
2026-03-26在这个数据无处不在的时代,数据分析能力已不再是数据从业者的专属技能,而是成为了职场人、管理者、创业者乃至个人发展的核心竞 ...
2026-03-26在CDA(Certified Data Analyst)数据分析师的能力体系中,线性回归是连接描述性统计与预测性分析的关键桥梁,也是CDA二级认证的 ...
2026-03-26在数据分析、市场研究、用户画像构建、学术研究等场景中,我们常常会遇到多维度、多指标的数据难题:比如调研用户消费行为时,收 ...
2026-03-25在流量红利见顶、获客成本持续攀升的当下,营销正从“广撒网”的经验主义,转向“精耕细作”的数据驱动主义。数据不再是营销的辅 ...
2026-03-25在CDA(Certified Data Analyst)数据分析师的全流程工作中,无论是前期的数据探索、影响因素排查,还是中期的特征筛选、模型搭 ...
2026-03-25在当下数据驱动决策的职场环境中,A/B测试早已成为互联网产品、运营、营销乃至产品迭代优化的核心手段,小到一个按钮的颜色、文 ...
2026-03-24在统计学数据分析中,尤其是分类数据的分析场景里,卡方检验和显著性检验是两个高频出现的概念,很多初学者甚至有一定统计基础的 ...
2026-03-24在CDA(Certified Data Analyst)数据分析师的日常业务分析与统计建模工作中,多组数据差异对比是高频且核心的分析场景。比如验 ...
2026-03-24日常用Excel做数据管理、台账维护、报表整理时,添加备注列是高频操作——用来标注异常、说明业务背景、记录处理进度、补充关键 ...
2026-03-23作为业内主流的自助式数据可视化工具,Tableau凭借拖拽式操作、强大的数据联动能力、灵活的仪表板搭建,成为数据分析师、业务人 ...
2026-03-23在CDA(Certified Data Analyst)数据分析师的日常工作与认证考核中,分类变量的关联分析是高频核心场景。用户性别是否影响商品 ...
2026-03-23在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19