京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据变现,电信运营商只需往前迈一步
经过多年的技术积累和市场培育,大数据已经从“炒作”走向落地。全球主流的电信运营商普遍认识到大数据所蕴藏的高价值,开始积极探索如何将手中掌握的大量数据资源变现。目前,电信运营商的大数据探索主要集中在如何利用大数据分析用户行为、优化网络质量和推动业务创新等方面。数据堂创始人、CEO齐红威在接受《人民邮电》报记者采访时指出,这些对于大数据的内部利用,往往需要对原有系统进行大规模改造,而且无法直接快速地带来收入的增长,其实电信运营商可以用另一种思路,在基本不改造现有系统的情况下,立竿见影地获得可观的收益。
国务院为大数据发展“定调”
齐红威具有十多年的数据挖掘研发应用经验,曾任NEC中国研究院研发部部长、高级研究员。“大数据的本质特征并不是‘规模大’”,他阐述了对于大数据的理解。
现在人们对于大数据的认识普遍存在着误区,认为当数据量达到一定量(TB级或PB级)就是大数据,其实不然,区分大数据与海量数据的标准并不取决于其数据量,从技术上讲,“非结构化”数据才是大数据最典型的特征。现实生活中80%的数据都是非结构化的,解读这些数据,蕴藏着巨大的商业价值,这才是大数据。从商业模式上讲,大数据就是移动互联网产生的大量的关于人的数据。
近日,国务院总理李克强主持召开国务院常务会议,讨论并通过了《关于促进大数据发展的行动纲要》,对消除信息孤岛、支持大数据产业发展、强化信息安全等提出了明确要求。
齐红威认为,这是一个极大的利好消息。“大数据作为全球发展的战略资源,未来将像石油一样,影响到世界格局。对于中国而言,大数据是国家战略转型升级的基础,依靠数据和互联网相结合的方式,减少中间环节,提升传统行业运作效率。以前,一些地方政府或者企业虽然都认识到大数据的价值,但对于发展大数据仍心存顾虑:能不能做?做到什么程度?‘红线’在哪里?《纲要》的推出相当于政府给大数据发展定了调——不仅要做,而且要做大做强。”
大数据变现的闭环已经形成
2014年是大数据的商用元年,许多行业开始利用大数据真正地产生价值,齐红威认为:“现在很像电商井喷式发展前的2006年、2007年,市场培育已经完成,生态圈初具规模,商业模式逐渐成熟。价值万亿的大数据市场的大门已经打开。”
齐红威将大数据生态圈划分为云计算服务商、数据提供商、数据服务商和数据应用商四部分,实现从”数据流“到”资金流“分享共赢的商业运作模式。
其中,云计算服务商主要负责提供计算、存储和带宽等基础能力。
数据服务商则提供各种数据,包括政府大数据(公安、交通等)、行业大数据(电信、金融、电力等)、互联网大数据(互联网企业的用户数据、互联网公共数据)以及线下大数据等。
“现在网络上随时都在产生海量的数据,但线下的许多资源都还没有被数据化,这些数据同样价值连城。”他透露,数据堂独家推出了一款名为“众客堂”的众包平台,普通用户可以通过该应用上传照片、录音等提供线下的数据并获得一定的酬劳,目前“众客堂”的众客数量在全球范围内已超过40万。这些线下数据已经开始产生价值,例如,自拍照帮助美颜相机优化美颜程序;大量的购物小票分析出商品的价格走势和促销信息;语音数据帮助语音交互系统提高识别准确度等。
数据应用商则利用经过初步处理的大数据开发各类应用,例如征信、个性化旅游和交通服务等。他认为,“数据应用商将‘百花齐放’,规模有望达到数万家。”
数据服务商是大数据变现闭环形成的关键,具有三大功能:第一,连接数据提供商和应用商的纽带,免去了双方一一洽谈的麻烦;第二,汇总大数据的平台,将各领域数据提供商的大数据整合、融合起来,将产生1+1大于2的价值,实现数据增值;第三,对大数据进行初步分析、过滤和分类,“数据服务商从提供商那儿收来的是‘小麦’,但应用商需要的是‘面粉’,所以服务商就要完成把‘小麦’加工成‘面粉’的工作。”
“简单地说,数据服务商就相当于‘数据银行’,接收各方的‘存款’,再将这些‘资金’包装成不同的产品后贷款给有需要的人,搭建数据共享的‘生命线’,达成商业共赢,实现大数据变现的闭环。”齐红威表示。
数据堂是国内首家也是唯一一家在新三板上市的大数据服务商,团队的主创人员都有着十多年在大数据领域的技术积累,并在大数据产业发展过程中有着先发优势,经过多年的数据源积累,已获得金融征信、交通地理、人工智能、商家货价等多领域的大数据,与国内外多家数据提供商和应用商建立了合作关系,摸索出一套适应我国国情的商业模式。
电信运营商如何从“数据银行”提现
“电信运营商坐拥着一大片未被开发的‘油田’。”齐红威认为,电信运营商拥有着海量的高价值数据,例如掌握着用户的各类地理位置信息、商业活动、搜索历史和社交网络信息等大数据,具有维度丰富、群体性强、连续性好、网络行为全覆盖和关联性强等独特优势,“关键是如何将这些大数据变现,实现数据价值。”
齐红威逐一分析并回应了目前电信运营商在发展大数据时普遍存在的几点顾虑:
一是“能不能做”的问题。现在国家已经明确表示要大力支持大数据发展,在政策方面为电信运营商发展大数据铺平了道路。
二是“投入与收益”问题。与数据服务商合作,电信运营商几乎不需要改造现有系统就可以通过大数据获利,预计产生的价值有望达到亿万元级别。
三是“竞争”问题。数据服务商只生产“面粉”不生产“面包”,不会与电信运营商形成业务竞争。
四是“数据安全”问题。数据堂独创了一种模式——不“取走”数据提供商的数据,只是将软件嵌入到数据提供商的系统中,最终只生成数据结果,经数据提供商审核后再将相关结果提供给数据应用商,这就有效地消除了可能出现的信息泄漏风险。
齐红威表示,阻碍电信运营商挖掘大数据价值的障碍已经被一一清除,他们只需“向前迈一步”,即可拥抱蕴藏着无限商机的大数据时代。
“如果说大数据的发展是一场数万米的马拉松比赛的话,那么现在才刚刚跑了1000多米。”但齐红威同时指出,大数据发展已进入高速发展期,2015年将是各方布局大数据的关键时期,未来两三年将初步奠定大数据市场的格局,大数据将迎来超过十年的上升期。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21