京公网安备 11010802034615号
经营许可证编号:京B2-20210330
运营商大数据变现为何步履蹒跚_数据分析师培训
三、三个原因影响运营商大数据变现
第一、当前的数据价值仍未到引起高度重视的程度
对于征信应用而言,2015年1月份央行发布八家准征信牌照大大促进征信市场的发展,越来越多的公司开始涉足关注。但实际上每年200万笔的p2p交易,其中涉及的征信需求有限,即便加上其它的消费信贷,如果局限于互联网金融,与要承担的风险相比,当前市场需求与价值不足以让运营商决策层重视并下定决心涉足征信领域。广告领域应用也是一样,目前的程序化投放广告(DSP)本来就只占总展示广告的一小部分,其中的RTB广告在程序化投放广告中又只有一小部分,其中涉及到移动端的比例就更小。虽然多屏互动效果,移动端的数据对PC端的精准广告也有价值,但实际上能够准确关联PC与手机终端的比例不高,据说百度相对较高,也不到40%。总体而言,现阶段运营商数据变现的市场价值未能引起相关决策层足够的重视。
当然如果运营商真是如私人互联网公司一样,一定不会轻易错过这样的讲故事机会,哪怕是烧钱,也是振奋市场提升股价的良好题材,影响力超出暴风科技DT战略的无数倍。比如征信的真正应用不在互联网金融,70%或更多的应用将用于信用经济,或者信用生活。
2015年3月份,巴塞罗那通信展上有个北欧小公司KLarna(网上可以查到),是做电商的。KLarna的电商和一般电商不同,用户注册身份后,不需要关联银行账户,不需要支付宝,凭借的是信用交易,先买喜欢的商品,由KLarna垫付资金给商家,然后在一定期限内,用户可以通过多种方式(包含邮寄)将欠款还上。其欠费风险控制主要来自大数据,至少你恶意欠过一次后就不会那么方便欠第二次。
第一次听到KLarna CEO的演讲,觉得在中国这样信用缺失严重的国家不可能生存。仔细想一想,其实不然。过去银行给穷学生发信用卡,凭借的也只是一个身份,没有任何可抵押的东西,就可以给几千的受信额度,实际上这些学生的恶意欠费占总信用消费的比例,一定在一个可以控制的水平之内。在一个个人信用越来越受重视的社会,类似这样的信用经济一定有广阔的空间,这也是KLarna快速融资数亿美金并受追捧的重要原因。
最近阿里的“芝麻信用”分数与旅行社办理新加坡、卢森堡的签证进行关联,这是信用生活的一种应用形式,其实,更广泛的想一想,目前的拼车、租车如果加入信用评级结果,业务量一定进一步提升,用户体验及保障也会进一步增强。
第二、信息安全是绕不过去的门槛
如果说市场前景可以通过画饼进行预期的话,那么信息安全是制约运营商大数据变现的最艰难的门槛。
2013年7月19日工信部发布的《电信和互联网用户个人信息保护规定》,其总则中明确提出“用户个人信息”的定义“用户个人信息,是指电信业务经营者和互联网信息服务提供者在提供服务的过程中收集的用户姓名、出生日期、身份证件号码、住址、电话号码、账号和密码等能够单独或者与其他信息结合识别用户的信息以及用户使用服务的时间、地点等信息”,能够追溯到个人终端的使用服务时间、地点信息也属于个人信息,其采集要遵行必要性原则,起使用要遵行告知并取得用户同意的原则,而且明确不得泄露、篡改或者毁损,不得出售或者非法向他人提供。
按照该规定,目前互联网上的众多数据采集与交易都在规定的边缘,甚至或多或少存在违规现象。2015年3月华为在巴塞罗那通信展上的大数据解决方案中,专门有一个模块,满足防守条款要求,也就是允许客户选择公开或关闭个人信息(或某个部分的个人信息)。
如果严格按照该条款,任何能够关联到客户号码或终端的个性化精准广告推荐都是行走在边缘地带,虽然以画像或标签化方式能够规避其中的部分风险。中国电信在大数据应用上走得较领先,也把安全性原则列在开放DMP业务规范基本原则第一条,如“进入大数据能力平台的用户属性数据与行为数据必须脱敏,脱敏数据不得包含能够直接或与其他数据关联后可间接追溯真实用户信息的内容”,但实际应用中,如果不能关联到用户终端,如何应用于RTB实时精准广告推荐?
受该规定的影响,任何能够追溯到个人或终端的数据变现应用,与第三方进行变现合作均存在不可预料难以管控的风险。即便是经过用户授权同意的征信应用,往往蹦出一例安全事件(合作方将数据应用在非合作应用领域),媒体放大后就会成为运营商不可承受之重。
从未来的趋势看,即便大数据应用专家呼吁新的数据伦理,但关系到个人信息保护,其规定只会越来越强。国外运营商之所以少有大数据变现成功经验,大多受此制约。如Verizon的Pricision Insight服务,跟合作方共享面向商场、体育馆、广告牌业主等特定场所手机用户的活动和背景信息。因为只有2%的用户愿意提供自身信息,实际应用价值大打折扣。
第三、端到端变现能力不足
如果运营商能和BAT一样,有自己完整的端到端变现能力,比如独立申请征信拍照并推广征信应用,比如独自经营广告业务,如广点通、阿里妈妈、百度一样,独立的广告变现渠道,所有的用户数据流转在自身的体系内,那么一切风险都变得可控。因为对外提供的是评分结果,是推荐的广告内容,而不是用户的行为特征数据。
但问题在于,BAT是先有变现渠道,后有大数据应用,就如先有微信用户群、先有朋友圈分享,后有精准feed广告一样,数据变现渠道是一项直接到达用户的核心能力,并不是简单投入就能获取的。
说到这儿,感觉有点憋屈,运营商的大数据就如蒙古国的煤矿与稀土一样,自身消化不了,只能靠卖给中国或通过中国的火车卖到海外,才能实现价值。
除了变现渠道之外,还有一项变现能力存在不足,该能力与运营商自身密切相关,那就是面向应用的数据理解与模型应用能力,该部分能力其实更为重要,更需要持续的资源投入。
目前的问题也在于此,一方面需要资源投入锻炼数据理解与模型应用能力。这里特别强调面向真实应用,因为脱离真实应用的研究性投入并不能给实际数据模型能力提升产生多大帮助。比如对上网日志的解读,只有针对具体的应用场景,才有可能对某些电商网站的行为对应的URL代码进行深入爬虫分析。只有参与到征信模型及应用中去,才能检验想象中的影响因素与真实情况的一致性,比如打电话多的其综合信用评分可能不是更高,而是更低。另一方面缺少外部合作,较难理解真实数据需求,同时缺少变现收益来支撑持续资源投入。
四、合作试点是解决之道
虽然步履蹒跚,但广阔的前景仍然吸引运营商省公司积极探索、大胆创新。受去年上海踩踏事件的影响,目前面向政府、旅游部门的区域人流量统计与告警应用如火如荼,并逐步向其它应用领域积极探索。
在数据分析方面,有一个很老的拇指法则:数据分析工作有70%-80%的时间花在收集和准备数据上面,仅有20%-30%的时间花在分析本身上。在刚开始处理大数据时,这个比例估计会更低。确定大数据中有价值的部分,并确定如何最优而精确地提取这些部分,非常关键,其实这也是探索并优化应用模型的重要过程。
大数据公司通常定期展示一些洞察报告,就是边理解边实践的一种良性循环,不管这些洞察报告多么微不足道。这些不定期的洞察报告一方面让人们保持这一过程的兴趣,一方面不断探索数据应用领域与价值,不断完善既定的应用模型。
就如站在河边学不会游泳一样,大数据变现应用实践比什么都重要。否则空对着自身的数据通过想象的方式去研究,无法真正锻炼变现能力。在当前缺少变现渠道的情况下,与有限合作伙伴在一定范围内的试点才是正确的解决之道。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在使用Excel透视表进行数据汇总分析时,我们常遇到“需通过两个字段相乘得到关键指标”的场景——比如“单价×数量=金额”“销量 ...
2025-11-14在测试环境搭建、数据验证等场景中,经常需要将UAT(用户验收测试)环境的表数据同步到SIT(系统集成测试)环境,且两者表结构完 ...
2025-11-14在数据驱动的企业中,常有这样的困境:分析师提交的“万字数据报告”被束之高阁,而一张简洁的“复购率趋势图+核心策略标注”却 ...
2025-11-14在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12在数据驱动的时代,“数据分析” 已成为企业决策的核心支撑,但很多人对其认知仍停留在 “用 Excel 做报表”“写 SQL 查数据” ...
2025-11-12金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11在数据驱动成为企业核心竞争力的今天,“不知道要什么数据”“分析结果用不上” 是企业的普遍困境 —— 业务部门说 “要提升销量 ...
2025-11-11在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少 ...
2025-11-10形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗 ...
2025-11-10在数字经济时代,“数字化转型” 已从企业的 “可选动作” 变为 “生存必需”。然而,多数企业的转型仍停留在 “上线系统、收集 ...
2025-11-10在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06