京公网安备 11010802034615号
经营许可证编号:京B2-20210330
电信运营商大数据变现到底靠不靠谱
电信运营商说大数据变现也有快一年了,这一年不能说没有进展,但相对互联网行业的秒速来说,实在只能说是龟速。有人这时候会跳出来说是因为体制问题,基因问题,这个说法是万金油,一般运营商的问题归结到体制上都不会出大错,仿佛这么一说,大家就觉得一切都有了合理解释,然后各自该干嘛干嘛去了,也就不需要再动脑子了。但是今天,我想再继续就这个话题深入聊一聊。本文就是起到抛砖引玉的作用,大家可以一起来讨论,运营商做大数据运营的切入点究竟该如何选取。
俗话说,存在即合理,任何貌似不合理的事情背后你深究下去都是这样。运营商大数据变现进展为什么这么慢?只能说,因为运营商还是没有从大数据里面看到真金白银。为什么中国移动在LTE上的投入那么大手笔,那是因为他看明白了,这是人家未来10年吃饭的饭碗,所以钱砸下去决不手软。相比而言,大数据只能算是一块试验田,而试验田上的收成还真不好说。
过去大半年我们一直在研究移动的数据,做过企业级别的数据资产咨询,也做过几个落地的应用项目的探索,做来做去,我们对移动的大数据认识也越来越清晰。在14年初的时候,运营商对自己的数据还是充满自信的,说起来,移动手里的数据无外乎两大类:一大类是用户的位置数据,另一大类是用户电话、短彩信及上网行为的数据。让我们再深入看看这两类数据。
先说位置数据,移动网络记录用户的位置说到底也是为了给用户提供移动通信服务的,而不是为了窥探用户隐私的,因此:首先它没有必要实时关注所有用户的位置变化,对于没有在使用业务的静默用户来说,隔段时间看看他在哪里就可以了,这个用专业术语说就是周期性的位置更新,这个对于系统降低负荷是很必要的,这样就有第一个结论:网络对于有业务的用户,需要实时关注其位置变化,根据这个位置变化选择不同的基站和小区为其提供服务,对于无业务的用户,仅需轮询其位置变化,这个轮询周期通常是40分钟(根据网络负荷情况调整)。也就是说,网络感知的用户位置不实时,最坏情况时延可达40分钟!其次:网络需要了解用户位置的精度到底到什么程度就够了呢?答案也很容易想到,只要知道用户在哪个小区的服务范围就可以了,因此,移动网络记录的用户位置信息,精度只能到基站的经纬度(小区的经纬度和基站是一样的),这是什么概念呢?2G小区的覆盖范围是数公里,3G的是数百米,4G的小一些会在百米之内。也就是说,网络感知的用户位置在地理上的精度基本是百米量级。
知道了运营商用户位置数据在时间和空间上的精度后,对这些数据可以支撑什么应用也就心中有数了,哪些是靠谱的,哪些是纯忽悠也就一目了然。如果是用来做要求不高的人流密度分析,常住人口分析,人口迁移去向分析够了,如果是做精度要求稍高些的交通疏导,店铺选址,那就需要看实际情况,具体问题具体分析,说不准能不能支持,先别拍胸脯;可如果说要做实时营销,这牛就吹大了,不光实时你保证不了,空间上的准头也有点差,搞不好营销没成反被当骚扰。
再说说用户行为数据,用户的语音、短信类传统业务有一个特点是个人对个人,因此肯定是有一个对端的号码对应的活生生的人,那其中的价值点在哪里就很清楚了,通过这些传统业务的用户行为,你可以很清楚的了解用户的现实交往圈(现实交往圈是和虚拟交往圈相对的,各有各的用处)。但不幸的是,用户往往认为现实交往圈的隐私性很强,目前比较敏感,属于雷区,运营商轻易不敢越的,所以这部分数据的价值在可以预见的未来还不可能发掘。
再有一大类重头的用户行为是用户的上网行为,现在大有手机取代电脑之势,看看低头一族那么多就知道了。所以新新人类的大量碎片时间基本都被手机上网行为所占据了。对于用户通过手机进行的上网行为,网络侧会纪录下用户访问的地址,理论上可以通过该URL地址,结合网络爬虫或APP抓包技术,将实际内容获取回来,然后采用内容识别技术对其中的关键内容进行识别,这样就可以获取到用户行为的相关数据。但我们再进一步看看理论后面的一些落地阶段遇到的问题。至于网络记录的地址长度有限(128位),超出部分会被截断,这些地址也就废了,这些都是小问题,因为记录最初也不是设计来干这个的,而且超出的比例也不是很大,大数据也不在乎少那百分之几的数据。主要的问题有几个,一是APP和网页层出不穷,每天都是爆发式的增多,需要有一个动态更新的APP和网站的分类库,这个库里有网站和APP的多级分类,还需要有网站和APP的多个服务器地址/域名对应关系,这实际上是做了URL分类的基础工作。有效的URL库及后期良性的维护机制是非常重要的;第二,内容分词/识别的复杂度和识别率,每个网站和APP的内容识别往往需要采取不同的方法,具体情况具体分析,需要看页面有无设计规律等,进一步设计具体的内容提取、识别算法,工作量巨大,一旦网站/APP改版,这些工作还要重新进行,因此也要有一套动态维护机制。这两项工作都是非常琐碎繁杂的工作,又很难体现具体的价值,因此很少有厂家愿意投入大量的资源去做。基本还是需求来了,再根据具体的需求具体分析的模式,支撑的时间周期和质量都不稳定。
在APP内容识别的过程中,我们也发现了一些APP分析厂家目前的一些尝试,他们会和APP开发厂家签署协议,直接在APP代码中嵌入数据采集代码,通过在APP运行过程中采集的数据,有针对性地对用户的行为进行分析,通常他们获取的位置和内容精度会很高,而且他们不会因为APP的升级改版而很被动,造成自身程序的大规模修改。与电信运营商相比,他们的劣势是不能获取到所有竞争对手的数据,但是对于APP分析厂家来说,只要和更多的APP厂家签署的协议,他们慢慢也会积累到这部分数据。而且他们获取数据到形成可供分析的基础数据中所作的附加工作比电信运营商少的多,可以把更多的精力放在业务运营上而不是数据准备上。
也许,电信运营商需要重新评估自己的数据适合做什么,不适合做什么,对需要做复杂的数据准备和精度提升才能支撑的应用场景,也许更好的办法是换一个别的方式去做,那样才更符合客观规律。
以上信息纯属一家之言
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10在数据驱动业务的当下,CDA(Certified Data Analyst)数据分析师的核心价值,不仅在于解读数据,更在于搭建一套科学、可落地的 ...
2026-03-10在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心工作,是通过数据解读业务、支撑决策,而指标与指标体系 ...
2026-03-09在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05