京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据的价值如何体现_数据分析师考试
进入大数据时代,运营商应用大数据发展的驱动因素是什么,是否需要建立新型数据库? 刘伟光: 随着通信行业的竞争日益激烈,传统的语音和短信等主营收入的利润不断下滑,导致运营商必须找到新的利润增长点,同时有效控制运营成本,从而使自身可以在激烈竞争中立于不败之地。这也是为什么运营商把实现精准化营销和精细化运营提升到战略层次的重要原因。
此外,传统数据库技术已无法满足运营商对大数据充分利用的需求。新型数据库应该具备如下特点:首先应该采用支持大规模并行处理的分布式架构;其次,应该使用基于符合工业标准的开放硬件和系统平台,保证成本可控;第三,随着开源技术不断成熟,创新速度快,新型数据库平台应该易于与新的开源技术进行融合;第四,新的数据库平台应该可以实现与Hadoop平台的无缝集成,实现跨结构化、半结构化、非结构化海量数据的混合分析能力。 卢东明: 运营商目前试图做新型数据库,但是不太现实,首先数据库公司一直以来都是很稳定的几家,需要长期积淀。
其次,大数据不是取代以前的技术,而是混合补充使用,不是新型数据库出来后,就完全替代传统数据库从而大规模使用。数据库是核心、稳定的技术,大数据是开源的软件技术,运营商还是会选择使用相对成熟的软件。 《通信世界周刊》: 大数据今年以来得到格外关注,目前发展状况如何? 卢东明: 大数据在运营商的业务中早就有应用,目前在各个省都得到普遍应用了。大数据这个词目前有些炒作成分,它和以前的数据库不是完全脱节的,是对数据库的延伸。大数据是个现象,是数据库的另一个形态,不是否定、颠覆之前的数据库形态。
目前做大数据的厂商依然是以前那几家数据厂商,不同的产品解决不同的问题。在中国电信行业,从数据量和应用角度来看处于世界领先地位,这是由于电信用户多、规模大,电信业遇到的问题和挑战比较大,解决方案难度高。 刘伟光: 目前中国三个电信运营商在业务支撑领域、网管IT支撑领域包括增值业务领域,已经随着市场的需求推出了很多新的大数据实时分析的项目,相信未来的两到三年这个市场将会成倍增长,甚至会到达我们今天不能预期的数量。 需要分析共享大数据的管理工具 《通信世界周刊》: IT企业如何依托大数据为运营商提供管理工具,提升运营效率? 刘伟光: 实现各部门的紧密协作永远都是提升运营效率的不二法门。而IT企业应该为运营商提供实现紧密协作、分析、共享大数据的管理工具,来达成提升运营效率的目标。
此外,大数据时代,IT企业仅仅为运营商提供分析平台、分析工具是不够的。这是因为运营商虽然很了解业务和需求,但普遍缺乏数学建模能力,因此很难利用好这些平台,使其发挥最大效益。所以,如何利用这些平台、系统和数据实现科学建模,同样是提升运营效率的关键所在。 武新: 运营商要解决数据处理效率问题,现在的数据用以前的系统处理需要一天一夜,而应用大数据技术处理可以一个小时完成。在大数据平台,应用云技术,通过集群的方式,几十台服务器同时工作,并进行压缩数据来节省空间。
目前大数据主要是针对结构化数据的应用,用户上哪个网,停留多长时间,通过分析都可做相应的分析结果推送给相关部门。除了对用户上网行为分析,还有网络使用情况、网络设备情况和用户使用手机类型分析。而对非结构化的数据,如视频和图片,目前分析得还较少。 《通信世界周刊》: 大数据具体应用于运营商的哪些业务中,有哪些成功的应用和案例? 卢东明: 大数据主要应用在运营商的“信令”系统分析上,由于其数据量非常大,比“话单”分析的挑战大很多。移动互联网发展起来之后,运营商开始关注大数据,进行“用户行为分析”,根据人群分析做精准营销,推荐流量套餐。
此外,运营商提供IDC服务,通过“云”中心的方式为互联网企业提供服务。 武新: 运营商从最近两三年开始,感受到这方面的压力,开始寻求解决方案。中国移动“信令”分析系统项目对海量数据进行分析和挖掘;中国联通对“话单”数据进行用户行为分析。中国电信“新一代数据库”产品正在测试中,通过精分系统,进行精准营销。此外,在运营商专网也已应用大数据。运营商目前仍处于测试探索中,通过几种方法针对不同的应用进行测试、筛选。
目前运营商的相关项目有“流量分析”、“智能管道”和“新一代数据库”产品等,传统的数据库面对海量数据已经无法支撑,将来会慢慢被大数据代替掉。 要有开放的心态 《通信世界周刊》: 发展大数据需要解决哪些问题,关键点是什么? 卢东明: 由于数据分析要看存储效果,涉及到效率和速度。目前运营商应用大数据存在的问题是避免无限制的花钱。另一方面,运营商要和厂商合作,针对不同的业务类型和应用场景,采取不同的分析方法。此外,运营商要有开放的心态,因为大数据作为开源的软件也不是可以解决所有的问题的。 武新: 在数据处理上,运营商转型中不仅有技术上的问题,还需要经历一个时间阶段和过程。
此外,运营商要转变思维方式,其在数据分析上的经验不如互联网企业,这是方法论问题,关系到如何用数据做生意。运营商以前都是依托传统业务,海量数据的出现,使得行业即将洗牌,运营商不得不转型重视数据挖掘。 但运营商可以发挥自己的优势,首先,要分析用户行为的变化,由分析以前的语音用户转变为分析上网行为。其次,运营商有能力提供类似互联网公司的服务,如QQ聊天。
最后,运营商有专网资源,有自己的数据中心可以运维,但是目前这些优势还没有完全发挥出来,是因为还没把握透用户的需求。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22