京公网安备 11010802034615号
经营许可证编号:京B2-20210330
作者 | 张甦
来源 | 中国统计网
在自己工作的领域中,发现快乐是我坚持做技术的动力。而技术域其实就是一个画圆的过程,当你发现你的圈圈画得越大,需要求知的东西也就越多。每天必须保持一种持续学习,和与技术死磕的精神才能促使我们不断前行。我们不断前行,时代也在不断变化和发展。本文由变化看发展,进而预测5G时代将会给数据库带来的重大变革。
大数据的快速发展需要越来越大的数据传输技术,因此5G技术应运而生。与4G技术相比,5G技术具有更快的速度和更大的传输容量,将成为未来的主要通信方式之一。
5G给大数据带来什么变化?
5G这一新鲜的技术会给大数据带来什么变化?又有什么独特影响呢?我们可以对此作出以下猜想。
1.数据量将会急剧膨胀
据预测到2020年,全球不仅移动终端(不含物联网设备)数量将超过100亿,而且移动数据流量增长将是2010年的200倍以上,其中中国的移动数据增速将达到300倍以上,上海、北京等发达城市及热点区域或高达千倍。到2030年,全球移动数据增速将是2010年的2万倍,物联网设备连接数接近1000亿,其中中国就超过200亿。
显而易见,4G时代的通信管道很可能被未来十年爆炸式增长的移动数据流量所堵塞。因此未来无疑需要更高速、更强大的5G技术来支撑,5G显然可为大数据(尤其是移动数据)的庞大流量做好准备。
2.数据赋能5G智慧城市建设
随着智慧城市建设的深入,物联网及大数据将在5G智慧城市中发挥重要的作用。城市的路灯、井盖、建筑都将纳入到数据平台中,但是只搜集数据只会让数据成为孤岛,并不能把实际获取的数据利用到城市管理中。未来对城市数据的分析和处理需求将不断增大,各类数据的整合也将成为重点。未来,大数据将在政务、金融、医疗、旅游、教育等各个方面深入融合,实现数字经济的全面发展。
3.推动大数据开放平台快速发展
随着数据体量、种类和形式的爆发增长,物联网、人工智能等领域的创新应用将井喷式涌现,很难有哪一种单一的计算平台可以有效应对如此复杂、多样、海量的数据采集、处理的挑战,混搭式的大数据处理平台的发展趋势将越加明显。海量、低时延、非结构化的数据特点将进一步促进数据处理和分析技术的进步。
4.推动大数据应用落地
如何解决大数据的落地应用问题是摆在诸多大数据从业者面前的一道难题,因为,大数据不是目的,大数据应用才是目的。如果一个新事物没有实际应用,那势必要被时代所淘汰。与实体经济结合,促进应用落地才是大数据的未来方向。大数据应用落地急切需要5G的参与,一方面会丰富数据采集渠道,另一方面也会全面促进数据分析技术的发展,比如说推动流处理技术的发展。可以说,5G将为大数据的落地应用提供新的支撑。
5G风起,数据库将会如何发展?
盘点数据库的发展历程,我们可以通过下面这幅图来完全体现出来。
从上图中,我们了解到在最开始发展起来的是关系型数据库+SQL(代表数据库产品Oracle,MySQL),然后发展到了非关系型NoSQL(代表数据库产品MongoDB),最后是分布式+关系型的NewSQL(代表数据库产品TiDB)。
然后再来说说5G,即第五代移动通信技术。国际电联将5G未来的应用场景划分为移动互联网和物联网两大类。凭借低延时、高可靠、低功耗以及飞一般的网速的特点,5G的应用范围更广泛远超4G、将渗透到生产生活的各个领域,不仅能使得超高清视频、浸入式游戏等交互方式实现再升级,还能实现海量的机器通信、支持智能家居、智能设备和智能城市,也将在车联网、移动医疗、工业互联网等垂直行业一展身手。
简单来说,5G更快、更安全、信号更强、覆盖面积更广、发展方向更加多维。如果不出意外,5G手机明年将纷纷上市。同时,中国联通和中国电信都将于2020年实现重点城市的5G商用。这些都将带领人类开启一个万物互联、高度便捷化、自动化、智能化的崭新生活方式。
下面聊聊5G来了之后,未来数据库的发展是个什么样子呢?
根据Gartner预测,到2022或者2023年,将有超过3/4的数据库被部署到或者迁移到云平台,不足5%的数据库会考虑部署到本地,这就意味着云将主导数据库未来的市场。
我们知道云计算是分层次的,即三种服务模式(IaaS,PaaS,SaaS)。数据库是一款服务软件也就是SaaS模式,整个数据的生命周期,数据库起到的作用都是至关重要的。而且还有一点,数据与应用必须紧密配合,而5G时代,大多数应用也要部署在云上,那云数据库这个趋势也就毋庸置疑了。
不过,在上云这个过程中,传统的数据库与云端数据库不一样的产品架构,给上云带来了很高的门槛。还有商业数据库其高成本,难维护的特点,必将接受国产、开源数据库他们其可弹性扩展,易用、开放等特点的各种冲击与挑战。很应景的一句话是"数据信息科技,国产自主可控,开源大势所趋“。
我们再来想一想对于5G时代的到来,该如何规划好数据库呢?换句话说,5G数据库应该具备什么样的能力呢?
首先先从高吞吐量和低延迟的角度入手,5G的ITU IMT-2020 规范要求速度高达每秒 20 千兆位,目标延迟为1ms。这种要求才是打开数据流的金钥匙。其次,5G数据库必须拥有瞬间线性扩展能力,5G网络不仅会从5G启用的应用程序中生成大量的流数据,还会从网络、订阅、企业、网络运营商和呼叫处理中生成大量的流数据。
那么,对于目前传统的OLTP数据库来说,是否机器越多,SQL执行就越快呢?
答案肯定是否定的。
对于OLTP数据库中的线性扩展,增加机器数,单SQL的响应时间基本不会发生太大变化。随着云计算技术不断成熟,云数据库开始逐渐崛起,企业正将新应用向云转移,对数据存储和计算分析的能力要求不断地加强。由云厂商主导的云原生数据库势必是这波改变的推动者,云原生数据库的优势在于它的成本、灵活度、安全、技术进化层面。
5G数据库更需要在云中无缝工作,并且还要在容器化环境中进行操作。而5G必将带来数据的洪流,这也将推动企业数字化的转型。届时,传统数据库将肯定跟不上当前企业发展的脚步。5G将以前所未有的速度生成前所未见的巨大数据。
科技界有两大领域越来越热:一个是5G,一个是AI。两者都是能够改变时代的颠覆性技术。单独看5G或AI技术,它们的发展都面临重重挑战,但是,当5G与AI这两大颠覆性技术深度融合的情况下,去看数据库的发展呢?
5G、Al通讯与人工智能进入工业物联网、金融、空气预测等数据管理时,由需求推动的时序信息会使数据库变成实时,并且能即时生成预测结果。数据库如果实时可以用Al算法以后,并可生成实时的预报警系统,让大家把损失防范于未然。就如同下图所示,5G和AI共同助推数据库的发展。
市面上也有一些时序数据库,在未来5G时代,比如 RDDTool 和 Graphite 会自动删除高精度的数据,只保留低精度的。而这些“功能”对关系型数据库而言,简直是不可想象的。
小结一下,未来数据库的发展,必然离不开下面这些词汇:
上云,数据洪流,开源,国产可控,低延迟,高吞吐,实时……
而对于我们来说,就要更早地适应未来的变化,提升自己一专多能的技术域,找到做技术那份最简单的快乐足以。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14在Python网络编程、接口测试、爬虫开发等场景中,HTTP请求的发送与响应处理是核心需求。Requests库作为Python生态中最流行的HTTP ...
2026-04-14 很多新人学完Python、SQL,拿到一张Excel表还是不知从何下手。 其实,90%的商业分析问题,都藏在表格的结构里。 ” 引言:为 ...
2026-04-14在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09