
作者 | CDA数据分析师
大数据革命引发了数据中心的爆炸式增长,这些中心正在以越来越高的速率消耗能源。本文回顾了两种提高数据中心效率的标准方法,并认为第三种方法-机器学习-是最佳解决方案。
天网,VIKI和HAL 9000就是一些具有机器学习功能的AI的例子。创建它们的目的是解决对人类而言过于复杂的问题,并通过神经网络对其进行控制,以提高效率,安全性和成功率。当然,电影需要对立面,因此这些AI奇迹给了不利的黑暗面——但是这种复杂的机器学习是真实的并且已经成功实现。
自2000年代以来,数据中心已经激增。一个大型电子商务服务数据中心仅用几个19英寸机架来部署所需的服务器,存储器,以及网络设备。如今,超大型数据中心成千上万的硬件设备部署在数千个机架上。它们源自本地办公室的小型服务器,现已发展成为超大型设施,以维护我们的物联网和所有相关数据。美国人使用的数据,流程,连接性和存储量需要大量电力,这意味着数据中心是主要的能源消耗者。占全国年用电量2%的行业和政府专家正致力于提高效率,因为预计数据中心的需求将会增加。
目前,解决此问题的方案主要有两个方面:
但是,它并没有确定解决此困难的解决方案。而真正的解决方案在于实现机器学习系统。通过它们的过程,可以减少数据中心的能耗,并使其效率比以前更高。如今,部署依赖于机器学习的工具的数据中心运营商正在从效率和可靠性方面获得最初的收益,但他们才刚刚开始摸索机器学习将对数据中心管理产生的全部影响。
机器学习是人工智能的子集,有望优化未来数据中心运营的各个方面,包括计划和设计,管理IT工作负载,确保正常运行时间以及控制成本。IDC预测,到2022年,由于具有嵌入式AI功能,数据中心中50%的IT资产将能够自主运行。
容纳大量服务器场的大型,不起眼的容纳器慢慢地在美国兴起。这是全球性现象,因为数据和信息都以数字方式存储,因此需要空间。由于节省了大量资金,我们对人类的模式和趋势有了更复杂的了解。不幸的是,将数据存储在服务器中并不像一个库。他们需要恒定的功率来产生热量,并且热量需要被冷却,从而消耗更多的能量。
2014年,仅美国数据中心就使用了约700亿度电,从这个角度来看,1 kWh将使智能手机充电一年。需要能源以保持数据中心24/7全天候运行,使用大量的冷却系统进行冷却以及在紧急情况下维持冗余电源。也就是说每年维护在大约七十亿美元,能源成本影响着每一个人。消费者,数据库提供者和环境都感受到了如此大量能源消耗的后果,但我们的利用率没有丝毫放缓的迹象。因此,利用和能源效率是适应的主要目标。
图1:数据中心的用电量(十亿千瓦时/年)
美国至少有300万个数据中心,足以容纳该国每100个人中的一个。数据中心的增长非常复杂,大多数服务器和相关设备都是在2000年至2010年期间购买的。但是,随着服务器空间使用效率的提高和对大型数据中心的依赖性增加,统计数据表明存储量将适应而不是增加。
有些人可能认为办公服务器比新的超大规模数据中心更有效率。或在破土动工并不必要地淘汰它们之前,应使用较旧的就地数据中心。这些想法有逻辑上的支持,独立服务器由其所有者处理,并且回收而不是更换,但是它们实际上并不起作用。现场服务器需要数据中心做的所有事情,因此公司在自己的服务器场上花费更多的钱,而不是使用远程中心所需的确切空间。而且,较旧的数据中心在构建时就没有考虑能源效率,因此,即使是看似新的数据中心也可能已过时。
图2:数据中心总用电量(十亿千瓦时/年)
美国能源部鼓励大规模实施能源效率。他们的“更好的建筑”计划邀请企业和数据中心减少能耗或使用可再生能源。诸如Google之类的大型科技公司率先采用了这种方式,通过机器学习系统来减少其数据中心的能耗。
机器学习是AI的过程,能够从场景中学习并做出反应,而不是通过编程的选项做出响应。机器学习系统会获得历史数据,参数(目标),并通过模仿我们自己大脑功能的神经网络进行操作。它们非常适合数据中心,这些数据中心对于以前的系统和专业人员来说已经变得复杂起来,无法有效地进行管理。数据中心每天都会发生近十亿次事件,只有通过直观的系统才能处理这些事件,以实现最大的可操作性。例如:
Google通过输入DeepMind系统,希望将其能降低和保持40%的能源效率,这是一个通用系统,他们希望广泛发布以减少能源使用。Google数据中心团队针对某些操作场景对DeepMind进行了培训,创建了自适应参数,输入了历史数据(例如温度和泵速),并将目标定位为未来的电源使用效率(PUE)。PUE实际上是建筑能耗与IT能耗之比;用于衡量能源效率。
当部署在Google的数据中心时,它可以通过分析难以理解的数据集并建议采取的措施来成功地减少能耗。这听起来与最初提到的AI所承担的任务相差不远。幸运的是,科幻小说与科学之间有清晰的界线。诸如DeepMind之类的系统是一项优势,能够以人类无法掌握的规模降低能耗。随着时间的流逝,更多的系统将实施机器学习,以便它们可以最大限度地提高可操作性,从而为人们节省金钱,更重要的是,为环境节省了资金。
Uptime Institute研究副总裁Rhonda Ascierto说:“这是数据中心管理的未来,但我们仍处于早期阶段。”IDC Cloud to Edge数据中心趋势服务研究总监Jennifer Cooke表示,随着越来越多的公司采用包含云,托管设施和内部数据中心的混合环境,并且将越来越多地包括边缘站点,创建更智能的数据中心变得越来越重要。
何为机器学习?简单来说,机器学习是从例子和经验(即数据集)学习而不是依赖于硬编码和预定义规则的算法。换句话说,不是开发者告诉程序如何区分苹果和橙子,算法被数据“训练”并且自己学习如何区分苹果和橙子。以下是当今数据中心管理中机器学习的五个最大用例:
Ascierto说,当今的组织正在使用机器学习来提高能源效率,主要是通过监视温度和调整冷却系统来实现的。
例如,谷歌在今年早些时候曾发布,它正在使用AI通过分析21个变量来自动管理和优化其数据中心的冷却,例如外部气温,数据中心的功率负载以及后方的气压。发出热气的服务器。该公司表示,Google的机器学习算法可实时自动连续不断地调整冷却装置的设置,从而使冷却每年的能源使用量减少30%。
此外,它可以就设计或配置数据中心的最有效方法(包括IT设备或工作负载的最佳物理位置)提出建议。
机器学习可以帮助IT组织预测需求,因此它们不会耗尽电力,冷却,IT资源和空间。例如,如果一家公司正在整合数据中心并将应用程序和数据迁移到中央数据中心,则算法可以帮助其确定此举如何影响该设施的容量,Ascierto说。
DCIM软件供应商Nlyte Software的首席战略官Enzo Greco说,容量规划是组织建立新数据中心的一项重要服务,该公司最近推出了数据中心管理即服(DMaaS)产品,并与IBM Watson合作对其进行了集成。将机器学习功能纳入其产品。
“您需要使数据中心尽可能准确。您需要多少台服务器?您需要多少冷却?您只需要与服务器数量一样多的散热。”他说。“此外,您需要多少电量?这取决于散热和服务器容量。”
在所有用例中,使用机器学习进行风险分析是最关键的,因为它可以识别异常并帮助防止停机。“机器可以检测出异常,否则将无法发现,” Ascierto说。
例如,施耐德电气的DMaaS可以分析来自关键数据中心设备(例如电源管理和冷却系统)的性能数据,并预测何时可能出现故障。施耐德电气数据中心解决方案架构师副总裁Joe Reele说,当算法检测到异常现象时,系统会警告客户,以便他们能够在设备出现故障之前进行故障排除。
将来,Ascierto看到托管服务提供商使用机器学习来更好地了解他们的客户并预测他们的行为-从购买或添加新服务到续订合同甚至支付账单的可能性。她说,这是客户关系管理的扩展,可以包括通过聊天框自动进行客户互动。
Maya HTT已经分析了客户情绪。Duquette说,它目前没有数据中心客户使用它,但是通过自然语言处理,该公司的软件可以分析电子邮件并记录支持电话以预测未来的客户行为。
Ascierto说,这将数据中心的运营和性能数据与财务数据(甚至包括适用税项在内)混合在一起,以了解购买和维护IT设备的成本。她说:“它模拟了一件设备的总拥有成本和整个生命周期,例如一种冷却系统与另一种冷却系统相比。”
例如,Salesforce在2016年收购了一家名为Coolan的初创公司,该公司使用机器学习来分析IT设备的总体拥有成本,直至单个服务器组件。问题是越来越多的公司将使用机器学习进行预算影响分析的时间。一些私人公司可能会自己做,但是这很复杂,因为它要求以计算机模型可以提取的格式容易获得财务数据。
出于安全原因,DMaaS客户不太可能希望与第三方共享其财务数据。她说:“对于DMaaS服务,在早期,让客户共享他们的财务数据是一个比较棘手的提议。”
这个领域还不成熟,但发展速度很快。人工智能系统正式交付使用还将需要一定的时间,就像数据中心招募的新的工作人员一样,不过类似的机器学习工具终将可以真正的帮助您运营数据中心。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
用 Power BI 制作地图热力图:基于经纬度数据的实践指南 在数据可视化领域,地图热力图凭借直观呈现地理数据分布密度的优势,成 ...
2025-07-24解析 insert into select 是否会锁表:原理、场景与应对策略 在数据库操作中,insert into select 是一种常用的批量数据插入语句 ...
2025-07-24CDA 数据分析师的工作范围解析 在数字化时代的浪潮下,数据已成为企业发展的核心资产之一。CDA(Certified Data Analyst)数据分 ...
2025-07-24从 CDA LEVEL II 考试题型看 Python 数据分析要点 在数据科学领域蓬勃发展的当下,CDA(Certified Data Analyst)认证成为众多从 ...
2025-07-23用 Python 开启数据分析之旅:从基础到实践的完整指南 在数据驱动决策的时代,数据分析已成为各行业不可或缺的核心能力。而 Pyt ...
2025-07-23鸢尾花判别分析:机器学习中的经典实践案例 在机器学习的世界里,有一个经典的数据集如同引路明灯,为无数初学者打开了模式识别 ...
2025-07-23解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-07-22解析神经网络中 Softmax 函数的核心作用 在神经网络的发展历程中,激活函数扮演着至关重要的角色,它们为网络赋予了非线性能力, ...
2025-07-22CDA数据分析师证书考取全攻略 一、了解 CDA 数据分析师认证 CDA 数据分析师认证是一套科学化、专业化、国际化的人才考核标准, ...
2025-07-22左偏态分布转正态分布:方法、原理与实践 左偏态分布转正态分布:方法、原理与实践 在统计分析、数据建模和科学研究中,正态分 ...
2025-07-22你是不是也经常刷到别人涨粉百万、带货千万,心里痒痒的,想着“我也试试”,结果三个月过去,粉丝不到1000,播放量惨不忍睹? ...
2025-07-21我是陈辉,一个创业十多年的企业主,前半段人生和“文字”紧紧绑在一起。从广告公司文案到品牌策划,再到自己开策划机构,我靠 ...
2025-07-21CDA 数据分析师的职业生涯规划:从入门到卓越的成长之路 在数字经济蓬勃发展的当下,数据已成为企业核心竞争力的重要来源,而 CD ...
2025-07-21MySQL执行计划中rows的计算逻辑:从原理到实践 MySQL 执行计划中 rows 的计算逻辑:从原理到实践 在 MySQL 数据库的查询优化中 ...
2025-07-21在AI渗透率超85%的2025年,企业生存之战就是数据之战,CDA认证已成为决定企业存续的生死线!据麦肯锡全球研究院数据显示,AI驱 ...
2025-07-2035岁焦虑像一把高悬的利刃,裁员潮、晋升无望、技能过时……当职场中年危机与数字化浪潮正面交锋,你是否发现: 简历投了10 ...
2025-07-20CDA 数据分析师报考条件详解与准备指南 在数据驱动决策的时代浪潮下,CDA 数据分析师认证愈发受到瞩目,成为众多有志投身数 ...
2025-07-18刚入职场或是在职场正面临岗位替代、技能更新、人机协作等焦虑的打工人,想要找到一条破解职场焦虑和升职瓶颈的系统化学习提升 ...
2025-07-182025被称为“AI元年”,而AI,与数据密不可分。网易公司创始人丁磊在《AI思维:从数据中创造价值的炼金术 ...
2025-07-18CDA 数据分析师:数据时代的价值挖掘者 在大数据席卷全球的今天,数据已成为企业核心竞争力的重要组成部分。从海量数据中提取有 ...
2025-07-18