加强数据中心运营的4种方式
在当今互联的社会中,数据中心需要不断突破机器学习的界限,以避免在竞争中落后或不堪重负。以下是机器学习可用于加强数据中心运营的4种方式:
(1)最大限度地提高能源效率
全球数据中心的能耗占到全球能源使用量的1%。这听起来可能是一个很小的数字,但即使是运营效率的适度提高,也会节约显著的成本,并阻止数以百万吨计的二氧化碳排放到大气中。好消息是能源管理是最容易实施机器学习的领域之一。例如,谷歌公司使用DeepMind节省了约30%的能源,显著减少了管理费用。
(2)准确的容量规划
为了满足日益增长的工作量,数据中心管理人员必须提前准确预测对计算资源的需求。这些预测需要实时更新,以反映环境条件的任何变化。使用高级机器学习算法构建的预测模型可以处理PB级的大量数据,并智能地预测容量和性能利用率。这一规划有助于数据中心避免任何可能导致停机和影响运营的资源短缺。
(3)更快的风险分析
机器学习可以被训练成比人类更快更准确地检测异常。数据中心工作人员可能会花费很长时间来发现某些东西,更糟糕的情况是完全忽略了异常情况。例如,一些数据中心管理即服务(DMaaS)程序可以分析来自关键数据中心设备(如电源管理和冷却系统)的性能数据,并预测它们何时可能发生故障。通过提前通知数据中心设备管理人员即将发生的故障,机器学习技术可以将停机时间降至最低。
(4)抵御网络攻击的能力
防御分布式拒绝服务(DDoS)攻击需要快速检测和低误报率。这些检测方法大致分为两类:基于特征的和基于异常的。基于特征的检测在一般流量中具有已知特征,并被广泛实施和使用。基于异常的检测超出正常流量模式。机器学习回归模型可用于识别流量异常的类型,有助于最大程度地减少误报。