机房360首页
当前位置:首页 » 数据中心资讯 » 数字孪生机房探索与实践

数字孪生机房探索与实践

来源:《数智元》杂志 作者:中国联合网络通信有限公司 丁峰 更新时间:2024/4/7 7:53:15

摘要:数字孪生自从提出后,一直方兴未艾,并不断伴随着3D、AR、VR、MR、XR等新技术演进发展,不断焕发出新的生命力,赋能于智能制造、航空航天、智慧医疗、智慧城市等众多领域,推动着生产模式的变革。本文将针对数据中心领域,提出数字孪生机房的见解。

    数字孪生自从提出后,一直方兴未艾,并不断伴随着3D、AR、VR、MR、XR等新技术演进发展,不断焕发出新的生命力,赋能于智能制造、航空航天、智慧医疗、智慧城市等众多领域,推动着生产模式的变革。本文将针对数据中心领域,提出数字孪生机房的见解。
  
  一、数字孪生机房概念
  
  数字孪生行业中比较认可的定义是充分利用物理模型、传感采集、运行历史等数据,集成多学科、多物理量、多尺度、多概率的仿真过程,在虚拟空间中完成映射,从而反映相对应的实体装备的全生命周期过程。数字孪生机房即是利用传感技术、3D建模、数据分析、智能算法、自动控制等手段,映射出一个与实际物理机房完全同频共振的虚拟数字机房,将物理实体机房全维度数据进行采集分析,通过算法,形成决策,最终反馈作用至物理实体机房的过程。
  
  二、数字孪生机房构成
  
  数据中心是个多专业的系统,包含有房屋、消防、安防、弱电、强电、暖通、机架、网络等系统。数字孪生机房是一个将物理实体机房进行数字化仿真,并建立与物理实体之间双向信息实时互通的综合系统,由感知采集子系统、控制操作子系统、数据治理子系统、算法决策子系统、可视化呈现子系统构成,详见图1所示。
  
  1.感知采集子系统实现各系统的数据采集
  
  1)电源系统:
  
  鉴于采集对象“电”的特点,采集及自控水电达到相当水平。即便如此,仍有三个方面需要补短板:
  
  (1)采集颗粒的细化。从供电设备延伸至用电设备,可以获取更多应用价值。例如,通过某台空调或服务器的用电数据可以识别能耗异常。
  
  (2)全量运维数据的接入。从告警类数据扩展至运行数据,支撑预防性维护。例如,通过蓄电池全周期数据纳入,可以进行容量预测。
  
  (3)非电类型数据的采集。例如,设备外观、振动、声响、气味等。
  
  2)暖通系统:
  
  有别于电源系统,采集除了“电”之外,还有“水”“温度”“湿度”等物理量,需要特别关注以下问题:
  
  (1)暖通系统运行工况弹性空间大而复杂的特征,特别是在节能减排的背景下,为追求合理的运行模式,需要构建适配的采集系统。
  
  (2)温度的点状采集模式升级为连续温度场模式。物理机房客观存在着一个连续但不均匀的温度场,点状采集模式无法完全真实体现。数字孪生机房系统使用CFD仿真技术构建一个实时的机房温度场。
  
  3)安防系统:
  
  构建安防的感知采集系统,需要关注几个方面的问题:
  
  (1)建立周界管理概念
  
  将整个数据中心从园区到机楼再到机房,依据安全管控要求划分不同区域。每个区域确定清晰的周界,每段周界确定明确的隔断介质。以大型数据中心园区为例,最外层为分隔外界与园区的第一层周界,一般会有墙体(或围栏)和园区进出口两类介质。园区进出入口,物理现场会采用安保人员驻场方式,要将安保人员的安保行为纳入数字化孪生机房会有不小的难度。难度主要源自于进出多样性和人行为不确定性。属性上有驻场维护人员、工程人员、访客、车辆等;方式上可以是人车分离和可以是随车。这就需要匹配多种不同解决方案。可以是严格方式,即人车分离,但影响通过效率;可以是允许人员随车的简易方式,这就意味着过了周界之后的区域,可能存在非授权人员。因此,园区内部需要进行分隔,继而形成了第二层周界。进一步依次会有以机楼为单位的区域周界、以机房为单位的区域周界,以及以通道为单位的区域周界。详见图2所示。每个园区各有不同,这里不做具体展开。重点要说明构建安防系统时,首先要建立一个清晰的周界概念,依此形成与之适配安防解决方案,这样才能确保数字孪生机房的有一个完整准确的安防信息。
  
  (2)安防感知物理量
  
  在周界概念章节中重点提到了“人”,这是重要的安防感知对象。在安防管理维度上有许多场景,包括各类周界入口人员许可检验、人员区域合法性检验、人员行为合法性检验、人员作业完成性检验等多种。随着图像识别技术的发展,人员身份识别已经从之前手持门禁卡来到了人脸识别时代。虽然有了大幅的提升,但仍有许多技术壁垒需要突破。例如,非授权人员翻越、跟随,或者携带非合法物资等等。这些在人工安检模式都可以杜绝,但在虚拟环境的数字孪生机房较为困难。几个重点环节的策略:周界异常识别,可以应用技术红外、电子围栏、人脸门禁、异常行为识别(攀爬、翻越、尾随、待物等)等技术;区域内异常识别,在区域安全防护要求基础上,通过异常行为识别部署区域安全感知能力;人员定位,建立了人员定位信息,匹配人员身份和区域或路线属性,进行行为数字化管理。
  
  建筑物及附属设施。包括数据中心楼体、门、窗、排水、管井等。楼体主要检测量为沉降、位移、型变、开裂等安全数据,可以采用部署传感器获取的方式,也可以采用将定期检测数据录入系统的方式。门窗状态通过传感器和门禁,渗漏水通过地湿传感,给排水通过水位传感,管井通过井盖闭合传感等。
  
  粉尘、噪音、温度、湿度等环境量通过各类传感器实现采集。
  
  4)消防系统:
  
  消防系统有相对封闭和强制的特性,系统采集和控制有着严格的规范。在数字孪生机房构建中,重点解决二个方面问题:
  
  (1)将消防系统信息接入至数字孪生机房系统,作为综合信息的一部分。
  
  (2)进一步提升灭火系统的感知采集能力。由于消防强制性规范,需要在行业规范指导下进行。
  
  目前行业已提出了智慧消防的概念,并已经有解决方案,将智慧消防的采集信息接入数字孪生机房系统,实现消防的信息孤岛。
  
  2.控制操作子系统
  
  控制操作子系统是虚拟系统反向作用物理实体的反馈环节。主要关注以下几点:
  
  1)策略上应采用分布式控制模式。数字孪生机房形成策略,下发至控制对象,由控制对象进行具体控制步骤的编制。一些常规非策略性的指令由对象自带控制系统编排。例如,市电与备电油机的自动切换,在达到触发条件时,由配电装置PLC自行进行控制。数字孪生系统可以改变切换逻辑策略下发PLC,由PLC根据切换逻辑编排控制步骤。例如,将之前两路市电失电启动油机,改变为任意一路市电失电启动油机,或者按照峰谷时间切换油机。
  
  2)控制需要的安全考量。系统应部署在有安全防护网络;形成策略的过程需要经过逻辑验证;设定安全阈值或负向清单指令进行预值管控。
  
  3)策略自动下发能力的部署循序渐进,可以采用输出策略人工审核的过渡方式。
  
  3.数据治理子系统是决策算法和可视化呈现的基础
  
  数据中心有各类不同专业系统,专业跨度比较大,在采集感知环节就呈现多系统的特性。因此,数据治理子系统首先要解决的是将多系统信息数据接入。需要建立数据中台,各系统采集的数据信息汇总至数据中台,上层应用系统均从数据中台获取信息数据。通过分布式的采集框架实现对动环系统、BA系统、视频监控系统、门禁系统、消防系统、智慧照明系统、数通网管等设备系统,以及资源管理系统、服务开通系统、服务保障系统等业务系统的数据统一采集、汇聚、治理,对上层应用提供高效、开放、统一的数据服务,支撑业务应用对数据的查询、分析及展示。技术上需要支持SNMP/WebService/HTTP/ModBus-TCP/C接口/MQTT等主流协议,采用微服务架构、云化部署方案,支持大规模的站点接入。
  
  4.决策算法子系统
  
  决策算法子系统是数字孪生机房形成决策的关键环节。决策能力会是一个迭代过程,特别是伴随人工智能的进化不断演进,每个阶段都会呈现其特定的型态。演进过程大体会分为以下几个阶段,信息数据辅助处理阶段、基于规则预设的辅助决策阶段、基于人工智能的辅助决策阶段、系统智能自主决策阶段。信息数据辅助处理阶段,是采集数据进行一定规则的统计呈现,并按照一定规则输出运行报表。基于规则预设的辅助决策阶段,是将专家经验以软件程序的方式预设在系统中,对采集的数据信息进行处理,并推送决策参考意见。基于人工智能的辅助决策阶段,是将人工智能算法预设在系统中,对采集的数据信息进行处理并推送决策意见。系统智能自主决策阶段,则是以系统智能算法为主要手段的决策。四种决策型态会并存,随着技术的演进,占比会有所不同,智能决策占比呈现出越来越高的趋势。
  
  5.可视化呈现子系统伴随着智能化演进的不同阶段有着不同功能定位
  
  现阶段除了可视化展示的之外,更为重要的是人机交互接口。在实现系统智能决策之前,都无法离开人工与系统的交互,会是呈现“信息量少而简单、逐步丰富而复杂、再到少而简要”的演变过程。前一阶段是不断增加可视化信息的过程,以便提供更多的人工决策依据,随着决策算法的提升,大量的信息由给算法进行决策,需要人机交互的信息会逐渐减少,最终过渡到系统自主决策。
  
  1)物理空间维度交互界面:
  
  利用3D建模技术构建现场仿真的物理模型,真实还原机房现场状态。与此同时,可提供大量交互信息。如图3所示。
  
  空间物理信息覆盖了空间、冷通道、机架、空调、配电柜、机房门、照明灯具、摄像机、温湿度等各类设备,并利用数字化优势,进行区域或设备分类维度的拆解组合,从而获取定制化的信息。
  
  空间物理信息不仅仅提供静态信息,每个对象信息实时关联。例如,与告警关联,直接定位故障位置。如图4所示,出现机房门常开异常,第一时间便可传递出告警门禁的位置。与此同时,可以通过点击物理空间附近的摄像头调取实时图像信息,了解到现场实际情况。
  
  空间物理信息交互界面也是查询设备信息的入口,通过点击需要查询对象,可以进一步展示具体信息。如图5所示,点击某个机柜或者UPS设备,可以进一步查询到机架内相关设备信息,以及设备详细信息参数和实施运行参数。
  
  2)逻辑拓扑维度交互界面:
  
  利用数字技术构建各个系统功能逻辑拓扑,直观展示系统功能拓扑结构。拓扑有着描述系统整体功能架构的作用,是掌握了解全网的基础。对于一名高级别专业人员,设备具体位置并不是最重要的,但设备处于网络拓扑上的逻辑位置却非常重要。
  
  (1)变配电系统逻辑拓扑。如图6所示,一套数据中心典型的变配电系统,从110KV的外市电直至末梢用电设备。为符合人机交互需要考量,采用逐级分层的方式,从全局到局部,依次获取不同详尽程度的信息。逻辑系统图提供三个层面的信息。第一,静态的拓扑结构,掌握了解系统构成。第二,实时的运行状态,系统图上线段和开关通断状态与实际系统对接,不同颜色代表了运行、备用、故障实际状态。第三,实时运行数据。
  
  (2)暖通系统逻辑拓扑,详见图7所示。
  
  (3)消防系统逻辑拓扑,包括告警系统、水喷淋系统、气体消防系统,详见图8所示。
  
  3)视频图像交互界面:
  
  视频是获取现场最直接信息的重要方式。传统视频交互界面,一般采用轮巡或者锁定镜头的方式。数字孪生机房理念中的视频交互,在满足轮巡和锁定镜头的基础上,增加了主动式告警关联交互方式。在异常情况发生时,将相关视频进行推送。关联方式有两类:一是图像识别领域,即通过AI识别技术,将异常人员、异常行为等作为告警触发视频推送。二是设备告警信息的关联,即将各类设备的告警与摄像头绑定,包括电子围栏、门禁、消防、电源、暖通、网络等各类设备告警均可与图像信息进行关联。一旦发生告警,主动将图像信息推送出来,获取目前现状、告警发生过程(会推送告警发生前30秒开始的),以及任何时段的现场视频信息。通过这样的交互方式,改变了安保人员传统图像监控工作模式,详见图9所示。
  
  4)文字信息交互界面:
  
  虽然数字孪生更注重于仿真的图形信息,但文字信息在系统交互中仍然发挥着重要的作用。如图10所示,针对每类设备构建信息档案,包括实时告警信息、历史告警、维护信息、设备信息和变更信息等。系统性的文字信息推送,让维护人员第一时间,以最为有效的方式获取到该设备所有信息,用于故障处理和日常维护。它有很大的发展空间,随着AI能力的跃升,在故障定位、故障处理步骤、隐患预防提示等场景系统能给出更为有效的决策建议。
  
  5)多维度信息交互界面:
  
  建立相关信息多维度推送能力,全新的信息交互模式。如图11所示,将故障设备的物理位置信息、逻辑拓扑信息、图像信息、文字信息进行关联一并推送,以便维护人员第一时间在一个界面上获取所有信息。
  
  三、结束语
  
  数据中心运营的过程,其本质就是数据采集获取、数据分析处理、决策形成、指令下发过的过程。数字孪生机房就是要将这一过程全面数字化,并充分利用3D建模、数据治理、智能分析、自动控制等技术,构建全新的运营模式,也将会是与实体机房一起成为未来数据中心的重要组成部分。
  
  作者简介
  
  丁峰,中国联合网络通信有限公司上海市分公司基础设施运营中心工程师,长期从事通信行业,积累了较为丰富的行业经验,特别在数据中心的规划、建设、运营领域,有其深刻的认识和理解。  
  

      编辑:Harris
  
  

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/202447/n9346156613.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
转载声明:凡注明来源的文章其内容和图片均为网上转载,非商业用途,如有侵权请告知,会删除。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片