摘要:Facebook公司的社交网络每天登陆的用户高达14.7亿,WhatsApp也有15亿用户,Instagram上有5亿用户,Facebook公司不得不面对这个行业中很少考虑的扩展问题。 |
Facebook公司的社交网络每天登陆的用户高达14.7亿,WhatsApp也有15亿用户,Instagram上有5亿用户,Facebook公司不得不面对这个行业中很少考虑的扩展问题。
“我觉得我们总是在火车前面铺设轨道,并尽可能快地向前进,以便软件团队和产品团队能够提供他们想要的任何解决方案,而不必担心他们是否有足够的数据中心。”Facebook公司基础设施和网站服务副总裁Delfina Eberly表示。
“当人们运行和运营这些数据中心时,成为软件公司一员非常酷的一件事就是让软件工程人才能够开发出特定的解决方案,让数据中心运营和设施运营更加高效。”Eberly说。
该公司所依赖的系统之一称为Facebook自动修复(FBAR),这是一种用于处理硬件和软件故障的自动化服务,以及构建完全自我修复数据中心的第一步。
“机器学习并不是人们通常认为适用于数据中心维修功能的东西,我们在多个地方使用它来运行和操作设施。”Eberly说,“有很多事情需要跟踪,在某些时候,采用人工的方法不再是最有效的用途。”
这也延伸到物流方面,Eberly说:“我们已经做了一些非常创新的事情来管理通过数据中心移动的材料数量:正在更换和补充的零件,正在退回的零件等。”
有时,该技术用于增强人类的能力,而不是替换人类,例如通过构建一个系统,人们可以在其中查看,并查看其组件在任何数据中心的位置。人们可以看到该空间中存在的先前问题,无需运行特定报告或让其他人为企业提供有关可能正在查看的问题的其他见解。
她补充说:“物流不一定是很多创新的东西,但我们认为这对我们来说是一个改变游戏规则的东西,这只是处理和管理材料,必须在多个数据中心发生的事情。”
这使Facebook公司的每25,000台服务器就配备一个数据中心运营商,这是前所未有的比例。“我们在人们历史上没有关注的地方做了一些非常酷的事情。”Eberly说,“我认为这是可以归功于服务器技术比率。通过我们对机器学习的使用,我们说“让我们在一个大多数人都不会首先看的地方尝试这个东西”,我们对这个技术在这个领域的早期表现感到兴奋。”
编辑:Harris