机房360首页
当前位置:首页 » 服务器资讯 » 51放假,服务器也跟着放假?

51放假,服务器也跟着放假?

来源:丁煲说事 作者: 更新时间:2019/4/26 17:11:56

摘要:随着企业计算环境变得越来越复杂,IT系统故障和网络错误导致更多意外停机。意外停机可大可小, 但是一旦发现长时间的停机,破坏性中断会影响服务或运营的重要性,带来巨大的财务损失,安全问题,合规性违规,客户损失和声誉受损。

  随着企业计算环境变得越来越复杂,IT系统故障和网络错误导致更多意外停机。意外停机可大可小, 但是一旦发现长时间的停机,破坏性中断会影响服务或运营的重要性,带来巨大的财务损失,安全问题,合规性违规,客户损失和声誉受损。

  所谓的服务器宕机,可以分为两类:假宕机和宕机。

  假宕机是由于硬件资源暂时性地被消耗殆尽,因而无法对外部指令进行响应的现象,通常是网站处于访问高峰期,带宽等资源跑满,这时只需要等待一定的时间,待服务器腾出更多的硬件资源即可恢复正常。

  而宕机,如果通过ping测试服务器,显示器无画面输出,或者鼠标光标没有任何反应则表明服务器硬件故障。

  数据中心中断

  通常服务器宕机,我们第一个反映就觉得是数据中心那边出事了,估计是电源问题。因为电力是数据中心中断的常见原因,但它也不是唯一的罪魁祸首。

  Uptime Institute一直在研究中断情况,以追踪导致意外停机的原因。其中一个重要发现是:电源在整体故障中的影响较小,而网络和IT系统则更为关联。

  在过去二十年中,技术行业一直专注于如何设计电力系统,即使电力系统某处出现故障或故障,IT资产也能继续运行,由于一般供应商都有双线IT设备的2N配电系统的出现使得IT系统能够通过一系列单一事件和事件继续运行。


来自Uptime Institute

  当比较逐年的原因时,这种趋势尤其明显。网络和IT 的系统成为停电的主要原因显着增加,2016年和2018年分别为29%和27%。

  当然除了数据中心中断的原因,还包括了以下但不限于的原因:

  应用程序导致内存溢出或者泄露,超出存储容量导致

  进程过多或者不断创建,耗尽资源导致;

  数据库程序死锁,连接数过多导致;

  应用程序异常导致;

  流量负载过大导致:

  遭受黑客入侵攻击导致;

  失误操作导致;

  如何解决

  那么除了关注服务器宕机的成因外,我们该如何避免和应对呢?

  1.容灾备份

  以网站为例,可以为网站准备2个服务器,它们里面存放的内容相同,但ip不同。而且所处机房的也要不同。这样下来,同时宕机的可能性就大大降低了。当发生宕机时,可以迅速地指向正常的服务器,保证业务的不间断性。

  2.重启大法

  重启服务器能够清除内存碎片,重新优化软件调用级别,中断无用的网络端口,释放内存,缓解CPU压力。因为服务器运行时间长了,会导致很多冗余的DLL程序,最终表现为系统运行速度变慢。而进行系统重启会让电脑恢复到默认加载状态,会使电脑变快速。但是在进行写硬盘时,切记不要断电或者强制重启,因为这对硬盘的伤害是最大的,最糟糕的情况还会引起硬盘坏道从而损失重要数据。

  3.检查所有电缆和外围设备

  试着使用ping命令探测设备状况,ping命令是所有平台通用的。如果可以在局域网内ping通服务器,接着可以试试从局域网外ping服务器进行检测。这样做可以迅速判断问题是否产生在交换和路由层面,而不是服务器级别。电源没有问题,Ping不通,就要丛底层到高层来逐层检查问题了,检查网络接口和网络配置是否正常?DHCP是否启动?Web服务器是否指向正确的DNS服务器?在Windows环境,需要检查服务器是否具有Web服务的角色。在Linux环境下,检查会更复杂,可以试试查找http相关的文件或服务来确保服务器是否正在运行。

  4.检查日志并查明服务器的纪录

  在Web服务器宕机时日志记录的信息,如果是专业人士,日志信息可以告诉你一切,半专业人士可以Google搜索日志报警的错误信息,逐步找到解决方法,非专业专人的管理员就要求救外援了,总之,找问题要纵览全局,多从架构、资源层面去查找问题。

  SLA

  除了事故的解决方法之外,其实选择运营商也是十分重要的。为了保障客户业务高效流畅运行,服务供应商都会透过服务水平协议 (SLA)来确保所提供的标准化服务。万一发生事故,客户有所损失服务商都能根据宕机时间对客户进行赔偿。长期下来,这个承诺渐渐地就成为客户选择服务商的指标。新天域互联的SLA 除了保证网99.9% 的网络正常运行时间外,还有100% 的供电率。在服务方面,7x24x365为客户提供专业线上技术支持。旨在在任何时间为所有客户提供快速,高效的香港服务器服务。硬件方面,包括主机、CPU,综合布线、相关硬件、防火墙,负载均衡器,以及存储区域网络,都能于收到客户提交硬件故障查询后4个小时之内,识别及确定出现故障的硬件及免费为客户更换故障硬件。技术人员会作初步调查及咨询,而工程师则作深入调查、提供解决方案及专业意见,务求提供更好的客户体验。

  责任编辑:DJ编辑

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/2019426/n6698118766.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片