返回首页

网站导航
资讯首页> 网站公告 >产品资讯 > 服务器在运行中进行维护的五大清单

    服务器在运行中进行维护的五大清单

    产品资讯2017年12月07日
    分享
      在互联网高速发展的现在,即使是拥有高性能和冗余功能的现代服务器,增加的工作负载整合与可靠性,也让服务器忙得不可开交。究竟如何维护服务器?如何提高服务器的稳定性呢?答案是,需要为服务器列出维护清单,包括物理配件以及系统关键配置,做好以下五大清单!
      
      1
      
      检查事件日志输出
      
      服务器事件日志中记录着丰富的信息,尤其是一些细节。如果没有仔细检查系统日志、恶意软件日志和其他日志,服务器维护是不规范不完整的。当然,关键的系统问题应该引起IT管理员和技术人员的注意,但也有无数的非关键问题,可能是慢性或严重问题的危险信号。
      
      要积极主动的分析日志数据,当日志检查发现慢性或反复出现的问题,要积极主动的寻找解决方案,避免问题升级。例如:如果服务器日志显示一些内存模块的可恢复报告,那么不会触发严重告警,但报告说明了某个模块的问题,那么IT人员就可以进行更详细的诊断程序以识别即将发生的故障。如果问题影响轻微,无须关闭服务器,那么它可以返回到线上继续服务,直到需要更换硬件的时候。
      
      2
      
      检查内部硬盘
      
      许多服务器依赖内部硬盘,用于承载工作量和存储,保存用户数据以及其他功能。硬盘介质出现问题会严重影响服务器的负载性能和稳定性,最终会导致硬盘故障。磁盘介质是不完美的,常见问题包括坏道和碎片化。RAID可以比较稳定地确保出现磁盘故障时数据稳定与一致性,但更小型的服务器,如1U的机架式服务器可能无法提供足够的空间来实施RAID。使用如CHKDSK(CheckDisk)这样的工具来检查硬盘完整性,还可以尝试修复其中损坏的扇区。
      
      磁盘碎片不会消失,使用NFS并且文件分配表或FAT,文件系统会使用首个可用集群的磁盘空间。碎片可能会降低服务器磁盘速度并引发故障,诸如Windows Server 2012自带的卷组优化工具,可以安排每个文件集群,并确保数据连续。
      
      3
      
      定期安装更新和补丁
      
      BIOS、操作系统、虚拟机管理程序、驱动程序、应用程序、支持工具必须确保互动与协作,但是软件代码很少完美或没有任何问题,所以此类软件问题需要通过修补或更新来修复错误、简化操作、提高安全性和性能等。不是所有软件都可以自动更新,管理员需要确认哪些补丁或升级包是必要的,然后评估和测试更新效果。如果更新包修复的是服务器不存在的问题,实属多此一举。
      
      软件开发者无法测试到每个软硬件兼容性以及补丁、更新的潜在问题,因此可能会导致更多的问题,这种情况可能在特定的服务器或软件集中发生。要在实验室环境内测试补丁或更新,始终确保可以撤销原来的更改,并可以恢复修改前的软件配置。
      
      4
      
      确保服务器可以呼吸
      
      一旦服务器关机,检查其内部和外部的空气流动路径,清除任何积累的灰尘和杂物,确保冷却空气通行顺畅。从外部空气出入口开始,然后继续到系统机箱CPU散热器和风扇组件,内存模块和所有冷却风扇叶片与风道路径。防静电工作区用清洁、干燥的压缩空气去除尘和碎屑。不要在机架中清洁服务器。
      
      除尘是个长期的传统过程,但这并不意味着它已经过时了。灰尘是一种热绝缘体,需要清除掉,现代的替代冷却方案以及ASHARE建议已经提出了调高数据中心工作温度。灰尘和其他空气流动的障碍物会导致服务器使用更多能源,甚至沉淀积累导致某些组件过早出现故障。
      
      5
      
      坚持例行维护
      
      服务器管理员往往忽视计划好的例行维护。不要等到实际出现故障才进行维护,预留时间进行日常维护可以防止问题。维护频率取决于设备年龄、数据中心环境、待维护服务器的容量和其他因素。
      
      放置在设备间的旧设备会比放置在配有HEPA过滤器、良好冷却设施数据中心里的设备需要更频繁的检查,组织可以根据供应商或第三方的例行巡检策略来安排日常维护。