范文资料网>方案策划>应急预案>《数据中心机房应急预案

数据中心机房应急预案

时间:2024-01-10 07:53:22 应急预案 我要投稿
  • 相关推荐

数据中心机房应急预案

  在日常生活或是工作学习中,没准儿会出现一些突发事故,为了提高风险防范意识,把损失降到最低,就常常需要事先准备应急预案。那么大家知道应急预案怎么写才规范吗?以下是小编收集整理的数据中心机房应急预案,欢迎阅读,希望大家能够喜欢。

数据中心机房应急预案

  第一章 总则

  第一条 为规范我所网络中心机房设备管理,提高处理机房突发事件的能力,形成科学、有效、反应迅速的应急工作机制,确保重要计算机信息系统的实体安全、运行安全和数据安全,最大限度地减少突发事件造成的危害,根据《中华人民共和国计算机信息系统安全保护条例》、《信息化建设员工遵循守则》及《企业信息安全管理制度》等相关管理规定等,制定《网络中心机房应急预案及管理办法》(以下简称管理办法)。

  第二条 本文件适用于有计划性、有预防性地管理我所的网络中心机房以及发生和可能发生的与机房有关的突发事件。

  第三条 信管部负责编制、修订网络中心机房管理办法及所辖范围内突发机房事件应急预案。

  周期性或即时性地向局域网用户发布系统安全警示;对异常流量来源进行监控,并妥善处理各种异常情况。及时组织专业技术人员对所辖范围内机房突发事件进行应急处置;负责调查和处理机房突发事件,及时上报并按照相关规定作好善后工作。

  第二章 中心机房管理办法

  第四条 机房内的所有设备需要定期保养,应指定人员做维护、清洁工作,做到两天一收拾,一周一打扫;严禁将各种食物、饮用品带入机房,在机房内禁止吸烟。

  第五条 计算机设备维修工作由专门人员进行,管理人员应把设备的检修情况记录在相应的设备卡上,以便统一归档管理。如发现机房设备故障应及时向上级领导报告,并负责计算机及外设的日常维护与排除故障,在遇到设备保修范围内的故障时,应及时催促供应单位上门或将机器送修;

  第六条 系统管理人员必须严格遵守有关机房、设备及系统运行管理规定,不得在机房内从事与系统管理、运行维护、系统安装和调测等无关的工作;

  第七条 如其他人员需使用机房内设备应向机房负责人提交申请,经主管人员审核签字后,将书面申请提交信管部存档后方可借用机房内的设备;

  第八条 做好防火、防雨、防湿、防盗工作,注意用电安全;机房内的环境要每周检查温度、湿度、电力系统、是否满足机房相关的标准要求;

  第九条 系统管理人员应定时对机房供电系统及其他运行中的系统、设备进行巡视和检查,建立档案,做好系统日志。要对发生的故障以及排除故障情况做好详细记录;机房管理人员每日检查UPS电源的状态,确保在突发停电时,UPS电源能自动供应机房设备正常工作半个小时,保证机房设备的数据及时保存。

  第十条 要统一管理机房内的设备,计算机及其相关设备的驱动程序、保修卡等随机文件与资料要保存完整。要明确专人负责计算机文档、信息化等资料的保管,要做到资料齐全,存放安全;

  第十一条 机房内的交换机和服务器系办公自动化的关键设备,任何人不得自行配置或更改系统参数;

  第十二条 要做好机房的安全工作,对服务器的各种帐户、密码严格保密。对网络运行理,设备维修维护、系统或设备安装等进入机房,必须由机房管理人员陪同进入,做好登记,并配合项目的实施。

  第十七条 进入机房的设备应在进入机房前拆除外包装,以保证机房环境的清洁和安全。

  第十八条 严禁携带易燃、易爆、易腐蚀等危险性物品进入机房。

  第三章 机房用电管理规定

  第十九条 机房内提供的UPS电源只允许为主机、服务器、网络及存储等核心设备供电,严禁安插其他设备,增加UPS电源供电负荷。

  第二十条 严禁擅自切断供电系统,确因工作需要断电时,首先应做好相应准备工作,经部门领导批准,然后给所有部门发放断电通知,最后方可实施。

  第二十一条 机房内安装用电设备或有用电需求的项目时,必须经过专业人员或设备提供商的安装工程师进行现场勘查,经确认在满足或符合要求后工程才能实施。

  第四章 机房施工管理规定

  第二十二条 任何进入机房的施工,施工单位必须指明施工管理人员。

  第二十三条 施工人员进入机房,必须遵守机房有关管理规定,不得携带与施工无关的物品进入机房,并自觉接受保安人员或机房管理人员的管理、监督和检查。

  第二十四条 施工人员未经许可不得进入非指定工作区域,施工前须布置适当的防护设施;施工人员在现场严禁吸烟,不得在机房的任何地方坐卧,饮食,或从事与施工无关的事情。

  第二十五条 施工人员在施工过程中不得擅自动用机房设施和设备,如因施工管理不善造成机房设施、财产及其他一切经济损失,施工单位必须承担责任并负责赔偿。

  第五章 机房安全管理规定

  第二十六条 进入机房的人员必须遵守《机房出入管理规定》以及有关规章制度。

  第二十七条 机房内的设备、工具及相关资料应存放在指定地点,未经许可不得私自带出机房。

  第二十八条 机房内严禁吸烟,严禁存放易燃、易爆、易腐蚀等危险性物品,严禁动用明火;禁止在电器设备上放置纸张等其它杂物;不得存放与系统运行维护和管理无关的设备、物品和资料。

  第二十九条 机房管理人员或保安巡检员应熟悉机房环境以及安全通道的位置,应懂得防火知识,灭火常识,熟悉机房消防设施的使用方法,具有及时发现火灾隐患的能力。

  第三十条 未经批准,不得擅自对网路拓扑结构、连接方式进行修改或拆接,如需作拆接或修改,需经信管部经理同意后方可进行,并把修改情况记录在案,未经允许,机房管理人员、保安人员不得动用机房内的计算机网络设备,线路等。

  第六章 中心机房突发事件应急预案

  第三十一条 机房突发事件包括网络设备或服务器故障、自然灾害(水、火、电等)造成的物理破坏、人为失误造成的安全事件等等。 针对突发事件的预防措施如下:

  1、建立安全、可靠、稳定运行的机房环境,防火、防盗、防雷电、防水、防静电、防尘;建立备份电源系统;加强所有人员防火、防盗等基本技能培训。

  2、服务器采用可靠、稳定的硬件设备,落实数据备份机制,安装有效的防病毒软件,及时更新升级扫描引擎;加强对局域网内所有用户和信息系统管理员的安全技术培训。

  第三十二条 机房漏水应急预案如下:

  1、发生机房漏水时,第一目击者应立即通知机房管理人员。

  2、若空调系统出现渗漏水,机房管理人员应立即安排停用故障空调,清除机房积水,并及时联系设备供应方处理,同时启动备用空调,必要情况下可临时用电扇对服务器进行降温。

  3、若为墙体或窗户渗漏水,机房管理人员应立即采取有效措施确保机房安全,同时安排通知办公室,及时清除积水,维修墙体或窗户,消除渗漏水隐患。

  第三十三条 机房火灾应急预案如下:

  1、完善机房环境,确保机房FM200自动灭火系统工作正常,设置为灭火系统为自动状态。

  禁止携带易燃易爆物品进入机房。

  2、机房管理人员应熟悉机房内部消防系统安全操作和规则,了解机房内FM200灭火消防设备操作原理,掌握消防应急处理步骤、措施和要领,懂得灭火的方法,会扑救初起火灾,并定期组织灭火演习。

  3、一旦发生火情,要迅速切断电源(电源已和消防系统联动),利用机房专用灭火系统灭火,使用气体灭火系统,要保证机房内所有人员全部撤离现场,方可放气灭火(紧急情况采用手动启动,见气体灭火系统操作手册);如机房气体灭火系统失效,在保证人员安全的情况下要立即使用备用手持式灭火器手动灭火,同时以最快的方式向主管领导汇报,尽快增加援助人员协力救火,并迅速拨打物业管理和119火警电话。

  4、等待消防车到来期间,应组织物业保安或工作人员在保证安全的前提下灭火,应急领导小组应在第一时间内集中所有可用灭火器,抓住时机,尽可能的把火扑灭。

  5、配合消防部门调查事故原因,对造成的损失和起火原因做好记录,以便进行灾后总结。

  第三十四条 雷击事故应急预案如下:

  1、遇雷暴天气,机房管理人员在下班后应及时关闭所有服务器,切断电源,暂停内部计算机网络工作。

  2、雷暴天气结束后,机房管理人员应及时开通服务器,恢复内部计算机网络工作,对设备和数据进行检查。出现故障的,事发部门应将故障情况及时报告信管部。

  3、因雷击造成损失的,机房管理人员应会同相关部门进行核实、报损,并在调查工作结束后一日内书面报告领导。

  第三十五条 设备防盗被盗或人为损害应急预案如下:

  1、机房管理人员每日查看、清点设备并锁好机房大门。

  2、机房管理人员每日检查录像监控服务器状态,确保监控画面正常,并检查每日录像正常性、完整性。

  3、发生设备被盗或人为损害设备情况时,使用者或管理者应立即报告信管部负责人,同时保护好现场。

  4、信管部接报后,通知保安及公安部门,一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录。

  5、事发单位和当事人应积极配合公安部门进行调查,并将有关情况向信管部汇报。

  第三十六条 机房停电应急预案如下:

  接到停电通知后,信管部应及时通过办公系统 、电话等发布相关信息,部署应对具体措施,要求涉及到的工作人员在停电前停止业务、保存数据。

  1、确认电力可能恢复的时间,立即通知中心机房电源维护负责人和中心机房各设备的负责人到达现场,做好各机房停电准备。

  如果确认机房停电的时间为短时间停电,立即可以恢复供电的情况(如15分钟以内,根据UPS电池使用周期和寿命,电池后备时间将会减少,应根据现场实际情况,留出机房设备正常关机时间),可以在UPS正常供电的时间内,应密切观察UPS带负载时间,等到电力恢复,期间如UPS剩余时间低于50%(应满足机房设备正常关机时间),机房负责人应立即严格按操作手册停掉机房内的所有设备(包括各应用服务器、存储、核心交换机和路由期等设备的电源,以及机房辅助设备的电源,最后关闭UPS(见UPS操作手册),等待电力恢复,电力恢复供电后转第七条执行。

  如果不能确认恢复供电时间,立即汇报给机房电源维护负责人和中心机房各设备的负责任到达现场。做好各设备的电源停电准备,严格按操作手册停掉机房内的所有设备(包括各应用服务器、存储、核心交换机和路由期等设备的电源,以及机房辅助设备的电源,最后关闭UPS(见UPS操作手册),等待电力恢复,电力恢复供电后转第4条执行。

  2、机房维护负责人将停电的电源柜总空开和分空开的状态处于断开状态,关闭顺序应为,先关闭回路小开关,再关闭总开关(UPS关闭后,应先关闭UPS输出回路开关,再关闭UPS输出总开关,接着关闭UPS输入开关)并向主管领导汇报。

  3、将掉电的所有的设备电源状态处于下电状态,以防止电源柜加电对设备的冲击。

  4、电力室恢复供电后,先不要急于给电源柜加电,等待10-20分钟后,再开始给电源柜加电,以防止供电不稳或再次掉电。

  5、供电正常后,确定设备处于下电状态后,打开电力柜的总控开,开启UPS的市电输入开关,开启UPS(见UPS操作)。

  6、根据设备加电顺序,启动分路空开。

  7、设备加电顺序,网络设备正常后再给服务器、存储等设备加电开机。(以上各设备务必按操作手册的启动顺序上电)。

  8、设备启动正常后,开始启动数据库。

  9、数据库启动正常后,开始启动中间件服务器。

  10、中间件服务器正常后,启动应用程序。

  第三十七条 通信网络故障应急预案如下:

  1、发生通信线路中断、流量异常等故障后,员工应及时通知信管部人员。

  2、信管部在接到报告后,迅速组织相关技术人员检测故障区域,并作相关故障处理,必要时通知通信网络运营商查清原因;逐步恢复故障区与服务器的网络联接,恢复通信网络,保证正常运转。

  3、应急处理结束后,信管部应在一日之内提交故障分析报告,以便备案。

  第三十八条 服务器故障应急预案如下:

  1、机房管理人员每日检查机房设备工作状态,确保系统运行的完善。

  2、机房管理人员定期备份数据和资料,并将备份资料刻录成光盘或拷贝到移动硬盘。

  第三十九条 发生机房突发事件后,信管部应采取有效措施开展先期处置,恢复信息网络正常状态。应急处置工作结束后,信管部对事件发生原因、性质、影响、后果、责任及应急处置能力、恢复重建等问题进行全面调查评估,根据应急处置中暴露出的管理、协调和技术问题,改进和完善预案,实施针对性演练,总结经验教训,整改存在隐患,组织恢复正常工作秩序。

  第七章 附则

  第四十条 信管部会结合信息网络快速发展和经济社会发展状况,配合相关法律法规的制定、修改和完善,适时修订管理办法。

  第四十一条 本文件由信息管理部制定并负责解释。

  第四十二条 本文件经批准后发布实施。

  20xx年05月10日

  上海市xx信管部

【数据中心机房应急预案】相关文章:

数据中心停电应急预案03-31

机房消防应急预案06-13

机房火灾应急预案02-17

机房停电应急预案03-05

机房消防应急预案05-14

【热门】数据中心停电应急预案05-09

【精】数据中心停电应急预案05-09

【推荐】数据中心停电应急预案05-09

机房消防应急处理预案05-14