第一章 总 则
第一条 为规范学校信息科技运维(以下简称“IT运维”)工作,保障教育系统稳定运行,特制定本办法。
第二条 本办法中的IT运维是指采用相关的方法、手段、技术、流程和文档等,对信息系统的软硬件环境(基础环境、硬件环境、软件环境、网络环境等)、IT业务系统和IT运维人员进行的综合管理。
第三条 本办法涵盖学校数据中心的各项IT运维工作,包括但不限于系统运维、网络运维、应用运维、前端设备运维、系统运行等领域。
第四条 IT运维工作内容主要由例行操作、巡视检查、响应支持和优化改善等四项构成,其中:
1. 例行操作是指按照预定的操作流程和步骤,用以保持应用系统有序运转所必须的人工操作;
2. 巡视检查是指按照预定的操作流程和步骤,及时获得运维对象状态,发现并处理潜在的故障隐患;
3. 响应支持是指接到服务请求或故障申告后,采用必要手段和措施,尽快降低和消除对业务运营的不利影响;
4. 优化改善是通过资源提升,技能提升和流程优化等手段,达到提高IT运维管理能力的目的。
第五条 参与IT运维的工作人员应包括管理人员、技术支持人员和操作员等,其中:
1. 管理人员的职责为规划、检查运维的各个环节,对运维的策划、实施、检查、改进的范围、过程、信息安全和成果负责。
2. 技术支持人员的职责为对运维中的请求、事件和问题做出响应,通过技术手段进行处理,保障信息安全并对处理结果负责。
3. 操作员的职责为在运维中根据规范和手册实施日常操作,执行各项运维工作,并对其执行过程负责。
第六条 本办法适用于全校的各项信息科技运维工作。
第二章 术语定义
第七条 数据中心:包括生产中心和灾难备份中心(以下简称灾备中心),其中:
1. 生产中心:对全校业务、用户和管理等重要信息进行集中存储、处理和维护,具备专用场所,为业务运营及管理提供信息科技支撑服务的组织。
2. 灾备中心:为保障全校业务持续性,在生产中心故障、停顿或瘫疾后,能够接替生产中心运行,具备专用场所,进行数据处理和支持重要业务持续运行的组织。灾备中心包括同城灾备中心和异地灾备中心。
第八条 应用系统:用于支持业务开展,完成特定业务功能的计算机系统,如教务系统、财务系统、学生系统等。
第九条 基础环境:为应用系统运行提供基础运行环境的相关设施,如电力、空调、综合布线等。
第十条 网络平台:为应用系统提供安全网络环境相关的网络设备、电信设施,如路由器、交换机、防火墙、入侵检测器、负载均衡器、电信线路等。
第十一条 硬件平台:构成应用系统的计算机设备,如小型机、服务器、存储设备和营业网点机具等。
第十二条 软件平台:安装和运行在计算机设备中,构成应用系统的软件程序,如系统软件、支持性软件、应用软件等。
第十三条 数据:应用系统支持业务运行过程中产生的数据和信息,如帐务数据、交易记录等。
第三章 系统运维
第十四条 系统运维是指采用相关的方法、手段、技术、制度、流程和文档等对主机系统软硬件进行的综合管理。
第十五条 系统运维的工作范围包括操作系统、数据库、中间件、小型机、PC服务器、存储设备、数据备份系统、防病毒系统、灾备系统等的维护操作。
第十六条 系统运维须设立主机管理员、存储管理员、数据库管理员、中间件管理员等角色,并明确人员要求、岗位职责、工作流程等。
第十七条 统一制定全校主机系统软硬件发展规划、建设规范、技术标准以及设备选型策略。
第十八条 制定学校范围内技术标准和规范,整理技术手册,开发和使用技术管理工具,确保人员技术能力满足生产运维工作的要求。
第十九条 参与应用系统架构规划及评审工作,确保应用系统架构符合学校系统技术规范的相关要求。
第二十条 所有生产系统纳入登录认证管理范围,统一认证、授权和记录,制定系统登录密码的管理策略。
第二十一条 系统运维的所有岗位须配置A角和B角,系统运维操作应按照分级原则进行相应授权后方可进行,关键操作应复核。
第二十二条 根据系统软硬件运行特点,制定日常巡检操作规范,开发和使用日常巡检工具,完成巡检操作和结果分析,及时发现系统隐患,排除运行风险。
第二十三条 及时响应系统级监控报警和事件报障,准确进行故障定位,快速完成故障处理,确保及时消除对业务生产系统造成的影响。事后对故障现象进行分析,查找故障原因,形成故障报告及整改方案。
第二十四条 根据业务增长需要和系统运行实际情况,制定系统扩容计划和性能升级计划,实施系统扩容和性能升级操作,确保系统容量满足业务顺利开展的要求。
第二十五条 根据系统软硬件运行需要和应用需求,制定变更方案和系统版本升级计划,组织协调测试工作,确定变更计划,实施变更操作,确保各类系统变更在不引发运行风险的情况下准确完成。
第二十六条 按照系统投产工作要求,完成系统软硬件投产方案设计、投产环境准备、投产操作实施、投产初期重点保障等工作,确保生产系统投产变更工作的顺利完成。
第二十七条 制定数据备份方案,维护数据备份平台工具,定期执行数据恢复测试,验证数据的可恢复性,确保可以快速有效地完成数据恢复任务,为生产数据提供可靠的保护。
第二十八条 制定系统容灾方案,实施系统容灾建设,定期执行容灾切换演练,维护和验证系统灾备环境,确保灾难发生时可以快速准确地完成系统切换,减少对业务造成的影响。
第二十九条 根据业务发展的变化,对需要下线的系统,完成系统软硬件下线方案梳理、下线环境备份、下线操作实施、下线资源回收等工作。
第四章 网络运维
第三十条 网络运维是指采用相关的方法、手段、技术、制度、流程和文档等对网络设备进行的综合管理。
第三十一条 网络运维的工作范围包括为生产系统提供网络连接所需的网络设备、通讯线路以及基础电信运营设施的对接管理等。
第三十二条 网络运维须根据工作范围和工作内容的不同设立相应的工作岗位,并明确人员要求、岗位职责、工作流程等。
第三十三条 统一制定全校网络发展规划、建设规范、技术标准以及设备选型策略。
第三十四条 参与应用系统架构规划及评审工作,确保应用系统架构符合学校网络技术规范的相关要求。
第三十五条 制定网络运维的变更管理流程、故障处置流程以及应急处置流程,并在日常运维活动中严格遵守以控制操作风险,缩短响应时间。
第三十六条 定期对设备进行巡检,并根据网络架构和设备调整情况及时更新巡检内容。
第三十七条 定期备份网络设备的配置、日志等信息,满足日常运维以及审计的需要。
第三十八条 将重要网络设备和线路纳入网管监控平台,加强事件管理及性能容量管理,当设备、线路容量不满足业务和应用发展需求时及时进行扩容。
第三十九条 将所有重要网络设备纳入认证管理范围,统一认证、授权和记录,制定网络设备登录密码的管理策略。
第四十条 建立网络安全区域相关规范,并定期检查网络安全合规与访问控制策略执行情况,及时修正网络安全合规偏差与策略部署漏洞。
第四十一条 定期进行网络切换演练,定期进行网络设备软硬件生命周期的评估,及时替换存在安全运行隐患的设备,升级存在较大隐患的软件版本。
第五章 应用运维
第四十二条 应用运维是指采用相关的方法、手段、技术、制度、流程和文档等对生产系统的应用软件进行的综合管理活动。
第四十三条 应用运维的工作范围为在生产环境运行的用于实现特定业务功能的应用软件。
第四十四条 按照工作内容设置应用运维角色,并配置相应岗位的专业人员,包括技术支持人员、配置管理人员、变更发布管理人员、例行维护管理人员和知识管理人员等,满足应用运维工作需要和内控要求。
第四十五条 应用运维的工作内容包括:应用级故障快速处置、应用软件例行运行维护、应用配置和运行资源参数管理、应用变更审核及发布管理、应用运维知识管理等。
第四十六条 建立应用级快速处置的工作流程,制定应用级故障快速处置技术方案标准,收集处置预案并审核发布,定期组织快速处置演练。
第四十七条 建立应用软件例行运行维护的工作流程,范围包括但不限于应用状态检测、空间清理、敏感时期重点保障等内容,制定维护方案的技术标准,编制维护执行计划并监督计划执行情况。
第四十八条 建立应用系统配置和运行资源参数信息的识别、收集、审核及登记的工作流程,确定应用系统配置和运行资源参数范围,并对信息变更进行管理。
第四十九条 建立数据中心应用变更审核和发布工作流程,设置数据中心应用变更统一入口。
第五十条 制定年度投产变更时间窗口计划,原则上应与行业性的维护窗口一致,如果遇到外部特殊规定,及时对时间窗口进行调整。
第五十一条 应用发布须从指定的可信渠道来源下载发布内容,应用发布须由多人实施,至少应包括操作人员和技术支持人员,应用发布应在指定的发布终端,按照发布操作文档实施。
第五十二条 建立应用运维知识的收集、审核及登记工作流程,建立应用运维知识库。应用知识的编制,坚持问题导向的原则,内容须具有较高的逻辑严密性和可读性。知识库应具备合理的条目编排和分类,制定有效的知识检索方法,并定期进行审核清理。
第五十三条 应用运维工作中发现的应用软件缺陷,应及时反馈开发部门予以修订,并定期总结分析。
第六章 系统运行
第五十四条 系统运行是指采用相关的方法、手段、技术、制度、流程和文档等对数据中心基础环境和日常操作进行的综合管理工作。
第五十五条 系统运行的工作范围包括数据中心基础设施维护,例行运行操作、日终批处理操作、各类监控指标巡视检查、机房环境管理和机房出入管理等。
第五十六条 系统运行须根据工作范围和工作内容的不同设立相应的工作岗位,并明确人员要求、岗位职责、工作流程等。
第五十七条 对数据中心机房内各类设备进行登记备案管理,定期核对登记信息与实际情况是否相符,并及时对变化内容进行调整。
第五十八条 制定数据中心基础设施运行环境的巡检方案和巡检计划,并按计划执行巡检方案,对巡检中发现的异常情况,按照既定方案查找问题、解决故障,及时报告并记录。
第五十九条 制定数据中心基础设施的维护方案和维护计划,并按照计划对基础设施进行维护。
第六十条 配置生产环境应用系统的监视设施,实时监视生产系统运行情况,如发现告警应及时按照处置预案处理并记录。
第六十一条 编制运行操作手册,并按照操作手册完成例行操作和日终批处理操作,操作手册应包含正常处理步骤和对非正常操作结果的处理步骤。
第六十二条 编制系统运行知识库,内容涵盖系统运行操作范围,并根据实际情况变化,更新运行知识库的内容。
第六十三条 定期编制系统运行和基础设施维护情况报表,反映系统运行和维护状况,并进行总结分析。
第六十四条 按相关监管机构要求报送运行情况。
第六十五条 制定数据中心机房工作规范,并按照规范对所有进出数据中心工作环境的人员进行统一管理。
第六十六条 制定数据中心人员操作权限管理规则,并按照规则对所有使用数据中心工作环境的操作人员进行统一管理。
第六十七条 按照业务连续性管理需要,制定数据中心系统连续性演练计划,按照要求组织应用系统切换演练。
第七章 前端设备运维
第六十八条 前端设备运维是指采用相关的方法、手段、技术、制度、流程和文档等,对学校部室及二级学院的办公电脑、操作终端及所关联的输入输出电子设备进行综合管理。
第六十九条 前端设备运维包括前端设备和网络以及配置软件的管理与维护,培训和指导相关处室对前端设备进行日常维护管理。
第七十条 制定前端设备日常巡检操作规范,对巡检发现的故障进行分析,及时排除隐患。日常巡检操作规范应按照实际情况定期调整并发布。
第七十一条 编制前端设备故障处置预案,记录故障处置情况,并进行事后分析,及时排除隐患。故障处置预案应按照实际情况定期调整并面向分支机构发布。
第七十二条 制定前端设备配置软件更新升级方案,编制设备升级计划。
第七十三条 制定合理的前端设备配置标准,建立前端设备配置基线,并根据实际变化定期更新调整。
第七十四条 编制前端设备采购和更新计划,并按计划组织前端设备的更新替换。
第七十五条 制定前端设备的桌面安全管理规范,组织实施全校桌面安全巡检工作。
第八章 IT服务台
第七十六条 IT服务台是指网络与教育技术中心面向全校内部人员提供的应用系统问题报告平台和远程支持服务平台。
第七十七条 IT服务台的工作范围为生产环境应用系统在使用过程中的信息技术支持服务,通过人工服务、自助服务和知识手册等方式实现。
第七十八条 IT服务台须根据工作范围和工作内容的不同设立相应的工作岗位,并明确人员要求、岗位职责、工作流程等,须配置相应的专业人员,以满足IT服务台的工作需要和内控要求。
第七十九条 制定IT服务事件管理规范,以IT服务台作为网络与教育技术中心对全校的IT故障响应中心,对报告事件进行登记、处置、反馈和关闭,并全程跟踪和记录,确保各环节统一协作,及时准确完成故障处理。
第八十条 制定IT服务请求管理规范,由IT服务台定期发布网络与教育技术中心的IT服务目录,并对各类服务请求进行记录、处理和答复,同时负责服务请求的跟踪和督办。
第八十一条 IT服务台负责服务质量分析,利用已有数据,定期对事件和服务请求进行总结和分析,提出开发和运维工作中的问题,促进服务水平提升。
第九章 附 则
第八十二条 本办法由学校网络安全与信息化领导小组解释、修订。
第八十三条 本办法自印发之日起执行。
德州学院网络安全与信息化领导小组办公室
网络与教育技术中心(代章)
2024年1月18日