补充05:EAP夜班OnCall值守SOP+交接班标准化台账模板
一、本课学习目标
1、掌握Fab EAP夜班标准化值守流程、故障分级响应、应急处置规范。
2、精通单机/分区/全厂三级故障判定标准、处理时限、上报机制。
3、掌握标准化交接班台账填写规范、遗留问题传递、风险点位交接。
4、规避夜班常见人为事故:漏告警、漏处理、漏记录、交接断层、误操作。
5、完全适配厂区稽核、量产SOP合规、新人夜班上岗标准。
二、夜班OnCall核心原则(量产红线)
1、夜班以保量产、保设备在线、保数据完整、保自动化稳定为第一优先级。
2、小故障不过夜、大故障及时升级、异常必须留痕记录。
3、所有变更、重启、配置修改禁止夜间盲目操作,必须评估风险。
4、交接班必须纸面+系统双交接,杜绝口头交接。
三、故障分级标准与响应时限(工厂统一标准)
1、一级故障(全厂级)
定义:多台设备批量离线、EAP服务宕机、数据库异常、全厂自动化中断
响应时限:5分钟内介入,10分钟内升级主管,优先恢复产线
2、二级故障(分区级)
定义:单工艺区多台设备不稳定、频繁断线、Trace大面积缺失
响应时限:10分钟介入,30分钟定位根因
3、三级故障(单机级)
定义:单台设备通信波动、偶尔离线、单参数异常
响应时限:正常巡检处理,当班闭环记录
四、夜班标准化值守SOP
1、到岗点检(每2小时固定巡检)
1、EAP主备服务状态、集群状态
2、Oracle/InfluxDB数据库负载、磁盘使用率
3、全厂设备在线率、断线设备清单
4、批量报警、异常事件筛查
5、网关、OPC、链路状态巡检
2、夜间故障处置流程
发现异常 → 临时恢复保量产 → 日志抓取定位 → 记录根因 → 遗留问题交接 → 次日深度复盘
3、夜间禁止操作红线
1、禁止夜间随意重启EAP主服务、数据库、网关集群
2、禁止夜间批量修改设备模板、协议参数、超时配置
3、禁止夜间无评估上线新版本、新脚本
五、交接班标准化台账规范
台账必填五大模块:
1、当班运行总体状态(在线率、稳定性)
2、当班所有故障记录、处理过程、临时对策
3、未闭环遗留问题、风险点位、需要白班跟进事项
4、设备改造、网关变动、配置变更记录
5、特殊生产情况、临时产线安排
六、典型夜班高频问题处理模板
1、单设备频繁离线:临时重启链路、抓包留存、记录波动时段,次日排查网络抖动
2、数据库磁盘告警:临时清理日志、扩容兜底,次日优化清理策略
3、Trace断层:检查订阅状态、重启采集服务、补传数据
4、批量设备心跳超时:检查核心交换机、网关集群状态,紧急切换备机
七、本课核心总结
1、夜班OnCall核心是稳、保、记、交,优先保量产、其次定位根因。
2、故障分级响应是标准化关键,杜绝小问题拖延、大问题瞒报。
3、交接班台账必须完整留痕,是量产追溯、责任界定的核心依据。
八、课后作业
1、夜班发现全厂设备批量离线,你的标准处置流程是什么?
2、交接班必须重点交接哪四类内容?
3、夜间为什么禁止随意重启核心服务与修改配置?