news 2026/5/1 10:26:45

深夜赶项目的程序员小张盯着屏幕打了个哈欠,突然想起上周写的疲劳检测工具还没调通。今天咱们就聊聊怎么用68个人脸特征点捕捉这种“灵魂出窍“的瞬间,关键时刻能救命

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
深夜赶项目的程序员小张盯着屏幕打了个哈欠,突然想起上周写的疲劳检测工具还没调通。今天咱们就聊聊怎么用68个人脸特征点捕捉这种“灵魂出窍“的瞬间,关键时刻能救命

采用caffe68点检测人脸特征点,识别疲劳,当眼睛缝隙小,则认为是疲劳,有python,c++版本。

先准备个能打的面部定位工具,这里我翻出了珍藏的Caffe版68点检测模型(prototxt和caffemodel文件得提前准备好,放模型目录里别乱跑)。Python版本用OpenCV的dnn模块加载最方便:

# Python版模型加载 net = cv2.dnn.readNetFromCaffe( "face_detector/68point_deploy.prototxt", "face_detector/68point_model.caffemodel" )

C++选手别急,咱们的代码也照顾到了:

// C++版模型加载 cv::dnn::Net net = cv::dnn::readNetFromCaffe( "face_detector/68point_deploy.prototxt", "face_detector/68point_model.caffemodel" );

抓取人脸关键点时有个坑要注意:输入图片的归一化方式得和模型训练时一致。比如有些模型要求像素值从0-255缩放到-1到1,有的则用均值减法,这个不搞清楚定位准头就差远了。

拿到68个点坐标后,重点锁定眼睛区域。以左眼为例(36-41号点),计算眼睛睁开程度的套路是这样的:

def eye_aspect_ratio(eye_points): # 计算垂直方向两组距离 A = np.linalg.norm(eye_points[1] - eye_points[5]) B = np.linalg.norm(eye_points[2] - eye_points[4]) # 计算水平方向距离 C = np.linalg.norm(eye_points[0] - eye_points[3]) return (A + B) / (2.0 * C)

当这个比值连续20帧低于0.25时(别照搬这个阈值,得根据实际效果调),就该触发警报了。实时检测时建议用环形队列保存最近30帧的状态,这样既省内存又能避免误判。

C++版本的计算逻辑类似,但得注意类型转换:

double calculateEAR(const vector<Point2f>& eyePoints) { double vertical1 = norm(eyePoints[1] - eyePoints[5]); double vertical2 = norm(eyePoints[2] - eyePoints[4]); double horizontal = norm(eyePoints[0] - eyePoints[3]); return (vertical1 + vertical2) / (2 * horizontal); }

实际部署时发现了几个骚操作:

  1. 在光线不足的环境下,先做个直方图均衡化再检测
  2. 侧脸时单眼闭合的情况要特殊处理
  3. 戴眼镜的同学容易被反光干扰,加个ROI区域动态调整就好

最后上个Python版的完整流程示例:

cap = cv2.VideoCapture(0) eye_history = deque(maxlen=30) # 存最近30帧状态 while True: ret, frame = cap.read() # 人脸检测和关键点预测(此处省略) left_ear = eye_aspect_ratio(left_eye_points) right_ear = eye_aspect_ratio(right_eye_points) eye_history.append((left_ear + right_ear) / 2) if len(eye_history) == 30 and np.mean(eye_history) < 0.25: cv2.putText(frame, "WAKE UP!", (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0,0,255), 2) cv2.imshow("Frame", frame)

开发这种功能最解压的时刻,就是看着检测框跟着人脸晃来晃去,比看ASMR还治愈。不过别光顾着玩,记得保存模型文件路径别写死,不然换台机器分分钟给你脸色看。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 7:24:26

老年关怀产品设计:用GLM-TTS降低数字鸿沟影响

老年关怀产品设计&#xff1a;用GLM-TTS降低数字鸿沟影响 在社区健康站的一次调研中&#xff0c;一位78岁的老人反复按下智能血压仪的语音播报键&#xff0c;却始终皱着眉头&#xff1a;“它说‘请服用硝苯地平’&#xff0c;可我听成了‘心崩地皮’&#xff0c;吓一跳。”旁边…

作者头像 李华
网站建设 2026/4/19 1:17:25

GitHub Issues维护:及时响应用户提交的bug反馈

GitHub Issues维护&#xff1a;及时响应用户提交的bug反馈 在开源社区&#xff0c;一个项目的生命周期往往不只取决于代码质量&#xff0c;更在于它如何与用户互动。尤其是像 GLM-TTS 这样面向实际应用场景的语音合成系统&#xff0c;每一次用户提交的 Issue 都可能揭示出真实使…

作者头像 李华
网站建设 2026/4/30 12:10:48

虚拟数字人驱动:结合GLM-TTS与Live2D实现语音动画同步

虚拟数字人驱动&#xff1a;结合GLM-TTS与Live2D实现语音动画同步 在直播弹幕中挥手打招呼的虚拟主播、用温柔语调讲解知识点的AI教师、在客服窗口耐心答疑的卡通助手——这些不再是科幻电影中的桥段&#xff0c;而是正在走进现实的人机交互新形态。但你有没有注意到&#xff0…

作者头像 李华
网站建设 2026/5/1 4:02:54

健身房教练语音:个性化指导运动节奏与动作

健身房教练语音&#xff1a;个性化指导运动节奏与动作 在一间现代智能健身房里&#xff0c;一面看似普通的镜子突然响起声音&#xff1a;“挺胸&#xff0c;核心收紧——很好&#xff0c;保持这个姿势&#xff01;”语气坚定却不失鼓励&#xff0c;音色熟悉得就像你每周预约的那…

作者头像 李华
网站建设 2026/4/30 21:36:29

火车站检票口提示音:动态更新列车延误通知

火车站检票口提示音&#xff1a;动态更新列车延误通知 在高峰时段的火车站&#xff0c;广播里传来机械而冰冷的声音&#xff1a;“G1234次列车晚点。”没有解释、没有语气变化&#xff0c;甚至“G”被读成了“鸡”。乘客皱眉、焦躁&#xff0c;服务台前排起长队。这样的场景并不…

作者头像 李华