计算机视觉应用(二)疲劳识别_get_blinking_ratio

作者：笔触狂放9 | 2024-03-14 23:44:22

踩

get_blinking_ratio

疲劳识别一度是热门，在疲劳驾驶，疲劳加班熬夜，学生上课打瞌睡等方面都得到了应用，很多刚入门的AI学子是用把疲劳图像进行分类，和正常状态做区分，这种分类方式往往会误检，这是由于这类属于细粒度分类，类外差距小（不打瞌睡和打瞌睡），类内差距大(不同的打瞌睡方式)，模型很难学到你想让他学习到的东西，这也是很多初学者学习了YOLO以后以为万物都可YOLO，万物皆分类，正确的做法是要做人脸关键点检测，根据关键点的变化来做判断。

人脸识别检测运用模块：opencv-python、dlib
opencv-python调用摄像头，储存图像。dlib调用已训练好的人脸特征图，与图像结合。

以下代码为初始学习代码，目的是在此基础上加入其他特征，提高疲劳精确度。

#开始导入需要的模块
import cv2#调用摄像头
import dlib#调用识别检测库
from math import hypot
import time
import winsound#调用设备（笔记本）音响，提示疲劳

cap = cv2.VideoCapture(0)#打开笔记本的内置摄像头，参数改为视频位置则为打开视频文件
detector = dlib.get_frontal_face_detector()#获取人脸分类器
predictor = dlib.shape_predictor("shape_predictor_68_face_landmarks.dat")#获取人脸检测器，提取特征点数
font = cv2.FONT_HERSHEY_PLAIN#设置写入文字的字体（在屏幕上的字体）

#用于求上眼皮与下眼皮的重点
def midpoint(p1 ,p2):
return int((p1.x + p2.x)/2), int((p1.y + p2.y)/2)

#用于计算眼睛长宽比，获取比值
def get_blinking_ratio(eye_points, facial_landmarks):
left_point = (facial_landmarks.part(eye_points[0]).x, facial_landmarks.part(eye_points[0]).y)
right_point = (facial_landmarks.part(eye_points[3]).x, facial_landmarks.part(eye_points[3]).y)
#利用脸谱特征图上的点，获得人脸上眼睛两边的坐标

center_top = midpoint(facial_landmarks.part(eye_points[1]), facial_landmarks.part(eye_points[2]))
center_bottom = midpoint(facial_landmarks.part(eye_points[5]), facial_landmarks.part(eye_points[4]))
#利用脸谱特征图上的点，获得人脸上眼睛上下眼皮的坐标，同时计算中间点的坐标

hor_line = cv2.line(frame, left_point, right_point, (0,255,0), 3)
ver_line = cv2.line(frame, center_top, center_bottom, (0,255,255), 3)
#将眼睛左右与上下连成线，方便观测

hor_line_lenght = hypot((left_point[0] - right_point[0]), (left_point[1] - right_point[1]))
ver_line_lenght = hypot((center_top[0] - center_bottom[0]), (center_top[1] - center_bottom[1]))
#利用hypot函数计算得出线段的长度

ratio = hor_line_lenght / ver_line_lenght
#得到长宽比
return ratio

#主程序，一直检测眼睛睁眨，长宽比与一个定值（临界点）比较，判断是否疲劳且发出提示音
while True:
_, frame = cap.read()#这个read是cv2中的方法，作用：按帧读取画面，返回两个值（True，frame）有画面是True，且赋值给frame
gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)#方法，作用：将摄像头捕获的视频转换为灰色并且保存，这样方便判断面部特征点
faces = detector(gray)#利用dlib库，处理获取的人脸画面

#循环每一个画面
for face in faces:
landmarks = predictor(gray, face)
left_eye_ratio = get_blinking_ratio([36, 37, 38, 39, 40, 41], landmarks)
right_eye_ratio = get_blinking_ratio([42, 43, 44, 45, 46, 47], landmarks)
#利用函数获得左右眼的比值

blinking_ratio = (left_eye_ratio + right_eye_ratio) / 2
#取平均数

end = time.time()#记时，判断闭眼时间

#检测眼睛状况
if blinking_ratio > 4.5:
cv2.putText(frame, "CLOSE", (75, 250), font, 7, (255, 0, 255)) #方法，作用：在图像上打印文字，设置字体，颜色，大小
else :
cv2.putText(frame, "OPEN", (75, 250), font, 7, (0, 255, 0))
start = time.time()#记时
print("闭眼时间:%.2f秒"%(end-start))#获取睁闭眼时间差

#判断是否疲劳
if (end-start) > 2 :
cv2.putText(frame, "TIRED", (200, 325), font, 7, (0, 0, 255))
duration = 1000
freq = 1000
winsound.Beep(freq, duration)#调用喇叭，设置声音大小，与时间长短

cv2.imshow("Frame", frame)#方法，作用，创建一个窗口，将画面投影到窗口中

#推出键设置，按Ese键退出
key = cv2.waitKey(1)
if key == 27:
break

#释放窗口，关闭摄像头
cap.release()
cv2.destroyAllWindows()

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/笔触狂放9/article/detail/237857