赞
踩
疲劳识别一度是热门,在疲劳驾驶,疲劳加班熬夜,学生上课打瞌睡等方面都得到了应用,很多刚入门的AI学子是用把疲劳图像进行分类,和正常状态做区分,这种分类方式往往会误检,这是由于这类属于细粒度分类,类外差距小(不打瞌睡和打瞌睡),类内差距大(不同的打瞌睡方式),模型很难学到你想让他学习到的东西,这也是很多初学者学习了YOLO以后以为万物都可YOLO,万物皆分类,正确的做法是要做人脸关键点检测,根据关键点的变化来做判断。
人脸识别检测运用模块:opencv-python、dlib
opencv-python调用摄像头,储存图像。dlib调用已训练好的人脸特征图,与图像结合。
以下代码为初始学习代码,目的是在此基础上加入其他特征,提高疲劳精确度。
#开始导入需要的模块
import cv2#调用摄像头
import dlib#调用识别检测库
from math import hypot
import time
import winsound#调用设备(笔记本)音响,提示疲劳
cap = cv2.VideoCapture(0)#打开笔记本的内置摄像头,参数改为视频位置则为打开视频文件
detector = dlib.get_frontal_face_detector()#获取人脸分类器
predictor = dlib.shape_predictor("shape_predictor_68_face_landmarks.dat")#获取人脸检测器,提取特征点数
font = cv2.FONT_HERSHEY_PLAIN#设置写入文字的字体(在屏幕上的字体)
#用于求上眼皮与下眼皮的重点
def midpoint(p1 ,p2):
return int((p1.x + p2.x)/2), int((p1.y + p2.y)/2)
#用于计算眼睛长宽比,获取比值
def get_blinking_ratio(eye_points, facial_landmarks):
left_point = (facial_landmarks.part(eye_points[0]).x, facial_landmarks.part(eye_points[0]).y)
right_point = (facial_landmarks.part(eye_points[3]).x, facial_landmarks.part(eye_points[3]).y)
#利用脸谱特征图上的点,获得人脸上眼睛两边的坐标
center_top = midpoint(facial_landmarks.part(eye_points[1]), facial_landmarks.part(eye_points[2]))
center_bottom = midpoint(facial_landmarks.part(eye_points[5]), facial_landmarks.part(eye_points[4]))
#利用脸谱特征图上的点,获得人脸上眼睛上下眼皮的坐标,同时计算中间点的坐标
hor_line = cv2.line(frame, left_point, right_point, (0,255,0), 3)
ver_line = cv2.line(frame, center_top, center_bottom, (0,255,255), 3)
#将眼睛左右与上下连成线,方便观测
hor_line_lenght = hypot((left_point[0] - right_point[0]), (left_point[1] - right_point[1]))
ver_line_lenght = hypot((center_top[0] - center_bottom[0]), (center_top[1] - center_bottom[1]))
#利用hypot函数计算得出线段的长度
ratio = hor_line_lenght / ver_line_lenght
#得到长宽比
return ratio
#主程序,一直检测眼睛睁眨,长宽比与一个定值(临界点)比较,判断是否疲劳且发出提示音
while True:
_, frame = cap.read()#这个read是cv2中的方法,作用:按帧读取画面,返回两个值(True,frame)有画面是True,且赋值给frame
gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)#方法,作用:将摄像头捕获的视频转换为灰色并且保存,这样方便判断面部特征点
faces = detector(gray)#利用dlib库,处理获取的人脸画面
#循环每一个画面
for face in faces:
landmarks = predictor(gray, face)
left_eye_ratio = get_blinking_ratio([36, 37, 38, 39, 40, 41], landmarks)
right_eye_ratio = get_blinking_ratio([42, 43, 44, 45, 46, 47], landmarks)
#利用函数获得左右眼的比值
blinking_ratio = (left_eye_ratio + right_eye_ratio) / 2
#取平均数
end = time.time()#记时,判断闭眼时间
#检测眼睛状况
if blinking_ratio > 4.5:
cv2.putText(frame, "CLOSE", (75, 250), font, 7, (255, 0, 255)) #方法,作用:在图像上打印文字,设置字体,颜色,大小
else :
cv2.putText(frame, "OPEN", (75, 250), font, 7, (0, 255, 0))
start = time.time()#记时
print("闭眼时间:%.2f秒"%(end-start))#获取睁闭眼时间差
#判断是否疲劳
if (end-start) > 2 :
cv2.putText(frame, "TIRED", (200, 325), font, 7, (0, 0, 255))
duration = 1000
freq = 1000
winsound.Beep(freq, duration)#调用喇叭,设置声音大小,与时间长短
cv2.imshow("Frame", frame)#方法,作用,创建一个窗口,将画面投影到窗口中
#推出键设置,按Ese键退出
key = cv2.waitKey(1)
if key == 27:
break
#释放窗口,关闭摄像头
cap.release()
cv2.destroyAllWindows()
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。