赞
踩
目录
吸烟(抽烟)检测和识别1:吸烟(抽烟)数据集说明(含下载链接)
这是项目《吸烟(抽烟)检测和识别》系列文章之《吸烟(抽烟)数据集说明(含下载链接)》;网上有很多吸烟(抽烟)数据集的数据,在CSDN下载那一搜一大堆,但下载下来,真是不尽人意,质量参差不齐,说多了都是泪呀,都是血泪史的教训。本篇,我们将分享一个我自己项目整合的吸烟(抽烟)分类数据集;smoking-dataset和smoking-video,总共15000+张图片。数据质量较高,可用于深度学习吸烟(抽烟)识别项目的分类模型算法开发。
【尊重原则,转载请注明出处】 https://blog.csdn.net/guyuealian/article/details/130337263
更多项目《吸烟(抽烟)检测和识别》系列文章请参考:
在吸烟(抽烟)检测识别算法开发中,我们需要定义吸烟(抽烟)的行为类别;项目将吸烟(抽烟)状态分为两种情况,分别为:smoking(吸烟),notsmokint(未吸烟),为了便于大家理解,下面给出这吸烟(抽烟)的行为类别定义:
- 人体检测框:人体检测框是通过人体(行人)检测算法预测和定位的人体区域,每个人体用一个矩形框表示
- 吸烟检测区:将人体检测框的左上角位置保存不变,右下角的高度(Height)缩短三分之一左右,得到吸烟检测区
- 吸烟和未吸烟:项目定义,若吸烟检测区存在烟只,则判断为smoking(吸烟)行为;反之,若吸烟检测区不存在烟只,则判断为notsmoking(未吸烟)行为。由于吸烟的行为状态不一,环境复杂多样,尽管这样的吸烟行为定义不全面,但基本可以覆盖业务的大部分场景需求。
代码实现:定义函数get_smoking_roi()用于获得吸烟检测区,基于该方法,项目可以制作吸烟(抽烟)的分类数据集。
- # -*-coding: utf-8 -*-
-
- import numpy as np
- from pybaseutils import image_utils
- import cv2
-
-
- def get_smoking_roi(xyxy, scale=(), cut=0.3):
- """
- 获得吸烟检测区
- :param xyxy: shape is (num-boxes,4),box is (xmin,ymin,xmax,ymax)
- :param scale: boxes缩放大小
- :param cut: 裁剪比例
- :return:
- """
- up_boxes = []
- for i in range(len(xyxy)):
- xmin, ymin, xmax, ymax = xyxy[i]
- w, h = (xmax - xmin), (ymax - ymin)
- ymax = max(ymin + h * cut, ymin + w)
- up_boxes.append([xmin, ymin, xmax, ymax])
- up_boxes = np.asarray(up_boxes)
- if scale: up_boxes = image_utils.extend_xyxy(up_boxes, scale=scale)
- return up_boxes
-
-
- if __name__ == '__main__':
- image_file = "smoking/sample.png"
- boxes = [[47, 52, 255, 420]] # 人体检测框
- boxes = np.asarray(boxes)
- image = cv2.imread(image_file)
- up = get_smoking_roi(xyxy=boxes, scale=(), cut=0.3) # 获得吸烟检测区
- image = image_utils.draw_image_boxes(image, boxes=boxes, color=(255, 0, 0))
- image = image_utils.draw_image_boxes(image, boxes=up, color=(0, 255, 0))
- image_utils.cv_show_image("image", image)
项目已经收集了两个吸烟(抽烟)分类数据集:smoking-dataset和smoking-video,总共约15000+张图片
smoking-dataset吸烟(抽烟)分类数据集,总共15000+张图片,其中测试集431张,训练集14761张;原始图片主要来源于网络爬虫图片检索,部分也是整合网上的数据,背景比较复杂,可作为通用场景的吸烟分类数据。数据中含有两个文件夹,其中文件夹smoking保存的是有吸烟行为图片数据,文件夹notsmoking保存的是无吸烟行为图片数据;所有图片都按照单人单张图片的形式进行裁剪保存(裁剪规则参考get_smoking_roi()函数),数据集已经人工清洗,可用于深度学习分类模型训练。
smoking数据 | notsmoking数据 |
smoking-video吸烟(抽烟)分类数据集;对于深度学习模型训练,我们希望同一个人既有吸烟的数据,也有未吸烟的数据,这样可以提高模型的泛发性,避免模型过拟合一个人;因而,项目专门收集了多个抽烟视频,并抽帧图像,人工分类smoking和notsmoking,最终清洗后得到总共1831张图片。
smoking数据 | notsmoking数据 |
吸烟(抽烟)分类数据集下载地址:吸烟(抽烟)检测和识别1:吸烟(抽烟)数据集说明(含下载链接)
数据包含:
- smoking-dataset吸烟(抽烟)分类数据集,总共15000+张图片,其中测试集431张,训练集14761张
- smoking-video吸烟(抽烟)分类数据集,总共1831张图片
参考文章,Pytorch实现吸烟(抽烟)检测和识别(含吸烟(抽烟)数据集和训练代码):https://blog.csdn.net/guyuealian/article/details/131521338
参考文章:Android实现吸烟(抽烟)检测和识别(含源码,可实时检测):https://blog.csdn.net/guyuealian/article/details/131521347
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。