赞
踩
数据集特点
标注
x1,y1,x2,y2,x3,y3,x4,y4分别为左上、右上、右下、左下四个坐标,值为像素值
<识别难易程度>以0或1表示,0表示容易识别,即图像中文本清晰可见;1表示很难识别,即图像中文本较小或模糊不清楚。
<“文本”>中如果有不清楚的字符,以#表示;如果文本完全不清楚,很难识别(对应<识别难易程度>=1),则以"###"表示。
数据集特点:
标注
// 一般的深度学习算法,接收的矩形框都是QUAD风格的,即 //x1,y1,x2,y2,x3,y3,x4,y4,text def rotate(angle, x, y): """ 基于原点的弧度旋转 :param angle: 弧度 :param x: x :param y: y :return: """ rotatex = math.cos(angle) * x - math.sin(angle) * y rotatey = math.cos(angle) * y + math.sin(angle) * x return rotatex, rotatey def xy_rorate(theta, x, y, centerx, centery): """ 针对中心点进行旋转 :param theta: :param x: :param y: :param centerx: :param centery: :return: """ r_x, r_y = rotate(theta, x - centerx, y - centery) return centerx+r_x, centery+r_y def rec_rotate(x, y, width, height, theta): """ 传入矩形的x,y和宽度高度,弧度,转成QUAD格式 :param x: :param y: :param width: :param height: :param theta: :return: """ centerx = x + width / 2 centery = y + height / 2 x1, y1 = xy_rorate(theta, x, y, centerx, centery) x2, y2 = xy_rorate(theta, x+width, y, centerx, centery) x3, y3 = xy_rorate(theta, x, y+height, centerx, centery) x4, y4 = xy_rorate(theta, x+width, y+height, centerx, centery) return x1, y1, x2, y2, x3, y3, x4, y4
数据集特点:
数据集特点:
数据集特点:
参考:
数据格式介绍
数据集特点:
ICDAR2013(水平拉丁语数据集):
ICDAR2015(水平拉丁语数据集):
ICDAR2017:
ICDAR2019(多种语言文本数据集)
数据集特点:
1.该数据集为任意文本形状的数据集Train:1000张+Test:500张,数据集大约几百兆,每张图片都有自己注释的文本,没有标记文本内容。
2. 注释文本有多少行就代表这张图片有多少个文本框,每行包含32个数字,前四个数字为该弯曲文本在整张图上的矩形框坐标值;剩下的28个值(14个点)为与左上角坐标形成的差值(图像的实例为多边形标注)
标注
以上就是文本检测与识别的常用数据集
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。