赞
踩
- import pickle
-
- path = r'D:\Project\pyskl-main\pyskl-main\Test\ntu60_hrnet.pkl' # path='/root/……/aus_openface.pkl' pkl文件所在路径
-
- f = open(path, 'rb')
- data = pickle.load(f)
-
- print(data)
- print(len(data))
'frame_dir': 'S017C003P016R002A028'
'frame_dir' 的值是 'S017C003P016R002A028'。这个字符串可能是对应视频的唯一标识符,用于定位和检索视频数据。
frame_dir
是对应视频的标识符。它是一个字符串,用于唯一标识视频或视频帧的目录或文件路径。
在您提供的描述中,"frame_dir" 是一个用于指示视频的标识符。它可能是视频文件的名称、目录的名称或任何其他能够唯一标识视频的字符串。
这个标识符通常用于在计算机系统中定位和检索特定的视频数据。它可以用于指定视频的存储位置、访问视频文件或目录,或识别特定视频的相关信息。
total_frames (int): The number of frames in this video.
'total_frames' 是一个整数,表示视频中的帧数。
帧数是视频中连续的静止图像,它们以一定的速率播放以呈现动态画面。'total_frames' 表示视频中总共有多少个连续的帧。
img_shape (tuple[int]): The shape of a video frame, a tuple with two elements, in the format of (height, width). Only required for 2D skeletons.
'img_shape' 是视频帧的形状,是一个包含两个元素的元组,格式为 (height, width)。这个形状表示视频帧的高度和宽度。
在这种情况下,'img_shape' 提供了视频帧的尺寸信息。元组中的第一个元素表示视频帧的高度,第二个元素表示视频帧的宽度。
这些尺寸信息通常用于描述视频帧的空间分辨率。例如,(1920, 1080) 表示视频帧的高度为 1920 像素,宽度为 1080 像素。
在文本中提到 "2D skeletons",这可能指的是在视频帧中提取的人体骨架或姿势估计数据。如果是这样的情况,知道视频帧的形状可以帮助将骨架数据与相应的图像对应起来。
original_shape (tuple[int]): Same as img_shape.
'original_shape' 是一个元组,与 'img_shape' 相同,表示视频帧的形状。它包含两个整数元素,按照 (height, width) 的格式表示。
根据您提供的信息,'original_shape' 的值与 'img_shape' 相同,为 (1080, 1920)。这表示视频帧的原始形状与 'img_shape' 中描述的形状相同。
'original_shape' 和 'img_shape' 都提供了视频帧的尺寸信息,其中高度为 1080 像素,宽度为 1920 像素。这些信息用于描述视频帧在屏幕或图像空间中的大小。
请注意,'original_shape' 可能指示视频帧的初始形状,在任何处理或调整大小之前。如果视频帧经过了任何处理或调整大小操作,'original_shape' 可能与最终显示的图像形状不同。
label (int): The action label
'label' 是一个用于指示动作的整数值。它可能是对应某个特定动作或行为的标识符。
keypoint (np.ndarray, with shape [M x T x V x C]): The keypoint annotation. M: number of persons; T: number of frames (same as total_frames); V: number of keypoints (25 for NTURGB+D 3D skeleton, 17 for CoCo, 18 for OpenPose, etc. ); C: number of dimensions for keypoint coordinates (C=2 for 2D keypoint, C=3 for 3D keypoint)
'keypoint' 是一个 NumPy 数组,具有形状为 [M x T x V x C] 的维度。其中,M 表示人数,T 表示帧数(与总帧数相同),V 表示关键点数量(对于不同的数据集或姿势模型可能有不同的值,如 NTURGB+D 3D 骨架为 25,Coco 为 17,OpenPose 为 18 等),C 表示关键点坐标的维度(C=2 表示 2D 关键点,C=3 表示 3D 关键点)。
具体来说,'keypoint' 是一个用于记录关键点注释的数组。它可以包含多个人的姿态数据,并跟踪每个人在不同帧中的关键点坐标。关键点坐标可以是二维(x,y)或三维(x,y,z)。
该数组的维度表示了不同的信息:
例如,如果使用 NTURGB+D 3D 骨架数据集,'keypoint' 数组的形状可能是 [M x T x 25 x 3],其中 M 表示人数,T 表示帧数,25 表示该数据集中有 25 个关键点,3 表示每个关键点的坐标是三维的(x,y,z)。
keypoint_score (np.ndarray, with shape [M x T x V]): The confidence score of keypoints. Only required for 2D skeletons.
'keypoint_score' 是一个 NumPy 数组,具有形状为 [M x T x V] 的维度。该数组用于表示关键点的置信度分数。
根据您提供的描述,'keypoint_score' 数组与关键点数组('keypoint')相对应,但仅用于二维骨架的情况。它记录了每个关键点的置信度分数。
具体来说:
'keypoint_score' 数组的值是关键点的置信度分数,用于表示每个关键点的可靠程度或准确度。这些分数可以是浮点数或其他适当的数值类型。
请注意,'keypoint_score' 数组仅在二维骨架(2D skeleton)的情况下才需要。对于三维骨架或其他类型的关键点数据,可能不会使用置信度分数。
参考:
pyskl/tools/data/README.md at main · kennymckormick/pyskl · GitHub
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。