当前位置:   article > 正文

数据标注工程笔记_精灵标注 案例

精灵标注 案例
环境准备
精灵标注助手

精灵标注助手-人工智能数据集标注工具 (jinglingbiaozhu.com)

labelimg

pip install labelimg
数据采集、标注:手工活

导出

数据采集导出格式:xml、json、MongoDB、pascal-voc

采集出来的数据是网络方向标签化的数据

xml

网络标签化数据、网络传输不发达时创建

但是结构方便仍在数据处理适用

可以当成结构体、类

可以根据自己的设计需求定义专属的标记

标签语言:网络语言的表现形式,java、html、xml

XML 简介 - XML (可扩展标记语言) | MDN (mozilla.org)

精灵标记助手采集的xml格式数据
  1. <!-- 矩形框采集 -->
  2. <!-- 标记失败 -->
  3. <?xml version="1.0" ?>
  4. <doc>
  5. <path>D:\yyqh\DataSet\set1\8805d9c7c825a211eacec94f37b871e9.jpeg</path>
  6. <outputs></outputs>
  7. <time_labeled>0</time_labeled>
  8. <labeled>false</labeled>
  9. </doc>
  10. <!-- 标记成功,但识别失败 -->
  11. <?xml version="1.0" ?>
  12. <doc>
  13. <path>D:\yyqh\DataSet\set1\data (1).jpeg</path>
  14. <outputs>
  15. <object></object>
  16. </outputs>
  17. <time_labeled>1695689497928</time_labeled>
  18. <labeled>true</labeled>
  19. <size>
  20. <width>1000</width>
  21. <height>1506</height>
  22. <depth>3</depth>
  23. </size>
  24. </doc>
  25. <!-- 成功 -->
  26. <?xml version="1.0" ?>
  27. <doc>
  28. <path>D:\yyqh\DataSet\set1\data (2).jpeg</path>
  29. <outputs>
  30. <object>
  31. <item>
  32. <name></name>
  33. <bndbox>
  34. <xmin>10</xmin>
  35. <ymin>-1</ymin>
  36. <xmax>974</xmax>
  37. <ymax>1761</ymax>
  38. </bndbox>
  39. </item>
  40. </object>
  41. </outputs>
  42. <time_labeled>1695689802263</time_labeled>
  43. <labeled>true</labeled>
  44. <size>
  45. <width>1000</width>
  46. <height>1778</height>
  47. <depth>3</depth>
  48. </size>
  49. </doc>
  1. <!-- 曲形框/锚点采集 -->
  2. <?xml version="1.0" ?>
  3. <doc>
  4. <path>D:\yyqh\DataSet\set1\data (4).jpeg</path>
  5. <outputs>
  6. <object>
  7. <item>
  8. <name>柠檬</name>
  9. <cubic_bezier>
  10. <x57>25</x57>
  11. <y57>505</y57>
  12. <x57_c1>25</x57_c1>
  13. <y57_c1>505</y57_c1>
  14. <x57_c2>25</x57_c2>
  15. <y57_c2>505</y57_c2>
  16. <!-- 这一部分是比较复杂的坐标,所以省略 -->
  17. <x1>25</x1>
  18. <y1>505</y1>
  19. <x1_c1>25</x1_c1>
  20. <y1_c1>505</y1_c1>
  21. <x1_c2>25</x1_c2>
  22. <y1_c2>505</y1_c2>
  23. </cubic_bezier>
  24. </item>
  25. </object>
  26. </outputs>
  27. <time_labeled>1695690362440</time_labeled>
  28. <labeled>true</labeled>
  29. <size>
  30. <width>1080</width>
  31. <height>757</height>
  32. <depth>3</depth>
  33. </size>
  34. </doc>

# 不能直接选全图嘛

pascal-voc

目标检测数据集

csdn:PASCAL VOC数据集简介

MonogoDB

基于分布式文件存储的数据库。由C++语言编写。

csdn:MongoDB详解,用心看这篇就够了【重点】

数据库交互、网络共享

vb # 被淘汰?但某方面实用

python # 不热门了

虚拟仿真 # 研究不了

数据结构、栈

数据标注众包平台——数加加

数加加-数据堂旗下众包平台:海量的数据采集和标注任务 (shujiajia.com)

github

GitHub: Let’s build from here · GitHub

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/363390
推荐阅读
相关标签
  

闽ICP备14008679号