当前位置:   article > 正文

利用百度文字识别API获取视频图片上的文字信息_视频内容识别 api

视频内容识别 api

背景描述:

    在对监控录像进行分析时,希望直接获取到视频上面的时间信息,以视频上的时间戳对关心的帧命名等,本文通过调用百度文字识别API获取到图片上的文字信息(主要是时间+地点)。

主要步骤:

    1. 前往百度API中心申请自己的Api Key 和 Secret Key;

    2.  获取自己的 Access token;

    3. 调用API进行文字识别,目前通用文字识别可免费试用,每天限调用5W次。

获取Access token

  1. import base64
  2. import requests
  3. API_KEY = "FuwbiOjQ2UkOuDZhsj****" # 自己去申请
  4. SECRET_KEY = "xhq07lmabjNvQ028rCGpjRDFbitF****" # 自己去申请
  5. API_URL = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic"
  6. def get_access_token():
  7. host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&' \
  8. 'client_id=FuwbiOjQ2UkOuDZhsj****&client_secret=xhq07lmabjNvQ028rCGpjRDFbitF***'
  9. # 将client_id 和 client_secret替换自己的值
  10. headers = {'Content-Type': 'application/json; charset=UTF-8'}
  11. res = requests.get(url=host, headers=headers).json()
  12. access_token = res["access_token"]
  13. print(access_token)
  14. return access_token

调用API获得结果

  1. """
  2. 利用百度的OCR API 提取视频画面上的时间
  3. """
  4. import base64
  5. import requests
  6. API_KEY = "FuwbiOjQ2UkOuDZhsjg***"
  7. SECRET_KEY = "xhq07lmabjNvQ028rCGpjRDFbit**"
  8. API_URL = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic"
  9. def get_access_token():
  10. host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&' \
  11. 'client_id=FuwbiOjQ2UkOuDZhsjg***&client_secret=xhq07lmabjNvQ028rCGpjRDFbi**'
  12. headers = {'Content-Type': 'application/json; charset=UTF-8'}
  13. res = requests.get(url=host, headers=headers).json()
  14. access_token = res["access_token"]
  15. print(access_token)
  16. return access_token
  17. def text_extract(img_path, access_token):
  18. data = {}
  19. data["access_token"] = access_token
  20. data["image"] = base64.b64encode(open(img_path, "rb").read())
  21. headers = {"Content-Type": "application/x-www-form-urlencoded"}
  22. res = requests.post(url=API_URL, headers=headers, data=data)
  23. result = res.json()
  24. img_show_time = result["words_result"][0]["words"]
  25. return img_show_time
  26. if __name__ == "__main__":
  27. img_path = "./4.jpg"
  28. access_token = get_access_token()
  29. time_on_image = text_extract(img_path=img_path, access_token=access_token)

结果展示

  1. # 返回结果
  2. {'log_id': 7056746947134263375, 'words_result_num': 2,
  3. 'words_result': [{'words': '2019-06-1309:39:35'},
  4. {'words': '****墩处桥面灯杆5m处)'}]}
 
 

 

 

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/271852
推荐阅读
相关标签
  

闽ICP备14008679号