赞
踩
目标:提取位于视频下方的字幕
机缘:某些要写报告的学习视频太长了orz,弄字幕来参考一下
难点:
基本策略:
具体代码如下:
1. 定义调用百度开放平台OCR的函数
百度官方的ocr可以选择返回带位置和不带位置的文字识别,所以这里定义两个函数,location_ocr 返回位置,baidu_ocr返回识别出的文字
没有用过百度ocr的朋友需要去申请API Key和API Secret,然后飞桨平台上也有很多关于字幕识别的项目
- # --coding: utf-8 --
-
- import math
- import os
- from cv2 import cv2
- import requests
- import base64
-
-
- # 确定字幕位置
- def location_ocr(img):
- '''
- 构建请求url,获取Access Token,必须参数如下:
- grant_type: 必须参数,固定为client_credentials;
- client_id: 必须参数,应用的API Key;
- client_secret: 必须参数,应用的Secret Key;
- '''
- host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=' \
- + 'API Key' + '&client_secret=' + 'Secret Key'
-
- headers = {
- 'Content-Type': 'application/json;charset=UTF-8'
- }
- # 获取token
- res = requests.get(url=host, headers=headers).json()
- url = 'https://aip.baidubce.com/rest/2.0/ocr/v1/accurate'
- data = {}
- da
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。