当前位置:   article > 正文

FFmpeg视频解码流程详解及demo_ffmpeg av_find_best_stream

ffmpeg av_find_best_stream









  1. struct AVInputFormat *iformat;//输入数据的封装格式。仅解封装用,由avformat_open_input()设置。
  2. struct AVOutputFormat *oformat;//输出数据的封装格式。仅封装用,调用者在avformat_write_header()之前设置。
  3. AVIOContext *pb;// I/O上下文。
  4. 解封装:由用户在avformat_open_input()之前设置(然后用户必须手动关闭它)或通过avformat_open_input()设置。
  5. 封装:由用户在avformat_write_header()之前设置。 调用者必须注意关闭/释放IO上下文。
  6. unsigned int nb_streams;//AVFormatContext.streams中元素的个数。
  7. AVStream **streams;//文件中所有流的列表。char filename[1024];//输入输出文件名。
  8. int64_t start_time;//第一帧的位置。
  9. int64_t duration;//流的持续时间
  10. int64_t bit_rate;//总流比特率(bit / s),如果不可用则为0。
  11. int64_t probesize;
  12. //从输入读取的用于确定输入容器格式的数据的最大大小。
  13. 仅封装用,由调用者在avformat_open_input()之前设置。
  14. AVDictionary *metadata;//元数据
  15. AVCodec *video_codec;//视频编解码器
  16. AVCodec *audio_codec;//音频编解码器
  17. AVCodec *subtitle_codec;//字母编解码器
  18. AVCodec *data_codec;//数据编解码器
  19. int (*io_open)(struct AVFormatContext *s, AVIOContext **pb, const char *url, int flags, AVDictionary **options);
  20. //打开IO stream的回调函数。
  21. void (*io_close)(struct AVFormatContext *s, AVIOContext *pb);
  22. //关闭使用AVFormatContext.io_open()打开的流的回调函数。


  1. //1、方法一
  2. AVFormatContext *fmt_ctx = NULL;
  3. string filename = "test.avi" ;
  4. fmt_ctx = avformat_alloc_context();
  5. avformat_open_input(&fmt_ctx, ilename.c_str(), NULL, NULL);
  6. avformat_close_input(&fmt_ctx);
  7. //2、方法二
  8. AVFormatContext *fmt_ctx = NULL;
  9. string filename = "test.avi" ;
  10. int ret = avformat_open_input(&fmt_ctx, filename.c_str(), NULL, NULL);
  11. avformat_close_input(&fmt_ctx);





  1. //解码H264流
  2. AVCodec* Vcodec = NULL;
  3. Vcodec = avcodec_find_decoder(AV_CODEC_ID_H264);
  4. //或者直接通过解码器名字找到解码器
  5. Vcodec = avcodec_find_decoder_by_name("h264_mediacodec");




  1. enum AVMediaType codec_type:编解码器的类型(视频,音频...)
  2. struct AVCodec *codec:采用的解码器AVCodec(H.264,MPEG2...)
  3. int bit_rate:平均比特率
  4. uint8_t *extradata; int extradata_size:针对特定编码器包含的附加信息(例如对于H.264解码器来说,存储SPS,PPS等)
  5. AVRational time_base:根据该参数,可以把PTS转化为实际的时间(单位为秒s)
  6. int width, height:如果是视频的话,代表宽和高
  7. int refs:运动估计参考帧的个数(H.264的话会有多帧,MPEG2这类的一般就没有了)
  8. int sample_rate:采样率(音频)
  9. int channels:声道数(音频)
  10. enum AVSampleFormat sample_fmt:采样格式
  11. int profile:型(H.264里面就有,其他编码标准应该也有)
  12. int level:级(和profile差不太多)


  1. AVCodec* Vcodec = NULL;
  2. Vcodec = avcodec_find_decoder(AV_CODEC_ID_H264);
  3. AVCodecContext* AvContext = NULL;
  4. AvContext = avcodec_alloc_context3(mVcodec);
  5. avcodec_parameters_to_context(mAvContext,
  6. fmt_ctx->streams[mVideoStreamIdx]->codecpar);





  1. index/id:index对应流的索引,这个数字是自动生成的,根据index可以从AVFormatContext::streams表中索引到该流;而id则是流的标识,依赖于具体的容器格式。比如对于MPEG TS格式,id就是pid。
  2. time_base:流的时间基准,是一个实数,该流中媒体数据的pts和dts都将以这个时间基准为粒度。通常,使用av_rescale/av_rescale_q可以实现不同时间基准的转换。
  3. start_time:流的起始时间,以流的时间基准为单位,通常是该流中第一个帧的pts。
  4. duration:流的总时间,以流的时间基准为单位。
  5. need_parsing:对该流parsing过程的控制域。
  6. nb_frames:流内的帧数目。
  7. avg_frame_rate:帧率相关。
  8. codec:指向该流对应的AVCodecContext结构,调用avformat_open_input时生成。
  9. parser:指向该流对应的AVCodecParserContext结构,调用av_find_stream_info时生成。




  1. unsigned char *buffer:缓存开始位置
  2. int buffer_size:缓存大小(默认32768)
  3. unsigned char *buf_ptr:当前指针读取到的位置
  4. unsigned char *buf_end:缓存结束的位置
  5. void *opaque:URLContext结构体






  1. uint8_t *data:压缩编码的数据。
  2. //例如对于H.264来说。1个AVPacket的data通常对应一个NAL。
  3. 注意:在这里只是对应,而不是一模一样。他们之间有微小的差别:使用FFMPEG类库分离出多媒体文件中的H.264码流.因此在使用FFMPEG进行视音频处理的时候,常常可以将得到的AVPacket的data数据直接写成文件,从而得到视音频的码流文件。
  4. int size:data的大小
  5. int64_t pts:显示时间戳
  6. int64_t dts:解码时间戳
  7. int stream_index:标识该AVPacket所属的视频/音频流。

        av_new_packet, av_packet_alloc, av_init_packet, av_packet_unref,av_packet_free(free这个API为旧接口)





  1. uint8_t *data[AV_NUM_DATA_POINTERS]:解码后原始数据(对视频来说是YUV,RGB,对音频来说是PCM)
  2. int linesize[AV_NUM_DATA_POINTERS]:data中“一行”数据的大小。注意:未必等于图像的宽,一般大于图像的宽。
  3. int width, height:视频帧宽和高(1920x1080,1280x720…)
  4. int nb_samples:音频的一个AVFrame中可能包含多个音频帧,在此标记包含了几个
  5. int format:解码后原始数据类型(YUV420,YUV422,RGB24…)
  6. int key_frame:是否是关键帧
  7. enum AVPictureType pict_type:帧类型(I,B,P…)
  8. AVRational sample_aspect_ratio:宽高比(16:9,4:3…)
  9. int64_t pts:显示时间戳
  10. int coded_picture_number:编码帧序号
  11. int display_picture_number:显示帧序号
  12. int interlaced_frame:是否是隔行扫描
  13. uint8_t motion_subsample_log2:一个宏块中的运动矢量采样个数,取log






  1. //注册各大组件
  2. av_register_all();




  1. AVFormatContext *avFormatContext = avformat_alloc_context(); //获取上下文
  2. //打开视频地址并获取里面的内容(解封装)
  3. if (avformat_open_input(&avFormatContext, inputPath, NULL, NULL) < 0) {
  4. LOGE("打开视频失败")
  5. return;
  6. }
  7. if (avformat_find_stream_info(avFormatContext, NULL) < 0) {
  8. LOGE("获取内容失败")
  9. return;
  10. }



  1. //获取视频的编码信息
  2. AVCodecParameters *origin_par = NULL;
  3. int mVideoStreamIdx = -1;
  4. mVideoStreamIdx = av_find_best_stream(avFormatContext, AVMEDIA_TYPE_VIDEO, -1, -1, NULL, 0);
  5. if (mVideoStreamIdx < 0) {
  6. av_log(NULL, AV_LOG_ERROR, "Can't find video stream in input file\n");
  7. return;
  8. }
  9. LOGE("成功找到视频流")



  1. // 寻找解码器 {start
  2. AVCodec *mVcodec = NULL;
  3. AVCodecContext *mAvContext = NULL;
  4. mVcodec = avcodec_find_decoder(origin_par->codec_id);
  5. mAvContext = avcodec_alloc_context3(mVcodec);
  6. if (!mVcodec || !mAvContext) {
  7. return;
  8. }
  9. //不初始化解码器context会导致MP4封装的mpeg4码流解码失败
  10. int ret = avcodec_parameters_to_context(mAvContext, origin_par);
  11. if (ret < 0) {
  12. av_log(NULL, AV_LOG_ERROR, "Error initializing the decoder context.\n");
  13. }
  14. // 打开解码器
  15. if (avcodec_open2(mAvContext, mVcodec, NULL) != 0){
  16. LOGE("打开失败")
  17. return;
  18. }
  19. LOGE("解码器打开成功")
  20. // 寻找解码器 end}



  1. //申请AVPacket
  2. AVPacket *packet = (AVPacket *) av_malloc(sizeof(AVPacket));
  3. av_init_packet(packet);
  4. //申请AVFrame
  5. AVFrame *frame = av_frame_alloc();//分配一个AVFrame结构体,AVFrame结构体一般用于存储原始数据,指向解码后的原始帧



  1. uint8_t *byte_buffer = NULL;
  2. int byte_buffer_size = av_image_get_buffer_size(mAvContext->pix_fmt, mAvContext->width, mAvContext->height, 32);
  3. LOGE("width = %d , height = %d ",mAvContext->width, mAvContext->height);
  4. byte_buffer = (uint8_t*)av_malloc(byte_buffer_size);
  5. if (!byte_buffer) {
  6. av_log(NULL, AV_LOG_ERROR, "Can't allocate buffer\n");
  7. return AVERROR(ENOMEM);
  8. }



  1. // 发送待解码包
  2. int result = avcodec_send_packet(mAvContext, packet);
  3. av_packet_unref(packet);
  4. if (result < 0) {
  5. av_log(NULL, AV_LOG_ERROR, "Error submitting a packet for decoding\n");
  6. continue;
  7. }
  8. // 接收解码数据
  9. while (result >= 0) {
  10. result = avcodec_receive_frame(mAvContext, frame);
  11. if (result == AVERROR_EOF)
  12. break;
  13. else if (result == AVERROR(EAGAIN)) {
  14. result = 0;
  15. break;
  16. } else if (result < 0) {
  17. av_log(NULL, AV_LOG_ERROR, "Error decoding frame\n");
  18. av_frame_unref(frame);
  19. break;
  20. }
  21. av_frame_unref(frame);
  22. }



  1. while(1)
  2. {
  3. int ret = av_read_frame(avFormatContext, packet);
  4. if (ret != 0){
  5. av_strerror(ret,buf,sizeof(buf));
  6. LOGE("--%s--\n",buf);
  7. av_packet_unref(packet);
  8. break;
  9. }
  10. if (ret >= 0 && packet->stream_index != mVideoStreamIdx) {
  11. av_packet_unref(packet);
  12. continue;
  13. }
  14. {
  15. // 发送待解码包
  16. int result = avcodec_send_packet(mAvContext, packet);
  17. av_packet_unref(packet);
  18. if (result < 0) {
  19. av_log(NULL, AV_LOG_ERROR, "Error submitting a packet for decoding\n");
  20. continue;
  21. }
  22. // 接收解码数据
  23. while (result >= 0){
  24. result = avcodec_receive_frame(mAvContext, frame);
  25. if (result == AVERROR_EOF)
  26. break;
  27. else if (result == AVERROR(EAGAIN)) {
  28. result = 0;
  29. break;
  30. } else if (result < 0) {
  31. av_log(NULL, AV_LOG_ERROR, "Error decoding frame\n");
  32. av_frame_unref(frame);
  33. break;
  34. }
  35. int number_of_written_bytes = av_image_copy_to_buffer(byte_buffer, byte_buffer_size,
  36. (const uint8_t* const *)frame->data, (const int*) frame->linesize,
  37. mAvContext->pix_fmt, mAvContext->width, mAvContext->height, 1);
  38. if (number_of_written_bytes < 0) {
  39. av_log(NULL, AV_LOG_ERROR, "Can't copy image to buffer\n");
  40. av_frame_unref(frame);
  41. continue;
  42. }
  43. // 写文件保存视频数据
  44. fwrite(byte_buffer, number_of_written_bytes, 1, fp_YUV);
  45. fflush(fp_YUV);
  46. av_frame_unref(frame);
  47. }
  48. }
  49. }



  1. //释放
  2. fclose(fp_YUV);
  3. av_frame_free(&frame);
  4. avcodec_close(mAvContext);
  5. avformat_free_context(avFormatContext);




  1. @Override
  2. public void onClick(View view) {
  3. runOnUiThread(new Runnable() {
  4. @Override
  5. public void run() {
  6. String PATH = Environment.getExternalStorageDirectory().getPath();
  7. //视频解码
  8. String input = PATH + File.separator + "input.mp4";
  9. String output = PATH + File.separator + "videoDecodeOut.yuv";
  10. decode_test(input,1,output);
  11. }
  12. });
  13. }


         界面比较随意,就没有过多设计,点击"START DECODE"按钮,开始对视频文件进行解码,界面不会有什么提示,等解码完成后会弹出提示词 "解码完成,请自行从手机中拉取yuv文件"



         当有--End of file--打印出来说明已经解码完成,另外这里有个重要的信息就是width和height,若你不知道原视频的分辨率,可以从这里获取,用于待会的yuv分析需要。














