当前位置:   article > 正文

ijkplayer基于rtsp直播延时的深度优化_ijkplayer 直播

ijkplayer 直播

现在ijkPlayer是许多播放器、直播平台的首选,相信很多开发者都接触过ijkPlayer,无论是Android工程师还是iOS工程师。我曾经在Github上的ijkPlayer开源项目上提问过:视频流为1080P、30fps,如何优化RTSP直播的延时为大约100ms呢?发现大家对RTSP直播延时优化非常感兴趣,纷纷提问或者给出自己的观点。本文主要是总结,也是与大家探讨RTSP直播的延时优化。

 

目录

一、修改编译脚本支持RTSP

二、修改播放器的option参数

三、网络抖动的丢包

四、解码器设为零延时

五、减少FFmpeg拆帧等待延时

1、找到当前帧结束符

2、去掉parse_packet的while循环

3、 修改av_parser_parse2的帧偏移量

 4、去掉parser_parse的寻找帧起始码

5、修改parser.c的组帧方法


一、修改编译脚本支持RTSP

ijkPlayer默认是没有把RTSP协议编译进去,所以我们得修改编译脚本,原来的disable改为enable:

  1. export COMMON_FF_CFG_FLAGS="$COMMON_FF_CFG_FLAGS --enable-protocol=rtp"
  2. export COMMON_FF_CFG_FLAGS="$COMMON_FF_CFG_FLAGS --enable-protocol=tcp"
  3. export COMMON_FF_CFG_FLAGS="$COMMON_FF_CFG_FLAGS --enable-demuxer=rtsp"
  4. export COMMON_FF_CFG_FLAGS="$COMMON_FF_CFG_FLAGS --enable-demuxer=sdp"
  5. export COMMON_FF_CFG_FLAGS="$COMMON_FF_CFG_FLAGS --enable-demuxer=rtp"

二、修改播放器的option参数

  1. //丢帧阈值
  2. mediaPlayer.setOption(IjkMediaPlayer.OPT_CATEGORY_PLAYER, "framedrop", 30);
  3. //视频帧率
  4. mediaPlayer.setOption(IjkMediaPlayer.OPT_CATEGORY_PLAYER, "fps", 30);
  5. //环路滤波
  6. mediaPlayer.setOption(IjkMediaPlayer.OPT_CATEGORY_CODEC, "skip_loop_filter", 48);
  7. //设置无packet缓存
  8. mediaPlayer.setOption(IjkMediaPlayer.OPT_CATEGORY_PLAYER, "packet-buffering", 0);
  9. mediaPlayer.setOption(IjkMediaPlayer.OPT_CATEGORY_FORMAT, "fflags", "nobuffer");
  10. //不限制拉流缓存大小
  11. mediaPlayer.setOption(IjkMediaPlayer.OPT_CATEGORY_PLAYER, "infbuf", 1);
  12. //设置最大缓存数量
  13. mediaPlayer.setOption(IjkMediaPlayer.OPT_CATEGORY_FORMAT, "max-buffer-size", 1024);
  14. //设置最小解码帧数
  15. mediaPlayer.setOption(IjkMediaPlayer.OPT_CATEGORY_PLAYER, "min-frames", 3);
  16. //启动预加载
  17. mediaPlayer.setOption(IjkMediaPlayer.OPT_CATEGORY_PLAYER, "start-on-prepared", 1);
  18. //设置探测包数量
  19. mediaPlayer.setOption(IjkMediaPlayer.OPT_CATEGORY_FORMAT, "probsize", "4096");
  20. //设置分析流时长
  21. mediaPlayer.setOption(IjkMediaPlayer.OPT_CATEGORY_FORMAT, "analyzeduration", "2000000");

值得注意的是,ijkPlayer默认使用udp拉流,因为速度比较快。如果需要可靠且减少丢包,可以改为tcp协议:

mediaPlayer.setOption(IjkMediaPlayer.OPT_CATEGORY_FORMAT, "rtsp_transport", "tcp");

另外,可以这样开启硬解码,如果打开硬解码失败,再自动切换到软解码:

  1. mediaPlayer.setOption(IjkMediaPlayer.OPT_CATEGORY_PLAYER, "mediacodec", 0);
  2. mediaPlayer.setOption(IjkMediaPlayer.OPT_CATEGORY_PLAYER, "mediacodec-auto-rotate", 0);
  3. mediaPlayer.setOption(IjkMediaPlayer.OPT_CATEGORY_PLAYER, "mediacodec-handle-resolution-change", 0);

三、网络抖动的丢包

在拉流时,音频流、视频流是单独保存到缓冲队列的。如果发生网络抖动,就会引起缓冲抖动(JitBuffer),可以总结为网络卡顿导致音视频缓冲队列增大,从而导致解码滞后、播放滞后。此时,我们需要主动丢包来跟进当前时间戳。因为音视频同步一般以音频时钟为基准,人们对音频更加敏感,所以我们优先丢掉视频队列的包。但是,丢视频数据包时,需要丢掉整个GOP的数据包,因为B帧、P帧依赖I帧来解码,否则会引起花屏。有一位开发者叫做暴走大牙,他的一篇关于ijkPlayer直播延时的文章写得很好:ijkplay播放直播流延时控制小结

四、解码器设为零延时

大家应该听过编码器的零延时(zerolatency),但可能没听过解码器零延时。其实解码器内部默认会缓存几帧数据,用于后续关联帧的解码,大概是3-5帧。经过反复测试,发现解码器的缓存帧会带来100多ms延时。也就是说,假如能够去掉缓存帧,就可以减少100多ms的延时。而在avcodec.h文件的AVCodecContext结构体有一个参数(flags)用来设置解码器延时:

  1. typedef struct AVCodecContext {
  2. ......
  3. int flags;
  4. ......
  5. }

为了去掉解码器缓存帧,我们可以把flags设置为CODEC_FLAG_LOW_DELAY。在初始化解码器时进行设置:

  1. //set decoder as low deday
  2. codec_ctx->flags |= CODEC_FLAG_LOW_DELAY;

五、减少FFmpeg拆帧等待延时

FFmpeg拆帧是根据下一帧的起始码来作为当前帧结束符,起始码一般是:0x00 0x00 0x00 0x01或者0x00 0x00 0x01。这样就会带来一帧的延时,这一帧延时能不能去掉呢?如果有帧结束符,我们以帧结束符来拆帧,这样做就能解决一帧延时。现在,问题变成找到帧结束符,然后替换成下一帧起始码来拆帧。整个调用流程是:read_frame—>read_frame_internal—>parse_packet—>av_parser_parse2—>parser_parse—>ff_combine_frame. 流程图如下:

1、找到当前帧结束符

在rtpdec.c文件的rtp_parse_packet_internal方法里,有获取帧结束符,也就是mark标志位,我们在这里设一个全局变量:

  1. static int rtp_parse_packet_internal(RTPDemuxContext *s, AVPacket *pkt,
  2. const uint8_t *buf, int len)
  3. {
  4. ......
  5. if (buf[1] & 0x80)
  6. flags |= RTP_FLAG_MARKER;
  7. //the end of a frame
  8. mark_flag = flags;
  9. ......
  10. }

2、去掉parse_packet的while循环

我们在外部调用libavformat模块的utils.c文件的read_frame读取一帧数据,而read_frame调用内部方法read_frame_internal,read_frame_internal接着调用parse_packet方法,在该方法里有一个while循环体。现在把循环体去掉,并且释放申请的内存:

  1. static int parse_packet(AVFormatContext *s, AVPacket *pkt, int stream_index)
  2. {
  3. ......
  4. // while (size > 0 || (pkt == &flush_pkt && got_output)) {
  5. int len;
  6. int64_t next_pts = pkt->pts;
  7. int64_t next_dts = pkt->dts;
  8. av_init_packet(&out_pkt);
  9. len = av_parser_parse2(st->parser, st->internal->avctx,
  10. &out_pkt.data, &out_pkt.size, data, size,
  11. pkt->pts, pkt->dts, pkt->pos);
  12. pkt->pts = pkt->dts = AV_NOPTS_VALUE;
  13. pkt->pos = -1;
  14. /* increment read pointer */
  15. data += len;
  16. size -= len;
  17. got_output = !!out_pkt.size;
  18. if (!out_pkt.size){
  19. av_packet_unref(&out_pkt);//release current packet
  20. av_packet_unref(pkt);//release current packet
  21. return 0;
  22. // continue;
  23. }
  24. ......
  25. ret = add_to_pktbuf(&s->internal->parse_queue, &out_pkt,
  26. &s->internal->parse_queue_end, 1);
  27. av_packet_unref(&out_pkt);
  28. if (ret < 0)
  29. goto fail;
  30. // }
  31. /* end of the stream => close and free the parser */
  32. if (pkt == &flush_pkt) {
  33. av_parser_close(st->parser);
  34. st->parser = NULL;
  35. }
  36. fail:
  37. av_packet_unref(pkt);
  38. return ret;
  39. }

3、 修改av_parser_parse2的帧偏移量

在libavcodec模块的parser.c文件中,parse_packet调用到av_parser_parse2来解释数据包,该方法内部有记录帧偏移量。原先是等待下一帧的起始码,现在改为当前帧结束符,所以要把下一帧起始码这个偏移量长度去掉:

  1. int av_parser_parse2(AVCodecParserContext *s, AVCodecContext *avctx,
  2. uint8_t **poutbuf, int *poutbuf_size,
  3. const uint8_t *buf, int buf_size,
  4. int64_t pts, int64_t dts, int64_t pos)
  5. {
  6. ......
  7. /* WARNING: the returned index can be negative */
  8. index = s->parser->parser_parse(s, avctx, (const uint8_t **) poutbuf,
  9. poutbuf_size, buf, buf_size);
  10. av_assert0(index > -0x20000000); // The API does not allow returning AVERROR codes
  11. #define FILL(name) if(s->name > 0 && avctx->name <= 0) avctx->name = s->name
  12. if (avctx->codec_type == AVMEDIA_TYPE_VIDEO) {
  13. FILL(field_order);
  14. }
  15. /* update the file pointer */
  16. if (*poutbuf_size) {
  17. /* fill the data for the current frame */
  18. s->frame_offset = s->next_frame_offset;
  19. /* offset of the next frame */
  20. // s->next_frame_offset = s->cur_offset + index;
  21. //video frame don't plus index
  22. if (avctx->codec_type == AVMEDIA_TYPE_VIDEO) {
  23. s->next_frame_offset = s->cur_offset;
  24. }else{
  25. s->next_frame_offset = s->cur_offset + index;
  26. }
  27. s->fetch_timestamp = 1;
  28. }
  29. if (index < 0)
  30. index = 0;
  31. s->cur_offset += index;
  32. return index;
  33. }

 4、去掉parser_parse的寻找帧起始码

av_parser_parse2调用到parser_parse方法,而我们这里使用的是h264解码,所以在libavcodec模块的h264_parser.c有一个结构体ff_h264_parser,把h264_parse赋值给parser_parse:

  1. AVCodecParser ff_h264_parser = {
  2. .codec_ids = { AV_CODEC_ID_H264 },
  3. .priv_data_size = sizeof(H264ParseContext),
  4. .parser_init = init,
  5. .parser_parse = h264_parse,
  6. .parser_close = h264_close,
  7. .split = h264_split,
  8. };

现在我们需要h264_parser.c文件的h264_parse方法,去掉寻找下一帧起始码作为当前帧结束符的过程:

  1. static int h264_parse(AVCodecParserContext *s,
  2. AVCodecContext *avctx,
  3. const uint8_t **poutbuf, int *poutbuf_size,
  4. const uint8_t *buf, int buf_size)
  5. {
  6. ......
  7. if (s->flags & PARSER_FLAG_COMPLETE_FRAMES) {
  8. next = buf_size;
  9. } else {
  10. //TODO:don't use next frame start code, modify by xufulong
  11. // next = h264_find_frame_end(p, buf, buf_size, avctx);
  12. if (ff_combine_frame(pc, next, &buf, &buf_size) < 0) {
  13. *poutbuf = NULL;
  14. *poutbuf_size = 0;
  15. return buf_size;
  16. }
  17. /* if (next < 0 && next != END_NOT_FOUND) {
  18. av_assert1(pc->last_index + next >= 0);
  19. h264_find_frame_end(p, &pc->buffer[pc->last_index + next], -next, avctx); // update state
  20. }*/
  21. }
  22. ......
  23. }

5、修改parser.c的组帧方法

h264_parse又调用parser.c的ff_combine_frame组帧方法,我们在这里把mark替换起始码作为帧结束符:

  1. external int mark_flag;//引用全局变量
  2. int ff_combine_frame(ParseContext *pc, int next,const uint8_t **buf, int *buf_size)
  3. {
  4. ......
  5. /* copy into buffer end return */
  6. // if (next == END_NOT_FOUND) {
  7. void *new_buffer = av_fast_realloc(pc->buffer, &pc->buffer_size,
  8. *buf_size + pc->index +
  9. AV_INPUT_BUFFER_PADDING_SIZE);
  10. if (!new_buffer) {
  11. pc->index = 0;
  12. return AVERROR(ENOMEM);
  13. }
  14. pc->buffer = new_buffer;
  15. memcpy(&pc->buffer[pc->index], *buf, *buf_size);
  16. pc->index += *buf_size;
  17. // return -1;
  18. if(!mark_flag)
  19. return -1;
  20. next = 0;
  21. // }
  22. ......
  23. }

经过以上修改,局域网用电脑推送1080P、30fps的视频流,Android设备拉流解码播放,整体延时可优化至130ms左右。而手机推流,延时可达到86ms。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Li_阴宅/article/detail/852605
推荐阅读
相关标签
  

闽ICP备14008679号