最近学习FFmpeg编程开发,想写个视频添加水印图片的demo(未对音频或字幕进行处理),代码编写中遇见很多问题,在这里进行做一个笔记来,易于自己记忆和理解。期间在网上找demo,发现很多都是ffmpeg3版本的一些demo,ffmpeg4有很大的改变,有很多方法不适用,因此写篇文章给初学者一些细微的帮助,也易于自己巩固,避免犯类似的错误。
一、总结一下编码过程:
1.初始化化封装格式上下文 并打开文件
avformat_alloc_context / avformat_alloc_output_context2
2.创建输出码流
avformat_new_stream
3.创建编码器(根据输入编码类型)
avcodec_find_encoder
4.创建视频编码器上下文 并设置参数
avcodec_alloc_context3
5.打开编码器
avcodec_open2
6.把编码器信息写入流中
avcodec_parameters_from_context
7.创建并初始化一个AVIOContext,用以访问URL(out_filename)指定的资源
avio_open
8.写入头文件信息
avformat_write_header
9.初始化过滤器 并过滤
init_filter av_buffersrc_add_frame_flags av_frame_make_writable
10.将编码后的视频压缩数据写入文件中
①设置帧类型②发送过滤的frame,接收packet③更新编码帧中流序号,并进行时间基转换④压缩数据写入文件中
11.写入文件尾部信息
av_write_trailer
12.释放资源
二、代码片段
1.输入文件的解码以及编码
int FfmpegTest::open_input_file(const char *filename)
{
int ret;
// 1. 打开视频文件:读取文件头,将文件格式信息存储在ifmt_ctx中
if ((ret = avformat_open_input(&ifmt_ctx, filename, NULL, NULL)) < 0)
{
av_log(NULL, AV_LOG_ERROR, "Cannot open input file\n");
return ret;
}
// 2. 搜索流信息:读取一段视频文件数据,尝试解码,将取到的流信息填入ifmt_ctx.streams
// ifmt_ctx.streams是一个指针数组,数组大小是ifmt_ctx.nb_streams
if ((ret = avformat_find_stream_info(ifmt_ctx, NULL)) < 0)
{
av_log(NULL, AV_LOG_ERROR, "Cannot find stream information\n");
return ret;
}
// 每路音频流/视频流一个AVCodecContext
ret = av_find_best_stream(ifmt_ctx, AVMEDIA_TYPE_VIDEO, -1, -1, &codec, 0);
if (ret < 0)
{
cout << "no find best stream";
return -1;
}
videoindex = ret;
codec_ctx = avcodec_alloc_context3(codec);
if (!codec_ctx)
{
av_log(NULL, AV_LOG_ERROR, "Failed to allocate the decoder context for stream #%u\n");
return AVERROR(ENOMEM);
}
// 3.3 AVCodecContext初始化:使用codec参数codecpar初始化AVCodecContext相应成员
ret = avcodec_parameters_to_context(codec_ctx, ifmt_ctx->streams[videoindex]->codecpar);
if (ret < 0)
{
return ret;
}
ret = avcodec_open2(codec_ctx, codec, NULL);
if (ret < 0) {
av_log(NULL, AV_LOG_ERROR, "Failed to open decoder for stream #%u\n", ret);
return ret;
}
av_dump_format(ifmt_ctx, 0, filename, 0);
if (!init_filter(codec_ctx))
return -1;
if (open_output_file("uuu.mp4") < 0)
return -1;
AVPacket *packet;
packet = (AVPacket*)av_malloc(sizeof(AVPacket));
AVPacket *outpacket=nullptr;
outpacket = (AVPacket*)av_malloc(sizeof(AVPacket));
AVFrame *frame;
frame = av_frame_alloc();
AVFrame *outframe;
outframe = av_frame_alloc();
bool write_status = true;
AVBufferRef *bufferRef;
while (av_read_frame(ifmt_ctx, packet) >= 0)
{
//时间基转换,解码
av_packet_rescale_ts(packet, ifmt_ctx->streams[videoindex]->time_base, encode_ctx->time_base);
if (packet->stream_index == videoindex)
{
ret = avcodec_send_packet(codec_ctx, packet);
if (ret < 0)
{
cout << "avcodec_send_packet" << endl;
break;
}
while (ret >= 0)
{
ret = avcodec_receive_frame(codec_ctx, frame);
if (ret == AVERROR(EINVAL))
{
cout << "codec not opened, or it is an encoder" << endl;
goto end;
}
else if (ret == AVERROR(EAGAIN))
{
cout << "user must try to send new input" << endl;
continue;
}
else if (ret == AVERROR_EOF)
{
cout << "the decoder has been fully flushed" << endl;
break;
}
else if (ret >= 0)
{
frame->pts = frame->best_effort_timestamp;
//push the decoded frame into the filtergrapth
if (av_buffersrc_add_frame_flags(bufsrc_ctx, frame, AV_BUFFERSRC_FLAG_KEEP_REF) < 0)
{
cout << "Error while feeding the filtergraph" << endl;
break;
}
//pull filtered frames from the filtergraph
while (1)
{
ret = av_buffersink_get_frame(bufsink_ctx, outframe);
if (ret == AVERROR_EOF || ret == AVERROR(EAGAIN))
break;
if (ret < 0)
goto end;
if (!outframe || !encode_ctx)
break;
if (av_frame_make_writable(outframe) < 0)
{
cout << "av_frame_make_writable NO!" << endl;
break;
}
// 设置帧类型
outframe->pict_type = AV_PICTURE_TYPE_NONE;
//10.将编码后的视频压缩数据写入文件中
while (1)
{
write_status = true;
ret = avcodec_send_frame(encode_ctx, outframe);
if (ret < 0)
{
cout << "avcodec_send_frame failed!" << endl;
goto end;
}
ret = avcodec_receive_packet(encode_ctx, outpacket);
if (ret == AVERROR_EOF || ret == AVERROR(EINVAL))
{
break;
}
else if(ret == AVERROR(EAGAIN))
{
continue;
}
else if (ret >= 0)
{
// 3.3 更新编码帧中流序号,并进行时间基转换
// AVPacket.pts和AVPacket.dts的单位是AVStream.time_base,不同的封装格式其AVStream.time_base不同
// 所以输出文件中,每个packet需要根据输出封装格式重新计算pts和dts
outpacket->stream_index = videoindex;
AVRational dst = { 1,25 };
av_packet_rescale_ts(outpacket, encode_ctx->time_base, ofm_ctx->streams[0]->time_base);
//将编码后的packet写入输出媒体文件
ret = av_interleaved_write_frame(ofm_ctx, outpacket);
av_packet_unref(outpacket);
if (ret < 0)
{
av_log(NULL, AV_LOG_ERROR, "write vframe error %d\n", ret);
}
else
cout << "av_interleaved_write_frame success" << endl;
write_status = false;
break;
}
}
av_frame_unref(outframe);
if (!write_status)
break;
}
}
}
}
av_packet_unref(packet);
}
//11.写入文件尾部信息
ret = av_write_trailer(ofm_ctx);
cout << "success" << endl;
end:
avfilter_graph_free(&filter_graph);
av_packet_unref(packet);
av_packet_unref(outpacket);
av_frame_unref(outframe);
av_frame_unref(frame);
avcodec_close(codec_ctx);
avformat_close_input(&ifmt_ctx);
avcodec_free_context(&encode_ctx);
avformat_free_context(ofm_ctx);
return -1;
}
2.初始化过滤器
bool FfmpegTest::init_filter(AVCodecContext *codec_ctx)
{
char args[512] = "";
int ret = -1;
AVFilter *bufsink = (AVFilter*)avfilter_get_by_name("buffersink");
AVFilter *bufsrc = (AVFilter*)avfilter_get_by_name("buffer");
AVFilterInOut *input = avfilter_inout_alloc();
AVFilterInOut *output = avfilter_inout_alloc();
AVPixelFormat fmt1[] = { (AVPixelFormat)codec_ctx->pix_fmt, AV_PIX_FMT_NONE};
AVRational time_base = ifmt_ctx->streams[videoindex]->time_base;
filter_graph = avfilter_graph_alloc();
snprintf(args, sizeof(args), "video_size=%dx%d:pix_fmt=%d:time_base=%d/%d:pixel_aspect=%d/%d", codec_ctx->width, codec_ctx->height, codec_ctx->pix_fmt, codec_ctx->time_base.num,
codec_ctx->time_base.den, codec_ctx->sample_aspect_ratio.num, codec_ctx->sample_aspect_ratio.den);
ret = avfilter_graph_create_filter(&bufsrc_ctx, bufsrc, "in", args, NULL, filter_graph);
if (ret < 0)
{
cout << "bufsrc_ctx avfilter_graph_create_filter failed" << endl;
return false;
}
ret = avfilter_graph_create_filter(&bufsink_ctx, bufsink, "out", NULL, NULL, filter_graph);
if (ret < 0)
{
cout << "avfilter_graph_create_filter failed" << endl;
return false;
}
ret = av_opt_set_int_list(bufsink_ctx, "pix_fmts", fmt1, AV_PIX_FMT_NONE, AV_OPT_SEARCH_CHILDREN);
if (ret < 0)
{
cout << "Cannot set output pixel format" << endl;
return false;
}
output->name = av_strdup("in");
output->filter_ctx = bufsrc_ctx;
output->pad_idx = 0;
output->next = nullptr;
input->name = av_strdup("out");
input->filter_ctx = bufsink_ctx;
input->pad_idx = 0;
input->next = nullptr;
const char *filter_desc = "movie=Mario.png[wm];[in][wm]overlay=0:0[out]";//添加水印到坐标5,5 (这儿一定注意是否超出范围坐标)
//const char *filter_desc = "scale=78:24,transpose=cclock";
//const char *filter_desc = "drawtext = fontfile = simhei.ttf: text = 'we are family' : x = 10 : y = 10 : fontsize = 24 : fontcolor = white : shadowy = 2";
ret = avfilter_graph_parse(filter_graph, filter_desc, input, output, NULL);
if (ret < 0)
{
return false;
}
ret = avfilter_graph_config(filter_graph, NULL);
if (ret < 0)
return false;
return true;
}
3.输出文件的初始化
int FfmpegTest::open_output_file(const char *filename)
{
ret = -1;
//1.初始化化封装格式上下文 并打开文件
ofm_ctx = avformat_alloc_context();
ret = avformat_alloc_output_context2(&ofm_ctx, NULL, NULL, filename);
if (ret < 0)
{
cout << "avformat_alloc_output_context2 failed!" << endl;
goto end;
}
//2.创建输出码流
a_stream = avformat_new_stream(ofm_ctx, NULL);
//3.创建编码器(根据输入编码类型)
encode = avcodec_find_encoder(ifmt_ctx->streams[videoindex]->codecpar->codec_id);
//4.视频编码器上下文 并设置参数
encode_ctx = avcodec_alloc_context3(encode);
encode_ctx->codec_id = codec_ctx->codec_id;
encode_ctx->codec_type = codec_ctx->codec_type;
//encode_ctx->frame_size = codec_ctx->frame_size;
encode_ctx->height = codec_ctx->height;
encode_ctx->width = codec_ctx->width;
encode_ctx->sample_aspect_ratio = codec_ctx->sample_aspect_ratio; // 采样宽高比:像素宽/像素高
encode_ctx->refs = codec_ctx->refs;
encode_ctx->extradata = codec_ctx->extradata;
encode_ctx->delay = codec_ctx->delay;
encode_ctx->framerate = codec_ctx->framerate;
encode_ctx->time_base.den = 25;
encode_ctx->time_base = av_inv_q(codec_ctx->framerate); // 时基:解码器帧率取倒数
encode_ctx->time_base.num = 1;
encode_ctx->pix_fmt = codec_ctx->pix_fmt; // 编码器采用解码器的像素格式
encode_ctx->bit_rate = codec_ctx->bit_rate;//设置自己的比特率
encode_ctx->max_b_frames = 0;
//5.打开编码器
ret = avcodec_open2(encode_ctx, encode, NULL);
if (ret < 0)
{
cout << "avcodec open failed!" << endl;
goto end;
}
//6.把编码器信息写入流中
ret = avcodec_parameters_from_context(a_stream->codecpar, encode_ctx);
if (ret < 0)
{
cout << "avcodec_parameters_from_context failed!" << endl;
goto end;
}
av_dump_format(ofm_ctx, 0, filename, 1);
if (!(ofm_ctx->oformat->flags & AVFMT_NOFILE)) // TODO: 研究AVFMT_NOFILE标志
{
// 7. 创建并初始化一个AVIOContext,用以访问URL(out_filename)指定的资源
ret = avio_open(&ofm_ctx->pb, filename, AVIO_FLAG_READ_WRITE);
if (ret < 0) {
av_log(NULL, AV_LOG_ERROR, "Could not open output file '%s'", filename);
goto end;
}
}
//8.写入头文件信息(前提得初始化一个AVIOContext)
ret = avformat_write_header(ofm_ctx, NULL);
if (ret < 0)
{
cout << "write header failed!" << endl;
goto end;
}
return 0;
end:
avcodec_free_context(&encode_ctx);
avformat_free_context(ofm_ctx);
return -1;
}
整体上的代码函数就这三个,没有进行细化函数,存在许多优化,本身就是一个demo,能实现功能即可。
三、遇到问题
因之前一开始对编码和解码都是属于混乱状态,一直没理解,出现很多类似的问题,找问题出处,很难下手都是一一尝试,最后才解决的。
1.运行到avformat_write_header()时,ffmpeg_transcode.exe 中)引发的异常: 0xC0000005: 读取位置 0x0000000000000088 时发生访问冲突
write之前并没有执行avio_open(),所以一直报异常
if (!(ofm_ctx->oformat->flags & AVFMT_NOFILE)) // TODO: 研究AVFMT_NOFILE标志
{
// 7. 创建并初始化一个AVIOContext,用以访问URL(out_filename)指定的资源
ret = avio_open(&ofm_ctx->pb, filename, AVIO_FLAG_READ_WRITE);
if (ret < 0) {
av_log(NULL, AV_LOG_ERROR, "Could not open output file '%s'", filename);
goto end;
}
}
2.过滤器初始化过程中错误,导致后面进行avcodec_send_frame或者avcodec_receive_packet也报类似的异常
①原因是格式设置错误,不对应,fmt格式应该于输入格式的pix_fmt对应。
AVPixelFormat fmt1[] = { (AVPixelFormat)codec_ctx->pix_fmt, AV_PIX_FMT_NONE};
②添加水印图片时,坐标起点加上图标大小超出界限
const char *filter_desc = "movie=Mario.png[wm];[in][wm]overlay=0:0[out]";//添加水印到坐标0.0
3.编码后的视频出现时长不对,可能导致时间缩小(快进几倍的样子),时间变长(扩大播放时间)
原因是没有进行时间基转换av_packet_rescale_ts,得设置对应的时间基,不然就会出现问题。
解码时需要进行时间基转换,编码也需要进行转换,才能对应 (花了长时间才发现的 )
可参考:
以上问题就是在编写过程中,花了时间去解决的问题,很多都能避免的。学习新东西,就应该脚踏实地的去实践,不要想着直接把别人的demo进行复制,实现即可。还是需要自己理清思路一步一步实现,解决其中问题,才能更好掌握知识。
学习方法:先掌握基础知识和接口函数调用,再去看逻辑思路,最后再看原理和算法(借用我领导给我讲的东西,总结了一下)
时刻提醒自己,一步一步脚印来,不要好高骛远。
参考:http://ffmpeg.org/doxygen/trunk/examples.html