流的操作(二)如何选择流?

  • 2021 年 7 月 13 日
  • 筆記

转发自白狼栈:查看原文

流的操作(一)视频转音频引发的血案一文中我们了解到,流的选择,实际有两种方式,一种是ffmpeg自动选择,一种是设置参数手动选择。

对于自动选择,ffmpeg默认选择规则如下:

  1. 视频流:默认选择分辨率最高的流
  2. 音频流:默认选择通道最多的流
  3. 字幕流:默认选择第一个字幕编码器支持的字幕流

对于视频流和音频流,如果分辨率相等或者通道相等则以第一个为准,数据流和附件流不支持自动选择,需要手动选择。

自动选择的情况下,ffmpeg每种类型只会选择一路,举个例子

ffmpeg -i r3.mp4 -hide_banner 
Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'r3.mp4': 
... 
Duration: 00:00:58.54, start: 0.000000, bitrate: 1998 kb/s 
Stream #0:0(und): Video: h264 (High) (avc1 / 0x31637661), yuv420p, 544x960, 1732 kb/s, 29.83 fps, 29.83 tbr, 11456 tbn, 59.67 tbc (default) 
Stream #0:1(und): Audio: aac (LC) (mp4a / 0x6134706D), 44100 Hz, stereo, fltp, 129 kb/s (default) 
Stream #0:2(und): Audio: mp3 (mp4a / 0x6134706D), 44100 Hz, stereo, fltp, 128 kb/s (default)

 

注:Stream #0:0,第一个0表示第一个输入文件,第二个0表示第一个输入文件的第一路流

如果我们直接对 r3.mp4 转码操作,你会发现输出的视频只保留了一路视频和一路音频。

1、ffmpeg -i r3.mp4 tmp-r3.mp4 
2、ffmpeg -i tmp-r3.mp4 
Stream #0:0(und): Video: h264 (High) (avc1 / 0x31637661), yuv420p, 544x960, 1684 kb/s, 29.83 fps, 29.83 tbr, 11456 tbn, 59.67 tbc (default) 
Stream #0:1(und): Audio: aac (LC) (mp4a / 0x6134706D), 44100 Hz, stereo, fltp, 129 kb/s (default)

 

这就是ffmpeg自动选择的结果。

如果想要输入视频的Stream #0:2这路音频流,就只能手动指定了。

流的手动模式,使用 -map 参数操作,-map 非常重要,后面我们还会反复使用它。它表示我们需要从输入文件中选择哪些流到输出文件。

语法规则:

-map [-]input_file_index[:stream_type_specifier][:stream_index]

 

  1. 中括号[]表示可选,input_file_index 之前的 – 表示反选,即可以剔除某一路流。
  2. input_file_index 指的是某个输入文件,我们可以用下标0表示第一个输入文件,1表示第二个输入文件,以此类推;
  3. stream_type_specifier (可选)指的是指定输入文件的某路流的类型,我们用 a、v、s、d、t分别表示音频流、视频流、字幕流、数据流和附件流;
  4. stream_index(可选)指的是具体的某个类型的某路流。

我们仍然以案例一的素材视频为例(没有下载的可以点击这里下载

如果我们以r1ori.mp4为输入,想得到r3.mp4的结果,即多了一路音频流且是mp3格式的,怎么做?

ffmpeg -i r1ori.mp4 -map 0:v -map 0:a:0 -map 0:a:0 -c:v copy -c:a:0 copy -c:a:1 libmp3lame -y r3.mp4
注意输出代码段Stream mapping这一段
Stream mapping: 
Stream #0:0 -> #0:0 (copy) 
Stream #0:1 -> #0:1 (copy) 
Stream #0:1 -> #0:2 (aac (native) -> mp3 (libmp3lame))

 

简单分析下

  1. 因为只有一个输入文件,所以-map的第一个参数都是0
  2. -map 0:v 表示选择输入文件的所有视频流(这里视频流只有一个)到输出,-c:v copy表示复制所有的视频流,即你看到的 Stream #0:0 -> #0:0 (copy)
  3. -map 0:a:0 我们写了两遍,第一个表示选择输入文件的第一个音频流到输出,第二个仍然表示选择输入文件的第一个音频流到输出,相当于输出了两路音频流
  4. -map 0:v -map 0:a:0 -map 0:a:0 连起来也有关系,表示要按照我们选择的这三路顺序输出
  5. -c:a:0 copy 针对第一个音频流进行复制,不重新编码,即 Stream #0:1 -> #0:1 (copy); -c:a:1 libmp3lame 针对第二个音频流使用libmp3lame编码器重新编码,即输出过程中的 Stream #0:1 -> #0:2 (aac (native) -> mp3 (libmp3lame))

后面我们还会大量使用-map命令,所以上面这段分析,务必要理解清楚。

上面的命令同样等价于

ffmpeg -i r1ori.mp4 -map 0:0 -map 0:1 -map 0:1 -c:v copy -c:a:0 copy -c:a:1 libmp3lame -y r3.mp4

 

-map 0:v 这里等价于 -map 0:0,-map 0:a:0 等价于-map 0:1,这是因为在r1ori.mp4中#0:0就是视频流,#0:1就是音频流

ffmpeg -i r1ori.mp4 
... 
Stream #0:0(und): Video: h264 
Stream #0:1(und): Audio 
...

 

注意:-map的参数,针对的是输入流,因为是我们想要从输入流中选择流到输出;-c选项的参数,针对的并不再是输入流了,-c的参数针对的是-map选择的流,即输出流。

除此之外,下面我们再看几个简单的例子,你可以在看结果之前尝试下

1、复制输入文件的所有流到输出,输出结果可就不止只有两路流了

ffmpeg -i r3.mp4 -map 0 -c copy output.mp4

 

2、把输入文件的三路流分别拆开,输出三个文件

ffmpeg -y -i r3.mp4 -map 0:v -c:v copy output-silent.mp4 \
-map 0:a:0 -c:a copy output-audio.aac \
-map 0:a:1 -c:a copy output-audio.mp3

 

我们还可以设置一些选项,比如可以设置r3.mp4的两路音频流有不同的码率。

ffmpeg -i r3.mp4 -b:a:0 32k -b:a:1 64k -map 0 -y r4.mp4

 

-map 0 是必须的,不然输出结果并不会输出两路音频流。

对于音视频流还有很多选项设置,具体你可以查阅官方文档了解,你也可以在我们平时练习中多查阅资料,奠定基础。

最后,我们还有一种最最常见的操作——结合滤镜使用。

比如把原视频 r3.mp4 等比例缩放一倍

ffmpeg -i r3.mp4 -vf scale=272:480 -y filter.mp4

 

我们也可以手动选择流处理

ffmpeg -i r3.mp4 -filter_complex "[0]scale=272:480[out]" -map 0:a -map "[out]" -y filter.mp4

 

上面这两条命令你可能很难理解,关于滤镜,大家先有个印象,下面文章我们再作详细介绍。

流的操作我们就介绍到这里,大家在练习中碰到各种莫名其妙的问题,尽管留言。