我在一个项目中使用了TensorFlow对象检测API,我修改了visualization_utils文件,将所有当前的类标签打印到终端,然后将它们写入.txt文件。我想知道是否有一个函数,我可以在FFmpeg中使用,使它只打印和写入视频中的关键帧的类标签?当视频中有变化时。此时,即使没有变化,它也会打印每帧的所有类标签,因此即使视频中没有新对象,我也会有重复的标签编号。接下来,我是否必须事先对输入视频应用此关键帧过滤?
提前感谢!
我使用opencv 2来捕获视频输入。
请参阅以下代码:
visualization_utils.py -在draw_bounding_box_on_image_array函数中:
# Write video output to file for evaluation.
f = open("ObjDecOutput.txt", "a")
print(display_str_list[0])
f.write(display_str_list[0])
2条答案
按热度按时间rta7y2nd1#
我想我应该跟进这个问题,我最终使用ffmpeg mpdecimate和setpts过滤器来删除重复和相似的帧。
然而,这并没有解决我正在写入标签的文件中的重复问题--为了解决这个问题,我将文件中的每一行附加到一个列表中,并在其中循环以删除重复元素组,只保留第一个出现的元素,并将其附加到一个新列表中。
oxalkeyp2#
最后,我在一年后找到了解决方案here。然而,从这个脚本转换的代码中有一个小bug。
修复程序为
and frame["key_frame"]
帧类型存储在
frames_type
中,但不要相信它。真正的关键帧存储在frames_type_bool
中。我测试了一个剪辑,开始时有两个连续的I帧,但avidemux只显示了一个。因此我检查了原始代码,发现一些帧可能有pict_type = I
,但有key_frame = False
。因此我修复了代码。拥有
frames_type_bool
之后,您可以提取True索引和opencv或imageio,以便仅提取关键帧。以下是如何使用此函数和imageio来显示关键帧: