你好,
我正在尝试按照这个例子进行图像标注:https://ludwig-ai.github.io/ludwig-docs/examples/#image-captioning
这个例子是为每个图像编写一个单独的标题,模型定义如下:
input_features:
-
name: image_path
type: image
encoder: stacked_cnn
output_features:
-
name: caption
type: text
level: word
decoder: generator
cell_type: lstm
但是我使用的是Flickr8k数据集,每个图像有5个标题。是否可以使用这样的数据集与Ludwig一起使用,还是我必须剥离其余的标题并只使用一个?
[image 1] [caption 1] [caption 2] [caption 3] [caption 4] [caption 5]
[image 2] [caption 1] [caption 2] [caption 3] [caption 4] [caption 5]
[image 3] [caption 1] [caption 2] [caption 3] [caption 4] [caption 5]
...
...
谢谢。
1条答案
按热度按时间qfe3c7zg1#
只需添加更多输出特征。输出特征是一个列表。