unilm 如何使用Kosmos-2进行RAVEN-IQ?

ewm0tg9j  于 2个月前  发布在  其他
关注(0)|答案(1)|浏览(40)

描述

模型:我正在使用Kosmos-1中的Kosmos-2进行RAVEN-IQ。
问题:

  1. 如何为IQ评估使用具有多个输入的指令?
  2. 是否有详细的描述或示例来展示提示构建?
  3. 我使用了Kosmos-1中提供的提示,并附上了以下详细信息:
    这里有三张图片:[image]/exp-4/query-1.png[image]/exp-4/query-2.png[image]/exp-4/query-3.png下面的图片是:[image]/exp-4/answer-f.png它是正确的吗?是的
    我没有得到合适的结果,不确定这是将指令与多个输入图像正确连接的方法。
    非常感谢。
0lvr5msh

0lvr5msh1#

也研究了一下。
想知道输入多个图像时应该使用什么提示?

相关问题