FinGPT 在微调过程中使用的数据集

9wbgstp7  于 6个月前  发布在  其他
关注(0)|答案(2)|浏览(123)

我注意到在创建数据集时,新闻标题和新闻内容是分开的。这意味着新闻标题和新闻内容有不同的训练集和测试集。然而,在微调过程中,只使用了包含新闻标题的数据集,而没有使用包含新闻内容的数据集。因此,我对新闻内容数据集在微调过程中的作用感到有些困惑。

y3bcpkx1

y3bcpkx11#

你好,itlittlekou。你是对的!我们出于时间和成本的原因在实验中使用了新闻标题。由于新闻内容包含了大部分信息,最好的方法是同时使用新闻标题和新闻内容。
然而,在我们的实验中,我们需要将所有与某些股票相关的新闻连接起来,形成一个特定的时间段,例如一天。因此,这些标记可能会非常大,而且训练起来可能会相当困难。我们认为最好的方法可能是使用标题和摘要,或者仅使用标题或摘要也可能有效。如果你有更好的计划,请随时联系我们或创建PR!

63lcw9qa

63lcw9qa2#

你是如何创建数据集的?我看不到有API可以做到这一点。

相关问题