您的功能请求是否与问题相关?请描述。
我正在使用多个标注器,并为它们分配了不同的工作区。这导致了多个 FeedbackDataset
进行聚合。我想查看 IAA,但根据文档,这些指标仅在一个对象上操作。
描述您希望的解决方案
一种将多个数据集合并为一个的方法将允许用户在上述情况下直接使用内置的指标。
描述您考虑过的替代方案
我通过将数据集转换为 Huggingface 格式来解决这个问题,合并这些数据集,提取配置文件,然后将其推送到 Huggingface Hub。使用 FeedbackDataset.from_huggingface()
将产生所需的单个对象。从长远来看,这相当繁琐,因为它需要为每个聚合将数据推送到和从中心获取。
附加上下文
无
3条答案
按热度按时间7d7tgy0s1#
你好@mpjuhasz
感谢功能建议。这听起来是个很酷的想法。我有一个问题:
此外,我们目前正在进行SDK的主要版本发布,beta版。在这个版本(2.0)中,如果它们的模式兼容,就可以将一个数据集的记录添加到另一个数据集中。例如:
我们将在本月底推出一个新版本的blog post。
gg0vcinb2#
你好,@burtenshaw,
感谢你的快速回复!我对这些问题的想法是:
concatenate_dataset
的HF功能)期待那个发布🙌
xsuvu9jc3#
@mpjuhasz 很好。考虑到这一点,2.0版本应该能解决您的用例。如果您想提前尝试实验版,请告诉我。