请尽可能多地使用这些教程,但这也是一个很好的借口来回顾和重写。
一些需要记住的事情:
- 首先识别一个实际问题和/或数据集。它不应该是一个玩具示例,而是某人可能会实际搜索的东西。
- 解释这个数据和模型,强调为什么它们被使用。例如,GliNER适用于零样本命名实体识别,但运行推理成本较高,因此我们可以开始并逐步转向SpanMarker作为成本效益高的一些技巧。
- 评估用法并展示结果!我们已经优化了RAG管道,所以我们得到了更好的结果。我们已经优化了一个NER模型,现在它可以对X进行分类。
好的例子 https://haystack.deepset.ai/tutorials/27_first_rag_pipeline
您正在编辑的内容已更改。请复制您的编辑并刷新页面。
任务
Beta Give feedback
- 使用few-shot setfit和潜在的句子转换器对textcat进行引导。
- 使用zero-shot和few-shot gliner以及NER对spancat进行引导。
- 使用spaCy-LLM或其他方法(如llama-index、提示工程等)与LLMs一起引导项目(请自由选择您想要的内容)。
- 使用句子转换器和批量标记图像/PDF等的多模型项目。
- 使用BertTopic和文本描述监控数据、模型和注解器的漂移。
- RAG:使用haystack和sentence-transformers优化检索器和重新排序器。
- RAG:优化LLMs:haystack和trl。
- 使用TRL进行指令调优的LLM:SFT。
- 使用TRL进行偏好调优的LLM:DPO。
2条答案
按热度按时间41ik7eoe1#
关于转让的问题,我们应该怎么做?
uidvcgyl2#
@nataliaElv move this to 2.1.