请请了解的人去添加,以便让内部的llamacpp编码端点对Ollama API可用。这样我们就可以使用llm分词器来准确测量我们正在使用的上下文,从而可以在我们的内存中进行选择和挑选,而不是仅从消息的开头进行裁剪。
ykejflvf1#
Merge #2410 :)
4jb9z9bj2#
重复 #1345 。这将是一个很棒的功能。
2条答案
按热度按时间ykejflvf1#
Merge #2410 :)
4jb9z9bj2#
重复 #1345 。这将是一个很棒的功能。