CTranslate2 输出tokens的logits

z4iuyo4d 于 7个月前发布在 Git

关注(0)|答案(3)|浏览(86)

你好，
除非我理解错了，否则在翻译器的translate_batch或generate_tokens函数中，我没有看到任何选项可以输出生成的tokens的logits/概率。然而，这个计算必须在采样tokens之前内部完成，对吗？
这将非常有用，以便更好地控制生成过程，例如影响特定token的选择。为什么没有公开这个功能呢？这可以很容易地添加上吗，还是我漏掉了什么？这可以以return_logits参数的形式出现在提到的函数中。
谢谢，
Simon

来源：https://github.com/OpenNMT/CTranslate2/issues/1616

3条答案

按热度按时间

关于这个有什么更新吗？

赞(0）回复(0）举报 7个月前

在方法generate_tokens中，有一个选项return_log_prob。默认情况下它是关闭的。你可以通过result.log_prob来激活它，并在结果中获得log_prob。

赞(0）回复(0）举报 7个月前

@minhthuc2502 我想在整个词汇表(或至少前K个)上进行分布。使用您的解决方案，我只能得到由模型生成的token的对数概率...
这个分布必须通过计算来生成token,这就是为什么我认为它应该“容易”暴露出来...

赞(0）回复(0）举报 7个月前

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 5个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 5个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 5个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 5个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 5个月前