适用于gpt-3.5-turbo的Azure openAI模型的每分钟请求速率限制是多少?

sqserrrh  于 2023-11-21  发布在  其他
关注(0)|答案(1)|浏览(284)

我找不到Azure openAI的RPM限制
我发现TPM限制是240k,适用于美国东部、美国中南部、西欧、法国中部、英国南部,
我尝试了Microsoft文档,但找不到此限制。https://learn.microsoft.com/en-us/azure/ai-services/openai/quotas-limits

sdnqo3pr

sdnqo3pr1#

“RPM”(每分钟请求数)配额直接是“TPM”(每分钟事务数)的速率:


的数据
因此,对于GPT 3.5 Turbo型号,如果您的部署具有240k TPM,则RPM将为每分钟1440个请求。
在Azure AI Studio中可见的示例:在我的情况下,我设置了120k TPM,我得到了720 RPM:



来源:https://learn.microsoft.com/en-us/azure/ai-services/openai/how-to/quota?tabs=rest#introduction-to-quota

相关问题