Workers AI 现已正式发布。我们更新了速率限制以反映这一点。
请注意,使用 Wrangler 在本地模式下进行的模型推理也将计入这些限制。在我们致力于性能和规模的同时,Beta 模型的速率限制可能会较低。
速率限制默认为每个任务类型,一些模型的限制定义如下:
- 每分钟 720 个请求
- 每分钟 3000 个请求
- 每分钟 720 个请求
- 每分钟 3000 个请求
- 每分钟 1500 个请求
- 每分钟 2000 个请求
- 每分钟 3000 个请求
- @cf/baai/bge-large-en-v1.5 为每分钟 1500 个请求
- 每分钟 300 个请求
- @hf/thebloke/mistral-7b-instruct-v0.1-awq 为每分钟 400 个请求
- @cf/microsoft/phi-2 为每分钟 720 个请求
- @cf/qwen/qwen1.5-0.5b-chat 为每分钟 1500 个请求
- @cf/qwen/qwen1.5-1.8b-chat 为每分钟 720 个请求
- @cf/qwen/qwen1.5-14b-chat-awq 为每分钟 150 个请求
- @cf/tinyllama/tinyllama-1.1b-chat-v1.0 为每分钟 720 个请求
- 每分钟 720 个请求
- @cf/runwayml/stable-diffusion-v1-5-img2img 为每分钟 1500 个请求
- 每分钟 720 个请求
- @2025 Cloudflare Ubitools
- Cf Repo