Skip to content

Gemini CLI:配额与定价

Gemini CLI 提供慷慨的免费层,涵盖许多个人开发者的使用场景。对于企业或专业使用,或者如果你需要更高的限制,根据你的认证账户类型有多种选项可用。

有关隐私政策和服务条款的详细信息,请参阅 Google 隐私政策

注意: 公布的价格为标价;可能适用额外的协商商业折扣。

本文概述了使用不同认证方法时适用于 Gemini CLI 的具体配额和定价。

通常,有三个类别可供选择:

  • 免费使用:适合实验和轻度使用。
  • 付费层(固定价格):适合需要更慷慨的每日配额和可预测成本的个人开发者或企业。
  • 按需付费:最灵活的选项,适合专业使用、长时间运行的任务,或当你需要完全控制使用量时。

免费使用

你的旅程从慷慨的免费层开始,非常适合实验和轻度使用。

你的免费使用限制取决于你的授权类型。

使用 Google 登录(个人版 Gemini Code Assist)

适用于使用 Google 账户认证以访问个人版 Gemini Code Assist 的用户。包括:

  • 每用户每天 1000 次模型请求
  • 每用户每分钟 60 次模型请求
  • 模型请求将在 Gemini CLI 确定的 Gemini 模型系列中进行。

了解更多:个人版 Gemini Code Assist 限制

使用 Gemini API 密钥登录(未付费)

如果你使用 Gemini API 密钥,也可以享受免费层。包括:

  • 每用户每天 250 次模型请求
  • 每用户每分钟 10 次模型请求
  • 仅限 Flash 模型的模型请求。

了解更多:Gemini API 速率限制

使用 Vertex AI 登录(Express 模式)

Vertex AI 提供无需启用计费的 Express 模式。包括:

  • 90 天后需要启用计费。
  • 配额和模型因账户而异。

了解更多:Vertex AI Express 模式限制

付费层:固定成本的更高限制

如果你用完了初始请求数量,可以通过升级到以下订阅之一继续使用 Gemini CLI:

按需付费

如果你达到每日请求限制或即使升级后也耗尽了 Gemini Pro 配额,最灵活的解决方案是切换到按需付费模式,你只需为使用的特定处理量付费。这是不间断访问的推荐路径。

要做到这一点,使用 Gemini API 密钥或 Vertex AI 登录。

  • Vertex AI(常规模式):
    • 配额:由动态共享配额系统或预购的预配置吞吐量管理。
    • 成本:基于模型和 token 使用量。

了解更多:Vertex AI 动态共享配额Vertex AI 定价

  • Gemini API 密钥:
    • 配额:因定价层而异。
    • 成本:因定价层和模型/token 使用量而异。

了解更多:Gemini API 速率限制Gemini API 定价

需要强调的是,使用 API 密钥时,你按 token/调用付费。对于许多 token 较少的小调用,这可能更昂贵,但这是确保工作流不被配额限制中断的唯一方法。

Gemini for Workspace 计划

这些计划目前仅适用于 Google 提供的基于 Web 的 Gemini 产品(例如 Gemini Web 应用或 Flow 视频编辑器)。这些计划不适用于为 Gemini CLI 提供支持的 API 使用。支持这些计划正在积极考虑未来支持。

避免高成本的技巧

使用按需付费 API 密钥时,注意你的使用量以避免意外成本。

  • 不要盲目接受每个建议,特别是对于计算密集型任务,如重构大型代码库。
  • 有意识地使用你的提示词和命令。你按调用付费,所以考虑完成工作的最有效方式。

Gemini API vs. Vertex

  • Gemini API(gemini developer api):这是直接使用 Gemini 模型的最快方式。
  • Vertex AI:这是用于构建、部署和管理具有特定安全和控制要求的 Gemini 模型的企业级平台。

了解你的使用情况

模型使用摘要可通过 /stats 命令获得,并在会话结束时退出时显示。

aicodex 文档网站