新版本即将来袭?《抗战2》全新职业侦察兵首曝

Vertex AI Model Optimizer 是一种动态端点,旨在通过自动应用最能满足您需求的 Gemini 模型来简化模型选择。这样一来,您就可以将提示指向单个元端点,服务会根据您的费用和质量偏好,智能地为您的查询选择最合适的 Gemini 模型(Pro、Flash 等)。

如需详细了解 Model Optimizer 价格,请参阅价格

优势

借助 Model Optimizer,您可以:

  • 简化模型选择,无需为每个应用选择模型
  • 可针对费用、质量或两者进行优化,让您在性能和预算之间取得平衡
  • 与现有的 Gemini API 和 SDK 无缝集成
  • 跟踪用量并发现节省费用的潜力
  • 高效处理基于文本的任务,无需手动选择端点

支持的模型

  • Gemini 2.0 Flash(正式版)
  • Gemini 2.5 Pro(预览版,03-25)

语言支持

Model Optimizer 支持 Gemini 模型支持的所有语言。(请参阅“Gemini 语言支持”)

模态

Model Optimizer 支持文本用例,包括:

  • 编码,包括函数调用和代码执行
  • 摘要
  • 单轮聊天和多轮聊天
  • 问答

如需了解限制以及如何处理这些限制,请参阅处理不支持的功能

使用入门

如需开始使用模型优化器,请参阅我们的快速入门 Colab 笔记本

使用 Vertex AI Model Optimizer

Python

安装

pip install --upgrade google-genai

如需了解详情,请参阅 SDK 参考文档

设置环境变量以将 Gen AI SDK 与 Vertex AI 搭配使用:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

#     from google import genai
#     from google.genai.types import (
#         FeatureSelectionPreference,
#         GenerateContentConfig,
#         HttpOptions,
#         ModelSelectionConfig
#     )
#
#     client = genai.Client(http_options=HttpOptions(api_version="v1beta1"))
#     response = client.models.generate_content(
#         model="model-optimizer-exp-04-09",
#         contents="How does AI work?",
#         config=GenerateContentConfig(
#             model_selection_config=ModelSelectionConfig(
#                 feature_selection_preference=FeatureSelectionPreference.BALANCED  # Options: PRIORITIZE_QUALITY, BALANCED, PRIORITIZE_COST
#             ),
#         ),
#     )
#     print(response.text)
#     # Example response:
#     # Okay, let's break down how AI works. It's a broad field, so I'll focus on the ...
#     #
#     # Here's a simplified overview:
#     # ...

处理不支持的功能

Model Optimizer 仅支持文本输入和输出。不过,请求可能包含不支持的不同模态或工具。以下部分将介绍 Model Optimizer 如何处理这些不受支持的功能。

多模态请求

如果请求包含带有视频、图片或音频等多模态数据的提示,则会抛出 INVALID_ARGUMENT 错误。

不支持的工具

Model Optimizer 仅支持请求的函数声明。如果请求包含其他工具类型(包括 google_mapsgoogle_searchenterprise_web_searchretrievalbrowse),系统会抛出 INVALID_ARGUMENT 错误。

发送反馈

如需发送有关 Model Optimizer 使用体验的反馈,请填写我们的反馈调查问卷

如果您对 Model Optimizer 有任何疑问、技术问题或反馈,请发送电子邮件至 model-optimizer-support@google.com

客户讨论群组

如需直接与开发团队联系,您可以加入 Vertex AI Model Optimizer 聆听群组,在其中了解产品并帮助我们了解如何改进功能。该群组的活动包括:

  • 旨在详细了解功能的虚拟研讨会
  • 旨在分享您的需求和优先事项的反馈调查问卷
  • 当我们探索新功能时,与 Google Cloud 员工进行 1 对 1 交流

活动大约每 6-8 周开展一次。您可以参加任意次数的活动,也可以随时选择完全退出活动。 如需加入该群组,请填写 Vertex AI Model Optimizer 讨论群组注册表单