接地是一种可帮助生成更可信、更实用且更符合事实的模型回答的技术。为生成式 AI 模型回答建立依据时,您需要将其与可验证的信息源相关联。通常,若要实现接地,您必须检索相关的来源数据。建议的最佳实践是使用检索增强生成 (RAG) 技术。检索通常使用搜索引擎完成,该引擎使用嵌入了源文本语义含义的索引。
此外,还有一些服务和组件 API 可实现 RAG 生命周期,例如 Vertex AI Search Builder API,可让您自由组合构建。通过混合搭配构建,您可以使用以下任一服务或 API 实现 RAG 解决方案:
- Grounding Generation API:您可以使用它实现基准,或关联到检索提供程序以实现完整的 RAG 生命周期。
- 文档布局解析器:此解析器结合了 Document AI 和 Gemini 在文档理解方面的优势。如需详细了解布局解析器,请参阅使用布局解析器。
- Vertex AI Vector Search:这项搜索服务具有高性能,并使用高质量的向量数据库。
- Check Grounding API:此 API 会将 RAG 输出与检索到的事实进行比较,并有助于确保在向用户返回回答之前,所有陈述均已建立依据。
使用 Vertex AI RAG Engine 将回答接地
如需使用 Vertex AI RAG Engine 对回答进行归因,您必须创建提示。执行以下操作:
在 Google Cloud 控制台中,使用 Vertex AI Studio 前往创建问题页面。
选择接地:自有数据。
选择 RAG Engine 接地源。
从语料库列表中,选择您的语料库名称。
在 Top-K 相似度字段中,选择 20(默认值)。
点击保存。
后续步骤
- 如需详细了解 Responsible AI 和安全过滤条件,请参阅 Responsible AI 最佳实践和 Vertex AI 的安全过滤条件。
- 如需详细了解 RAG 引擎如何实现 RAG,请参阅 RAG 引擎。