gemini-embedding-001

2025-07-24
嵌入
By Gemini

Input: ￥1.20 / M tokens Output: ￥1.20 / M tokens
特征：文本输入
上下文： 2k
最大输出： 2K

Input: ￥1.20 / M tokens Output: ￥1.20 / M tokens
特征：文本输入
上下文： 2k
最大输出： 2K

模型描述

Gemini 嵌入模型在许多关键维度上（包括代码、多语言和检索）实现了SOTA（最先进）性能。

Gemini Embedding 是一种先进的模型，它利用 Gemini 架构为多种语言的文本和代码生成高度通用化的嵌入，专为检索、分类和聚类等任务而设计。

Gemini 嵌入模型简介

Gemini Embedding 是一个最先进的嵌入模型，旨在利用谷歌 Gemini 大型语言模型的能力。它为涵盖 100 多种语言和各种文本模态（包括代码）的文本生成高度通用化的密集向量表示。这些嵌入可以预先计算，并应用于广泛的下游任务，例如分类、语义相似性、聚类、排名和信息检索。

模型架构

模型的架构旨在创建输入的整体性表示。这一过程首先从一个预先存在的 Gemini 模型初始化嵌入模型，这使其能够利用 Gemini 参数中已包含的庞大知识。

技术流程主要包括三个步骤：

输入文本序列由一个具有双向注意力的 Transformer 处理，从而生成一个 token 级别的嵌入序列。
然后应用均值池化策略。这涉及沿着序列轴对 token 嵌入进行平均，以生成一个代表整个输入的单一的、固定大小的嵌入。
最后，一个随机初始化的线性投影层将这个池化后的嵌入缩放到所需的最终输出维度。

训练

Gemini 嵌入模型通过一个训练目标进行了优化，该训练目标基于带有批内负样本的噪声对比估计（NCE）损失函数。

性能和功能

在对大规模多语言文本嵌入基准 (MMTEB) 进行评估时，该基准包含超过 250 种语言的 100 多项任务，Gemini Embedding 已被证明显著优于此前最先进的模型。它在公共排行榜上建立了新的最先进水平，平均得分达到 68.32，较次优模型有显著提升。

该模型不仅在英语等高资源语言中表现出卓越性能，而且在许多低资源语言（如马其顿语）中也表现出色。它还在 XOR-Retrieve 等特定基准测试中为跨语言检索创下了新纪录。这个统一模型在广泛的任务选择中展现出强大能力，甚至超越了英语、多语言和代码基准测试中专门的、领域特定的模型。

🔔如何使用

graph LR A("Purchase Now") --> B["Start Chat on Homepage"] A --> D["Read API Documentation"] B --> C["Register / Login"] C --> E["Enter Key"] D --> F["Enter Endpoint & Key"] E --> G("Start Using") F --> G style A fill:#f9f9f9,stroke:#333,stroke-width:1px style B fill:#f9f9f9,stroke:#333,stroke-width:1px style C fill:#f9f9f9,stroke:#333,stroke-width:1px style D fill:#f9f9f9,stroke:#333,stroke-width:1px style E fill:#f9f9f9,stroke:#333,stroke-width:1px style F fill:#f9f9f9,stroke:#333,stroke-width:1px style G fill:#f9f9f9,stroke:#333,stroke-width:1px

点击购买

点击首页立即对话

注册 / 登录

输入key

阅读API文档

输入端点和API Key

开始使用

推荐模型

claude-sonnet-4-6

对话, 推理, 识图
Anthropic

Claude Sonnet 4.6 是一款多功能升级，提供与 Opus 同级别的智能，涵盖编码、计算机使用和长上下文推理，拥有 100 万令牌的上下文窗口，同时保持现有价格水平。

2026-02-22

QwQ-32B

对话, 推理
Qwen

QwQ-32B 是 Qwen 系列中的一个 32.5B 参数推理模型，具有先进的架构和 131K 令牌上下文长度，旨在在复杂任务中超越像 DeepSeek-R1 这样的最先进模型。

2025-03-06

gpt-5.2

对话, 推理, 识图
OpenAI

GPT-5.2 是 GPT-5 旗舰模型家族中最强的通用模型，旨在相较 GPT-5.1 在通用智能、指令遵循、准确性与 token 效率、多模态（尤其是视觉）、代码生成（尤其是前端 UI）、API 中的工具调用与上下文管理、以及表格理解与生成等方面提升，并新增用于管理模型“知道什么/记住什么”的特性以提高准确性

2025-12-11