text-embedding-3-large

OpenAI模型

字体:

ext-embedding-3-large‌ 是 OpenAI 推出的第三代文本嵌入模型中性能最强的版本,专为高精度语义理解任务设计。以下是其核心特点与关键信息: 

 模型概览 ‌向量维度‌:默认 ‌3072 维‌,可按需通过 dimensions 参数缩短(如 1024、256 等),支持灵活权衡精度与成本。 

‌性能表现‌: 在 MTEB(英文语义基准)中得分 ‌64.6%‌,比前代 text-embedding-ada-002(61.0%)提升显著。 在 MIRACL(多语言检索基准)中得分 ‌54.9%‌,较 ada-002(31.4%)提升近 ‌75%‌ ‌ 5 12。

 ‌价格‌:‌$0.13 / 100 万 tokens‌,略高于 small 版本,但性价比极高。 

核心优势 ‌高精度语义捕捉‌:3072 维向量能更精细地表示文本语义,适用于复杂任务如深度搜索、推荐系统、异常检测等。 ‌

支持长文本‌:可处理长达 ‌8192 个 token‌ 的输入文档 ‌ 。 ‌

多语言支持‌:对中文、英文等多语言语义对齐能力强,适合跨语言应用 ‌ 。 ‌

弹性维度(Matryoshka Representation Learning)‌:通过 dimensions 参数可“无损”截断向量,例如缩短至 256 维后仍优于完整维度的 ada-002 ‌

立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能