text-search-ada-doc-001

OpenAI模型

字体：大中小

文本搜索信息检索

text-search-ada-doc-001 是 OpenAI 推出的一款‌文本搜索嵌入模型‌，属于其第一代嵌入模型系列（以 -001 结尾）。该模型专门用于将‌长文档‌转换为数值向量（即“嵌入”），以便在信息检索、搜索和上下文相关性排序等任务中使用。 ‌

‌核心功能‌：该模型旨在衡量‌长文档‌与‌短搜索查询‌之间的相关性。在实际应用中，通常会将待检索的文档通过 text-search-ada-doc-001 进行嵌入，而用户的搜索查询则会使用配套的查询模型 text-search-ada-query-001 进行嵌入，然后通过计算向量间的相似度来找到最相关的文档。 ‌
‌模型系列‌：它是 OpenAI 第一代嵌入模型的一部分，基于 Ada 系列模型构建，参数规模约为 12 亿。 ‌
‌输入限制‌：该模型的最大输入长度为 ‌2046 个 token‌。 ‌
‌训练数据截止‌：其训练数据的截止时间约为 ‌2020 年 8 月‌。 ‌

需要注意的是，text-search-ada-doc-001 及其同系列的第一代模型（如 text-search-babbage-doc-001, text-search-curie-doc-001 等）已被 OpenAI 列为‌旧版模型‌，并建议用户迁移到更先进的替代品。 ‌

目前，OpenAI 推荐用于绝大多数文本嵌入场景的模型是 ‌text-embedding-ada-002‌。这款第二代模型在性能、成本和易用性方面均有显著提升，支持更长的输入（8191 个 token），并且是当前 API 的默认推荐选择。 ‌

因此，虽然 text-search-ada-doc-001 仍可被调用，但对于新项目或需要优化的现有系统，建议优先采用 text-embedding-ada-002。

免费体验最新的AI大模型，支持对话、写作、编程、图像、视频等多种功能

免费体验最新的AI大模型，支持对话、写作、编程、图像、视频等多种功能

GPT-5.3-Codex是OpenAI于2026年2月5日发布的最新一代AI编程智能体，被定位为“迄今最强编程代

GPT-5-nano是OpenAI于2025年8月8日发布的GPT-5系列模型之一，主要面向移动端及嵌入式设备等资

Whisper-1是OpenAI推出的Whisper语音识别模型系列中的一个通用版本，专为平衡速度与准确性而

GPT-5.2-chat是OpenAI推出的GPT-5.2系列中的一个专用对话模型版本，旨在为用户提供流畅、智能

GPT-5.1-Chat模型的核心优势在于它针对不同使用场景进行了精细化分工，通过双模型架构实现“

GPT-5.1-Codex-Max是OpenAI推出的一款前沿智能体编程模型，专为处理复杂、长时的软件工程任务

Codex-Mini模型是OpenAI推出的一款专为开发者设计的轻量化、高性价比AI编程模型，旨在平衡性

GPT-5.1-Chat模型的核心优势在于它针对不同使用场景进行了精细化分工，通过双模型架构实现“