gpt-4o-mini-tts

音频处理模型

字体：大中小

文本转语音

GPT-4o-mini-tts 是 OpenAI 于 2025 年 3 月推出的一款先进的文本转语音（TTS）模型，旨在为 AI 应用提供高度自然且可高度定制的语音输出能力。 ‌

核心功能与特点 ‌高度可定制的语音风格‌：这是该模型最突出的特点。开发者和用户可以通过文本提示（Prompt）精确控制语音的语气、口音、情感和人设。例如，可以指令模型“像一位富有同情心的客服人员一样说话”、“模仿中世纪骑士的口吻”或“以充满激情的意大利美食主厨风格讲解菜单”。 ‌

多语言支持‌：模型支持超过 100 种语言的语音合成。实测显示，其在英语、意大利语等语言上的表现非常自然且富有感染力，能够根据人设自动融入细微的口音变化。 ‌ ‌

基于 GPT-4o-mini 架构‌：该模型构建在 OpenAI 的 GPT-4o-mini 精简架构之上，兼顾了语音生成的质量与推理效率。 ‌ ‌

实时流式输出‌：作为 OpenAI 新一代语音模型的一部分，gpt-4o-mini-tts 支持流式语音输出，能够实现更流畅、低延迟的对话体验，适用于实时交互场景。

免费体验最新的AI大模型，支持对话、写作、编程、图像、视频等多种功能

免费体验最新的AI大模型，支持对话、写作、编程、图像、视频等多种功能

Whisper-1是OpenAI推出的Whisper语音识别模型系列中的一个通用版本，专为平衡速度与准确性而

GPT-4o-mini-tts是OpenAI于2025年3月推出的一款先进的文本转语音（TTS）模型，旨在为AI应用提供

TTS-1-HD是OpenAI推出的文本转语音（Text-to-Speech,TTS）模型的一个版本，专注于提供‌更高的

TTS-1模型是由OpenAI开发的文本转语音（TTS）系统中的核心组件，专为高效、高质量的语音合成设

GPT-4o-mini-realtime-preview是OpenAI推出的GPT-4o系列中专为‌实时交互‌优化的轻量级模型

GPT-4o-Audio-Preview是OpenAI推出的一款专注于语音处理的先进多模态模型，它为人机交互开辟

GPT-5-mini是OpenAI于2025年8月8日发布的GPT-5系列中的轻量级版本，专为成本敏感和中等复杂度

GPT-4o-mini-transcribe是OpenAI推出的一款专用于语音转文本（Speech-to-Text）的AI模型，是其