gpt-4o-mini-tts

OpenAI模型

字体:

GPT-4o-mini-tts 是 OpenAI 于 2025 年 3 月推出的一款先进的文本转语音(TTS)模型,旨在为 AI 应用提供高度自然且可高度定制的语音输出能力。 ‌ 

核心功能与特点 ‌高度可定制的语音风格‌:这是该模型最突出的特点。开发者和用户可以通过文本提示(Prompt)精确控制语音的语气、口音、情感和人设。例如,可以指令模型“像一位富有同情心的客服人员一样说话”、“模仿中世纪骑士的口吻”或“以充满激情的意大利美食主厨风格讲解菜单”。 ‌ 

多语言支持‌:模型支持超过 100 种语言的语音合成。实测显示,其在英语、意大利语等语言上的表现非常自然且富有感染力,能够根据人设自动融入细微的口音变化。 ‌ ‌

基于 GPT-4o-mini 架构‌:该模型构建在 OpenAI 的 GPT-4o-mini 精简架构之上,兼顾了语音生成的质量与推理效率。 ‌  ‌

实时流式输出‌:作为 OpenAI 新一代语音模型的一部分,gpt-4o-mini-tts 支持流式语音输出,能够实现更流畅、低延迟的对话体验,适用于实时交互场景。

立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能