gpt-oss-20b
OpenAI模型
GPT-OSS模型是OpenAI于2025年8月推出的开源推理模型系列,旨在为开发者提供高性能、可本地部署的AI模型选项。
该系列包括两个主要版本:GPT-OSS-120B和GPT-OSS-20B,均采用混合专家(MoE)架构,以平衡性能与资源消耗。
模型概述: GPT-OSS-120B:总参数量约1170亿,每个token激活约510亿参数,可在单张80GB GPU上运行,性能接近或达到OpenAI闭源模型o4-mini的水平。
GPT-OSS-20B:总参数量约210亿,每个token激活约36亿参数,支持在16GB内存的消费级设备(如笔记本电脑)上运行,性能优于或接近o3-mini。
核心特性: 开源与商用许可:采用Apache 2.0许可证,允许免费用于研究、商业部署和定制开发,无需授权或付费。
推理能力:经过与OpenAI专有模型相同的后训练流程(包括监督微调和强化学习),支持思维链(CoT)推理和工具调用(如网页搜索、Python解释器),在编程、数学、健康问答等基准测试中表现优异。
部署灵活性:提供低、中、高三种推理强度设置,可调整延迟与性能的权衡;支持最长128k上下文窗口,适用于复杂任务。
应用场景:该系列模型降低了AI技术的使用门槛,尤其适合资源受限的组织或个人进行本地化部署、创新开发和前沿研究。
免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能
免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能
OpenAI模型推荐
gpt-5.3-codex
GPT-5.3-Codex是OpenAI于2026年2月5日发布的最新一代AI编程智能体,被定位为“迄今最强编程代
gpt-5-nano
GPT-5-nano是OpenAI于2025年8月8日发布的GPT-5系列模型之一,主要面向移动端及嵌入式设备等资
whisper-1
Whisper-1是OpenAI推出的Whisper语音识别模型系列中的一个通用版本,专为平衡速度与准确性而
gpt-5.2-chat
GPT-5.2-chat是OpenAI推出的GPT-5.2系列中的一个专用对话模型版本,旨在为用户提供流畅、智能
gpt-5.1-codex-mini
GPT-5.1-Chat模型的核心优势在于它针对不同使用场景进行了精细化分工,通过双模型架构实现“
gpt-5.1-codex-max
GPT-5.1-Codex-Max是OpenAI推出的一款前沿智能体编程模型,专为处理复杂、长时的软件工程任务
codex-mini
Codex-Mini模型是OpenAI推出的一款专为开发者设计的轻量化、高性价比AI编程模型,旨在平衡性
gpt-5.1-chat
GPT-5.1-Chat模型的核心优势在于它针对不同使用场景进行了精细化分工,通过双模型架构实现“