gpt-oss-120b

OpenAI模型

字体:

GPT-oss-120b是由OpenAI于2025年8月5日发布的开放权重AI模型,拥有1170亿总参数与每token激活51亿参数,采用专家混合(MoE)架构的Transformer网络。

该系列包括两个主要版本:GPT-OSS-120B和GPT-OSS-20B,均采用混合专家(MoE)架构,以平衡性能与资源消耗。 ‌ 

模型概述‌: ‌GPT-OSS-120B‌:总参数量约1170亿,每个token激活约510亿参数,可在单张80GB GPU上运行,性能接近或达到OpenAI闭源模型o4-mini的水平。 ‌ 

GPT-OSS-20B‌:总参数量约210亿,每个token激活约36亿参数,支持在16GB内存的消费级设备(如笔记本电脑)上运行,性能优于或接近o3-mini。 ‌ 

核心特性‌: ‌开源与商用许可‌:采用Apache 2.0许可证,允许免费用于研究、商业部署和定制开发,无需授权或付费。 ‌ 

推理能力‌:经过与OpenAI专有模型相同的后训练流程(包括监督微调和强化学习),支持思维链(CoT)推理和工具调用(如网页搜索、Python解释器),在编程、数学、健康问答等基准测试中表现优异。 ‌

部署灵活性‌:提供低、中、高三种推理强度设置,可调整延迟与性能的权衡;支持最长128k上下文窗口,适用于复杂任务。 ‌ 

应用场景‌:该系列模型降低了AI技术的使用门槛,尤其适合资源受限的组织或个人进行本地化部署、创新开发和前沿研究。 ‌

立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能