gpt-oss-120b
工具扩展模型
GPT-oss-120b是由OpenAI于2025年8月5日发布的开放权重AI模型,拥有1170亿总参数与每token激活51亿参数,采用专家混合(MoE)架构的Transformer网络。
该系列包括两个主要版本:GPT-OSS-120B和GPT-OSS-20B,均采用混合专家(MoE)架构,以平衡性能与资源消耗。
模型概述: GPT-OSS-120B:总参数量约1170亿,每个token激活约510亿参数,可在单张80GB GPU上运行,性能接近或达到OpenAI闭源模型o4-mini的水平。
GPT-OSS-20B:总参数量约210亿,每个token激活约36亿参数,支持在16GB内存的消费级设备(如笔记本电脑)上运行,性能优于或接近o3-mini。
核心特性: 开源与商用许可:采用Apache 2.0许可证,允许免费用于研究、商业部署和定制开发,无需授权或付费。
推理能力:经过与OpenAI专有模型相同的后训练流程(包括监督微调和强化学习),支持思维链(CoT)推理和工具调用(如网页搜索、Python解释器),在编程、数学、健康问答等基准测试中表现优异。
部署灵活性:提供低、中、高三种推理强度设置,可调整延迟与性能的权衡;支持最长128k上下文窗口,适用于复杂任务。
应用场景:该系列模型降低了AI技术的使用门槛,尤其适合资源受限的组织或个人进行本地化部署、创新开发和前沿研究。
立即使用大模型
免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能
立即使用此模型
免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能