llama-2-7b

Llama模型

字体:

‌Llama-2-7B‌ 是由 Meta(原 Facebook)于 2023 年发布的 ‌LLaMA-2 系列‌ 中的中型开源大语言模型,拥有 ‌70 亿参数‌(7B),在性能与资源消耗之间取得了良好平衡,适用于研究、商业应用及边缘设备部署。


核心特性

  • ‌模型规模‌:70 亿参数,适合在资源受限环境(如单卡 GPU 或 NPU)中运行。

  • ‌架构‌:基于 ‌Transformer Decoder-only‌ 结构,采用 ‌分组查询注意力‌(GQA),提升推理效率。

  • ‌训练数据‌:使用约 ‌2 万亿 tokens‌ 的多语言公开语料(截止 2022 年 9 月),涵盖英文、中文、编程语言等。

  • ‌支持场景‌:

    • 预训练模型(基础版)

    • 对话优化版(Llama-2-7b-chat)

  • ‌许可协议‌:可免费用于研究和商业用途,但月活超 7 亿的企业需申请授权 ‌。

  • ‌量化支持‌:提供 FP16、INT8 甚至 4-bit 量化版本,便于低显存设备部署 ‌。


性能表现(基准测试)

模型MMLUCMMLUGSM8K (Pass@256)数学能力上限
Llama-2-7B~44.5%~33.0%~49.5% (单次生成)97.7%‌ (潜力,需优化) ‌7
Xwin-Math-7B(微调版)--82.6%- ‌7


立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能