llama-2-70b

Llama模型

字体:

‌Llama-2-70B‌ 是由 Meta(原 Facebook)于 2023 年 7 月发布的开源大语言模型,属于 Llama 2 系列中参数量最大的公开版本,共包含约 ‌700 亿参数‌(70×10970×109)‌56。该模型在多项基准测试中表现接近 GPT-3.5,但尚未达到 GPT-4 水平‌。


核心特性

  • ‌模型规模‌:70B 参数,FP16 精度下模型权重约 ‌140 GB‌,需多 GPU 或量化支持才能部署‌。

  • ‌上下文长度‌:原始支持 ‌4,096 tokens‌;通过持续预训练可扩展至 ‌32,768 tokens‌(Llama 2-Long)‌。

  • ‌架构改进‌:

    • 采用 ‌RMSNorm‌ 预归一化、‌SwiGLU‌ 激活函数、‌RoPE‌ 旋转位置编码‌。

    • 引入 ‌分组查询注意力(GQA)‌,提升推理效率,显存占用降低约 40%‌。

  • ‌训练数据‌:在 ‌2 万亿 token‌ 的公开数据上预训练,数据量比 Llama 1 增加 40%‌。

  • ‌安全机制‌:通过 RLHF 和专用安全数据微调,有害输出概率较前代下降 34%‌



立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能