llama-2-70b

Llama模型

字体：大中小

‌Llama-2-70B‌ 是由 Meta（原 Facebook）于 2023 年 7 月发布的开源大语言模型，属于 Llama 2 系列中参数量最大的公开版本，共包含约 ‌700 亿参数‌（ $70 \times 1 0^{9}$ 70×109）‌56。该模型在多项基准测试中表现接近 GPT-3.5，但尚未达到 GPT-4 水平‌。

核心特性

‌模型规模‌：70B 参数，FP16 精度下模型权重约 ‌140 GB‌，需多 GPU 或量化支持才能部署‌。
‌上下文长度‌：原始支持 ‌4,096 tokens‌；通过持续预训练可扩展至 ‌32,768 tokens‌（Llama 2-Long）‌。
‌架构改进‌：

采用 ‌RMSNorm‌ 预归一化、‌SwiGLU‌ 激活函数、‌RoPE‌ 旋转位置编码‌。
引入 ‌分组查询注意力（GQA）‌，提升推理效率，显存占用降低约 40%‌。

‌训练数据‌：在 ‌2 万亿 token‌ 的公开数据上预训练，数据量比 Llama 1 增加 40%‌。
‌安全机制‌：通过 RLHF 和专用安全数据微调，有害输出概率较前代下降 34%‌

立即使用大模型

免费体验最新的AI大模型，支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型，支持对话、写作、编程、图像、视频等多种功能

Llama模型推荐

llama-3-70b

‌Llama-3-70B‌是由Meta（原Facebook）于‌2024年4月18日‌发布的开源大语言模型（LLM），属于L

llama-2-7b

‌Llama-2-7B‌是由Meta（原Facebook）于2023年发布的‌LLaMA-2系列‌中的中型开源大语言模型

llama-2-70b

‌Llama-2-70B‌是由Meta（原Facebook）于2023年7月发布的开源大语言模型，属于Llama2系列中参

llama-2-13b

‌Llama-2-13B‌是由Meta（原Facebook）于2023年发布的开源大语言模型，属于Llama-2系列中的中

code-llama-7b

CodeLlama7B是由Meta公司开发的CodeLlama系列中的一种开源大型语言模型，专门用于代码生成与

code-llama-13b

CodeLlama-13B是由Meta公司开发的CodeLlama系列中的一种大型语言模型，专门用于代码生成与理

code-llama-34b

CodeLlama-34B‌是由Meta开源的基于Llama2的大型语言模型，专门针对代码生成与理解任务进行优