llama-2-13b

Llama模型

字体：大中小

‌Llama-2-13B‌ 是由 Meta（原 Facebook）于 2023 年发布的开源大语言模型，属于 Llama-2 系列中的中等规模版本（另有 7B 和 70B 版本）。该模型基于 Transformer 架构，专为通用自然语言理解与生成任务设计，并提供预训练基础版（Llama-2-13b-base）和对话优化版（Llama-2-13b-chat）两种形式。

核心参数与结构

‌参数量‌：‌130 亿（13B）‌
‌上下文长度‌：‌4096 个 token‌（相比 Llama-1 的 2048 翻倍）‌
‌词汇表大小‌：原始版本为 ‌32,000‌；部分中文增强版（如 Colossal-LLaMA-2-13b-base）扩展至 ‌69,104‌ 以更好支持中文 ‌
‌架构特点‌：

使用 ‌RMSNorm‌ 进行预归一化
采用 ‌SwiGLU‌ 激活函数
引入 ‌旋转位置编码（RoPE）‌
‌分组查询注意力（GQA）‌：提升长序列推理效率 ‌

‌训练数据‌：约 ‌2 万亿 tokens‌，涵盖多语言网页、书籍、文章等，截止至 ‌2022 年 9 月‌ ‌

立即使用大模型

免费体验最新的AI大模型，支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型，支持对话、写作、编程、图像、视频等多种功能

Llama模型推荐

llama-3-70b

‌Llama-3-70B‌是由Meta（原Facebook）于‌2024年4月18日‌发布的开源大语言模型（LLM），属于L

llama-2-7b

‌Llama-2-7B‌是由Meta（原Facebook）于2023年发布的‌LLaMA-2系列‌中的中型开源大语言模型

llama-2-70b

‌Llama-2-70B‌是由Meta（原Facebook）于2023年7月发布的开源大语言模型，属于Llama2系列中参

llama-2-13b

‌Llama-2-13B‌是由Meta（原Facebook）于2023年发布的开源大语言模型，属于Llama-2系列中的中

code-llama-7b

CodeLlama7B是由Meta公司开发的CodeLlama系列中的一种开源大型语言模型，专门用于代码生成与

code-llama-13b

CodeLlama-13B是由Meta公司开发的CodeLlama系列中的一种大型语言模型，专门用于代码生成与理

code-llama-34b

CodeLlama-34B‌是由Meta开源的基于Llama2的大型语言模型，专门针对代码生成与理解任务进行优