llama-3.1-8b-instruct

Llama模型

字体：大中小

Llama-3.1-8B-Instruct‌ 是由 Meta 于 ‌2024年7月23日‌ 发布的 Llama 3.1 系列中的一个开源大语言模型，专为多语言对话和指令跟随任务优化。以下是其核心信息：

‌基本参数与能力‌

‌参数量‌：80亿（8B）
‌上下文长度‌：‌128K tokens‌（相比前代 Llama 3 的 8K 有显著提升）
‌训练数据量‌：约 ‌15万亿 tokens‌，知识截止至 ‌2023年12月‌
‌支持语言‌：英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语、泰语（共8种）
‌架构特点‌：

基于 ‌Transformer 架构‌
采用 ‌分组查询注意力（GQA）‌，提升长上下文推理效率
经过 ‌监督微调（SFT） + 基于人类反馈的强化学习（RLHF）‌ 优化

‌性能表现（与 Llama 3 8B Instruct 对比）‌

根据官方基准测试 ‌11：

‌MMLU（5-shot）‌：69.4 → 提升 0.9 分
‌HumanEval（代码生成）‌：72.6 pass@1（优于 GPT-3.5 Turbo）
‌工具调用（API-Bank）‌：82.6 acc（远超 Llama 3 的 48.3）
‌多语言 MGSM（CoT）‌：68.9（支持跨语言推理）

‌适用场景‌

多语言聊天助手
代码生成与理解
长文档摘要、问答
工具调用（Tool Use）与智能体（Agent）构建
可用于 ‌合成数据生成‌ 和 ‌模型蒸馏‌（Meta 允许通过 Llama 3.1 社区许可）

‌部署与硬件要求‌

‌推荐 GPU‌：RTX 3090/4090（24GB 显存）或 A100/V100
‌显存需求‌：

FP16：约 ‌16GB‌
4-bit 量化：可降至 ‌8GB 左右‌（支持在消费级显卡运行）‌10

‌推理加速框架‌：支持 ‌vLLM‌（吞吐量提升 14–24 倍）‌12、Hugging Face Transformers

立即使用大模型

免费体验最新的AI大模型，支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型，支持对话、写作、编程、图像、视频等多种功能

Llama模型推荐

llama-3.2-3b-instruct

‌Llama-3.2-3B-Instruct‌是Meta推出的Llama3.2系列中的一款轻量级、指令微调的纯文本大语

llama-3.1-8b-instruct

Llama-3.1-8B-Instruct‌是由Meta于‌2024年7月23日‌发布的Llama3.1系列中的一个开源大语言

llama-3.1-405b

‌Llama-3.1-405B‌是由Meta（原Facebook）于‌2024年7月23日‌正式发布的开源大语言模型，属于

llama-3-sonar-small-32k-online

llama-3-sonar-small-32k-online是由PerplexityAI提供的一种基于Meta的Llama3系列的大型语言

llama-3-sonar-small-32k-chat

‌Llama-3-Sonar-Small-32k-Chat‌是由PerplexityAI推出的基于MetaLlama-3系列的对话优化模

llama-3-sonar-large-32k-online

Llama-3-Sonar-Large-32k-Online是由PerplexityAI基于Meta的Llama-3系列模型进行优化和定制

llama-3-sonar-large-32k-chat

‌Llama-3-Sonar-Large-32k-Chat‌是由PerplexityAI基于Meta发布的Llama-3系列模型进行进一

llama-3-8b-instruct

Meta-Llama-3-8B-Instruct‌是由Meta于‌2024年4月18日‌发布的开源大语言模型（LLM）之一，属