llama-4-scout

Llama模型

字体：大中小

Llama 4 Scout 是 Meta 推出的 Llama 4 系列中首款面向高效部署的多模态大语言模型，定位为“轻量级但高性能”的通用 AI 助手，在保持强大能力的同时显著降低硬件门槛。

核心特性

‌混合专家架构（MoE）‌

采用 Mixture-of-Experts（MoE）架构，总参数量达 1090 亿（109B），但每次推理仅激活 170 亿（17B）参数，分布在 16 个专家模块中。
这种设计大幅提升了计算效率，使模型能在资源受限环境下高效运行。

‌行业领先的上下文长度‌

支持高达 ‌1000 万 token‌ 的输入上下文窗口，是当前业界最长之一，远超 Llama 3 的 128K 和多数主流模型。
可用于多文档摘要、超长代码库分析、个性化用户行为追踪等需要处理海量信息的场景。

‌原生多模态能力‌

支持文本与图像联合输入，采用“早期融合”（early fusion）技术，在模型底层实现图文统一理解。
能处理单次提示中最多 5 张图像，适用于视觉问答、图文推理等任务。

‌训练与数据‌

预训练数据约 40 万亿 token，涵盖公开文本、授权数据及 Meta 自身产品（如 Facebook、Instagram）中的用户互动内容。
知识截止时间约为 2024 年 8 月。

‌部署友好性‌

经过 int4 量化后可运行于单块 NVIDIA H100 GPU，极大降低了部署成本和门槛。
支持在 Azure AI、Cloudflare Workers AI、Hugging Face、ModelScope 等平台直接调用或下载部署。

‌性能表现‌

在多项基准测试中超越 Gemma 3、Gemini 2.0 Flash-Lite 和 Mistral 3.1。
尤其擅长长文本摘要、代码推理、个性化响应生成等任务。

‌多语言支持‌

支持阿拉伯语、英语、法语、德语、印地语、印尼语、意大利语、葡萄牙语、西班牙语、他加禄语、泰语和越南语等 12 种语言。

立即使用大模型

免费体验最新的AI大模型，支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型，支持对话、写作、编程、图像、视频等多种功能

Llama模型推荐

llama-4-scout-17b-16e-instruct

Llama-4-Scout-17B-16E-Instruct是Meta推出的Llama4系列中首款高效多模态大语言模型，专为高

llama-4-scout

Llama4Scout是Meta推出的Llama4系列中首款面向高效部署的多模态大语言模型，定位为“轻量级但

llama-3.3-70b-instruct-fp8-fas

Llama3.3-70B-Instruct-FP8-Fast是Meta推出的Llama3.3系列中一个经过优化的指令微调版本，专

llama-3.2-90b-vision-instruct

‌Llama-3.2-90B-Vision-Instruct‌是Meta于2024年9月发布的Llama3.2系列中最大、最强大的多

llama-3.2-3b-instruct

‌Llama-3.2-3B-Instruct‌是Meta推出的Llama3.2系列中的一款轻量级、指令微调的纯文本大语

llama-3.1-8b-instruct

Llama-3.1-8B-Instruct‌是由Meta于‌2024年7月23日‌发布的Llama3.1系列中的一个开源大语言

llama-3.1-405b

‌Llama-3.1-405B‌是由Meta（原Facebook）于‌2024年7月23日‌正式发布的开源大语言模型，属于

llama-3-sonar-small-32k-online

llama-3-sonar-small-32k-online是由PerplexityAI提供的一种基于Meta的Llama3系列的大型语言