llama-2-7b
Llama模型
Llama-2-7B 是由 Meta(原 Facebook)于 2023 年发布的 LLaMA-2 系列 中的中型开源大语言模型,拥有 70 亿参数(7B),在性能与资源消耗之间取得了良好平衡,适用于研究、商业应用及边缘设备部署。
核心特性
模型规模:70 亿参数,适合在资源受限环境(如单卡 GPU 或 NPU)中运行。
架构:基于 Transformer Decoder-only 结构,采用 分组查询注意力(GQA),提升推理效率。
训练数据:使用约 2 万亿 tokens 的多语言公开语料(截止 2022 年 9 月),涵盖英文、中文、编程语言等。
支持场景:
预训练模型(基础版)
对话优化版(Llama-2-7b-chat)
许可协议:可免费用于研究和商业用途,但月活超 7 亿的企业需申请授权 。
量化支持:提供 FP16、INT8 甚至 4-bit 量化版本,便于低显存设备部署 。
性能表现(基准测试)
| Llama-2-7B | ~44.5% | ~33.0% | ~49.5% (单次生成) | 97.7% (潜力,需优化) 7 |
| Xwin-Math-7B(微调版) | - | - | 82.6% | - 7 |
免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能
免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能
Llama模型推荐
llama-3-70b
Llama-3-70B是由Meta(原Facebook)于2024年4月18日发布的开源大语言模型(LLM),属于L
llama-2-7b
Llama-2-7B是由Meta(原Facebook)于2023年发布的LLaMA-2系列中的中型开源大语言模型
llama-2-70b
Llama-2-70B是由Meta(原Facebook)于2023年7月发布的开源大语言模型,属于Llama2系列中参
llama-2-13b
Llama-2-13B是由Meta(原Facebook)于2023年发布的开源大语言模型,属于Llama-2系列中的中
code-llama-7b
CodeLlama7B是由Meta公司开发的CodeLlama系列中的一种开源大型语言模型,专门用于代码生成与
code-llama-13b
CodeLlama-13B是由Meta公司开发的CodeLlama系列中的一种大型语言模型,专门用于代码生成与理
code-llama-34b
CodeLlama-34B是由Meta开源的基于Llama2的大型语言模型,专门针对代码生成与理解任务进行优