llama-3-70b

Llama模型

字体:

‌Llama-3-70B‌ 是由 Meta(原 Facebook)于 ‌2024年4月18日‌ 发布的开源大语言模型(LLM),属于 Llama 3 系列中的 ‌700亿参数‌ 版本,是当时性能最强的开源模型之一,被广泛认为在多个基准测试中 ‌优于多数开源聊天模型‌,并 ‌接近或达到 GPT-3.5 水平,部分指标逼近 GPT-4‌ ‌。


核心特性

  • ‌参数规模‌:700亿(70B)参数

  • ‌架构‌:基于优化的自回归 Transformer 架构,采用 ‌分组查询注意力(GQA)‌ 提升推理效率与可扩展性 ‌

  • ‌训练数据‌:

    • 预训练使用 ‌超过15万亿 tokens‌ 的公开数据

    • 数据截止时间:‌2023年12月‌ ‌

    • 创新性地使用 Llama-2 对数据进行质量筛选,显著提升数据质量 ‌

  • ‌微调方法‌:

    • 采用 ‌监督微调(SFT) + 基于人类反馈的强化学习(RLHF)‌,对齐人类偏好,提升安全性与帮助性 ‌

  • ‌上下文长度‌:8K tokens ‌6

  • ‌输出类型‌:仅支持 ‌文本生成‌(包括代码)‌


立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能