Llama 4

Beschreibung: Metas neueste Open-Source LLM-Generation mit nativ multimodalen Fähigkeiten

Llama 4 wurde am 5. April 2025 von Meta veröffentlicht und ist die vierte Generation der Llama-Familie. Es ist das erste Llama-Modell mit Mixture-of-Experts (MoE) Architektur und nativer Multimodalität.

Modell-Varianten

Llama 4 Scout: 17B aktive Parameter (16 Experts), bestes multimodales Modell seiner Klasse, passt auf eine H100 GPU, unterstützt 10M Token Context (längster der Branche)
Llama 4 Maverick: 17B aktive Parameter (128 Experts), übertrifft GPT-4o und Gemini 2.0 Flash in vielen Benchmarks
Llama 4 Behemoth Preview: 288B aktive Parameter (16 Experts), übertrifft GPT-4.5, Claude Sonnet 3.7 und Gemini 2.0 Pro

Features

Nativ multimodal: Text, Bilder, Video
Mixture-of-Experts Architektur
Branchenführende Context-Windows
Open Permissive License

Download

Verfügbar auf llama.com und Hugging Face. Kann lokal mit llama.cpp, Ollama, oder LM Studio ausgeführt werden.