Llama 4
Beschreibung: Metas neueste Open-Source LLM-Generation mit nativ multimodalen Fähigkeiten
Website: https://llama.meta.com
Llama 4 wurde am 5. April 2025 von Meta veröffentlicht und ist die vierte Generation der Llama-Familie. Es ist das erste Llama-Modell mit Mixture-of-Experts (MoE) Architektur und nativer Multimodalität.
Modell-Varianten
-
Llama 4 Scout: 17B aktive Parameter (16 Experts), bestes multimodales Modell seiner Klasse, passt auf eine H100 GPU, unterstützt 10M Token Context (längster der Branche)
-
Llama 4 Maverick: 17B aktive Parameter (128 Experts), übertrifft GPT-4o und Gemini 2.0 Flash in vielen Benchmarks
-
Llama 4 Behemoth Preview: 288B aktive Parameter (16 Experts), übertrifft GPT-4.5, Claude Sonnet 3.7 und Gemini 2.0 Pro
Features
- Nativ multimodal: Text, Bilder, Video
- Mixture-of-Experts Architektur
- Branchenführende Context-Windows
- Open Permissive License
Download
Verfügbar auf llama.com und Hugging Face. Kann lokal mit llama.cpp, Ollama, oder LM Studio ausgeführt werden.