GPT-OSS
Beschreibung: OpenAIs erste Open-Weight Modelle mit Reasoning-Fähigkeiten
Website: https://github.com/openai/gpt-oss
OpenAI veröffentlichte im August 2025 mit GPT-OSS seine ersten Open-Weight-Modelle. Diese sind speziell für Reasoning-Tasks optimiert und unter Apache 2.0 Lizenz verfügbar.
Modell-Varianten
-
gpt-oss-120b: 117B Parameter (5.1B aktiv), läuft auf einer 80GB GPU, erreicht nahezu GPT-o4-mini Performance
-
gpt-oss-20b: 21B Parameter (3.6B aktiv), benötigt nur 16GB Speicher, ideal für lokale Geräte und niedrige Latenz
Features
- Starke Reasoning- und Tool-Use-Fähigkeiten
- Vollständige Chain-of-Thought Erklärungen
- Konfigurierbarer Reasoning-Aufwand (low, medium, high)
- Function Calling und Structured Outputs
- Training informiert durch OpenAI o3
Performance
Übertreffen ähnlich große Open-Source-Modelle und teilweise sogar proprietäre Modelle wie GPT-4o in spezialisierten Benchmarks.
Installation
Läuft mit vLLM, Ollama, llama.cpp. Nicht über OpenAI API, sondern als lokales Download-Modell.