Ollama Installation auf Windows: Komplette Anleitung 2026

Die Ollama Installation auf Windows ist einfacher als viele denken und öffnet die Tür zu leistungsstarken KI-Sprachmodellen, die vollständig lokal auf dem eigenen PC laufen. Kein Cloud-Abo, keine Datenweitergabe, keine laufenden Kosten: Wer einmal die Ollama Installation abgeschlossen hat, kann Modelle wie Llama 3, Mistral, DeepSeek oder Gemma direkt auf seinem Rechner starten. Diese Anleitung erklärt Schritt für Schritt, wie die Ollama Installation unter Windows funktioniert, welche Modelle sich empfehlen und wie man sie im Alltag verwendet. Weitere Technik-Anleitungen finden Sie in unserem Ratgeber.
Was ist Ollama? Lokale KI auf dem eigenen PC
Ollama ist ein quelloffenes Werkzeug, das es ermöglicht, große Sprachmodelle (LLMs) auf dem eigenen Computer zu betreiben, ohne Internetzugang, ohne Cloud-Dienst und ohne monatliche Gebühren. Das Projekt wird aktiv weiterentwickelt und unterstützt Windows, macOS und Linux. Die Ollama Installation richtet einen lokalen Server ein, der über eine einfache Kommandozeilen-Schnittstelle und eine REST-API angesprochen werden kann. Mit über 500 verfügbaren Modellen und einer wachsenden Entwickler-Community ist Ollama heute das meistgenutzte Tool für lokale KI-Modelle weltweit.
Warum Ollama statt Cloud-KI?
Während Dienste wie ChatGPT oder Claude Anfragen an externe Server schicken, bleiben bei Ollama alle Daten lokal. Das hat mehrere Vorteile: Datenschutz (keine Daten verlassen den eigenen PC), Offline-Nutzung (kein Internet nötig nach dem Download), keine Kosten nach der einmaligen Einrichtung und volle Kontrolle über das verwendete Modell. Wer beruflich mit sensiblen Daten arbeitet, profitiert besonders von der lokalen Ollama Installation. Anwälte, Ärzte oder Buchhalter können Dokumente analysieren lassen, ohne dass ein einziges Zeichen an externe Dienste übertragen wird. Auch Programmierer, die Code-Assistenten wie Copilot kennen, schätzen die Möglichkeit, eine vollständig private Alternative auf dem eigenen Rechner zu betreiben. Was große Sprachmodelle sind, erklärt Wikipedia ausführlich. Mehr über KI-Tools im Alltag finden Sie bei uns.
Systemvoraussetzungen für die Ollama Installation
Bevor mit der Ollama Installation begonnen wird, sollte sichergestellt sein, dass der PC die Mindestanforderungen erfüllt. Ollama läuft auch auf reiner CPU, profitiert aber stark von einer modernen Grafikkarte. Eine GPU mit ausreichend VRAM beschleunigt die Antwortgenerierung der Modelle erheblich und macht den Unterschied zwischen einem langsamen Tipp-Erlebnis und flüssigen, schnellen Antworten.
Windows-Anforderungen
Die offiziellen Mindestanforderungen für die Ollama Installation auf Windows:
- Betriebssystem: Windows 10 (Version 22H2 oder neuer) oder Windows 11, Home oder Pro
- Speicherplatz: Mindestens 4 GB für die Ollama Installation selbst, plus Speicher für die Modelle (je nach Modell 2 bis 40 GB)
- RAM: Mindestens 8 GB empfohlen, 16 GB für komfortables Arbeiten mit 7B-Modellen
- Internet: Nur zum Herunterladen der Modelle erforderlich, danach vollständig offline nutzbar
GPU-Unterstützung
Ollama nutzt die Grafikkarte für deutlich schnellere Inferenz. Die Ollama Installation erkennt unterstützte GPUs automatisch:
- NVIDIA: Treiber Version 452.39 oder neuer erforderlich. Empfohlen: GeForce RTX 3000er-Serie oder neuer mit mindestens 8 GB VRAM
- AMD Radeon: ROCm v7-fähige Treiber oder Vulkan-fähige AMD-Radeon-Treiber. Hinweis: RDNA2/RX-6000-Karten nutzen unter Windows Vulkan als Standard
- Ohne GPU: Reine CPU-Nutzung ist möglich, aber deutlich langsamer. Für kleine Modelle (1,5B bis 3B Parameter) noch gut brauchbar
Mit dem Befehl ollama ps kann nach der Ollama Installation jederzeit überprüft werden, ob ein laufendes Modell die GPU oder die CPU nutzt. Wer keine dedizierte Grafikkarte besitzt, kann Ollama trotzdem sinnvoll einsetzen: Für einfache Textaufgaben, Zusammenfassungen oder schnelle Fragen reichen auch kleine Modelle auf der CPU völlig aus. Hardware-Empfehlungen für KI-Anwendungen stellen wir auch in unserem Guide vor.
Ollama Installation auf Windows: Schritt für Schritt
Die Ollama Installation unter Windows dauert nur wenige Minuten. Es gibt zwei Wege: der klassische Installer und die PowerShell-Methode.
Methode 1: Installer herunterladen
Der einfachste Weg für die Ollama Installation ist der direkte Download des Installers:
- Die offizielle Website ollama.com aufrufen und auf Download for Windows klicken
- Die Datei
OllamaSetup.exewird heruntergeladen - Doppelklick auf
OllamaSetup.exeund den Anweisungen folgen - Die Ollama Installation benötigt keine Administratorrechte und installiert sich ins Benutzerverzeichnis
- Nach Abschluss läuft Ollama automatisch im Hintergrund als Windows-Dienst
Nach der Ollama Installation erscheint das Ollama-Symbol in der Windows-Taskleiste (System Tray). Die API ist ab sofort unter http://localhost:11434 erreichbar. Ein Klick auf das Symbol öffnet ein kleines Menü, über das der Dienst gestoppt, neugestartet oder nach Updates gesucht werden kann. Ollama aktualisiert sich unter Windows automatisch im Hintergrund, sodass stets die neueste Version mit allen Sicherheits- und Leistungsverbesserungen läuft.
Methode 2: PowerShell-Installation
Alternativ lässt sich die Ollama Installation direkt über PowerShell durchführen. Dafür PowerShell als Administrator öffnen und folgenden Befehl eingeben:
irm https://ollama.com/install.ps1 | iexEine weitere Option ist die Installation über den Windows-Paketmanager winget. Dieser ist ab Windows 10 standardmäßig verfügbar und erlaubt die Ollama Installation mit einem einzigen Befehl:
winget install Ollama.OllamaDer Vorteil der winget-Methode liegt darin, dass spätere Updates ebenfalls automatisiert durchgeführt werden können: winget upgrade Ollama.Ollama bringt Ollama stets auf den neuesten Stand.
Installationsverzeichnisse unter Windows
Nach der Ollama Installation legt das Programm folgende Verzeichnisse an:
%HOMEPATH%\.ollama— Modelle und Konfiguration (Standardspeicherort)%LOCALAPPDATA%\Ollama— Logs und automatische Updates%LOCALAPPDATA%\Programs\Ollama— Programmdateien
Ollama Installation: Modelle herunterladen und starten
Nach der erfolgreichen Ollama Installation wird die Windows-Eingabeaufforderung (cmd), PowerShell oder das Windows-Terminal geöffnet. Modelle werden mit dem Befehl ollama pull heruntergeladen oder direkt mit ollama run gestartet und bei Bedarf automatisch geladen. Wichtig: Beim ersten Start eines Modells ist eine Internetverbindung zwingend erforderlich, da das Modell heruntergeladen werden muss. Nach dem Download ist kein Internet mehr nötig.
Erstes Modell herunterladen
Um zum Beispiel das beliebte Llama 3.2-Modell (3B Parameter, ca. 2 GB) zu starten, reicht folgender Befehl:
ollama run llama3.2Ollama prüft automatisch, ob das Modell bereits lokal vorhanden ist, und lädt es andernfalls herunter. Der Download läuft im Terminal mit einer Fortschrittsanzeige. Danach öffnet sich direkt der interaktive Chat-Modus, in dem Fragen eingegeben werden können. Mit Strg+D oder dem Befehl /bye wird der Chat beendet, das Modell bleibt jedoch noch 5 Minuten im RAM geladen.
Modelle vorab separat herunterladen
Wer ein Modell nur herunterladen, aber noch nicht starten möchte, nutzt ollama pull:
ollama pull mistralDas ist besonders nützlich, wenn mehrere Modelle auf einmal vorbereitet werden sollen. Über ollama.com/library sind aktuell über 500 Modelle verfügbar, darunter spezialisierte Varianten für Code-Generierung (qwen2.5-coder), Bildverarbeitung (llava) oder mathematisches Denken (deepseek-r1). Bestimmte Modelle gibt es in verschiedenen Quantisierungsstufen, zum Beispiel llama3.1:8b-q4_K_M. Die Standard-Quantisierung Q4_K_M bietet dabei die beste Balance zwischen Modellgröße und Antwortqualität und wird für die meisten Anwendungsfälle empfohlen. Modelle im Vergleich stellen wir auch in einem separaten Guide vor.
„Ollama macht lokale KI so zugänglich wie nie zuvor: Ein einziger Befehl genügt, um ein leistungsstarkes Sprachmodell auf dem eigenen PC zu starten." (KI-Entwickler-Community)
Populäre Modelle nach der Ollama Installation im Überblick
Nach der Ollama Installation stellt sich die Frage, welches Modell für welchen Einsatzzweck geeignet ist. Die folgende Tabelle gibt einen Überblick über die beliebtesten Modelle und ihre Stärken.
Modelle im Vergleich: Empfehlungen nach Hardware
| Modell | Größe | VRAM empfohlen | Stärken | Ollama-Befehl |
|---|---|---|---|---|
| Llama 3.2 (3B) | ca. 2 GB | 4 GB / CPU | Schnell, für schwache Hardware | ollama run llama3.2 |
| Llama 3.1 (8B) | ca. 5 GB | 8 GB VRAM | Vielseitig, gute Qualität | ollama run llama3.1 |
| Mistral (7B) | ca. 4 GB | 6 GB VRAM | Code, schnelle Antworten | ollama run mistral |
| Gemma 3 (4B) | ca. 3 GB | 4 GB VRAM | Effizient, von Google | ollama run gemma3:4b |
| DeepSeek-R1 (7B) | ca. 4 GB | 8 GB VRAM | Logik, Mathematik, Analyse | ollama run deepseek-r1:7b |
| Qwen 2.5 (7B) | ca. 4 GB | 6 GB VRAM | Mehrsprachig, langer Kontext | ollama run qwen2.5:7b |
Modell-Empfehlung für schwache Hardware
Wer einen älteren PC ohne dedizierte GPU oder mit wenig RAM hat, sollte nach der Ollama Installation zunächst kleine Modelle wie Llama 3.2 (3B), Gemma 3 (2B) oder Qwen 2.5 (0.5B) testen. Diese laufen auch auf reiner CPU mit 8 GB RAM noch brauchbar schnell. KI auf älteren PCs nutzen erklärt unser Technik-Guide.

Alle wichtigen Ollama-Befehle im Überblick
Nach der Ollama Installation stehen folgende Befehle in der Kommandozeile zur Verfügung. Sie werden in cmd, PowerShell oder dem Windows-Terminal eingegeben. Das Windows-Terminal (kostenlos im Microsoft Store) ist dabei die komfortabelste Option, da es Tabs, Farbcodierung und einen modernen Look bietet. Alle Ollama-Befehle sind identisch, egal welches Terminal verwendet wird.
Modelle verwalten
ollama list: Zeigt alle lokal gespeicherten Modelle mit Name, Größe und Erstellungsdatumollama pull llama3.1: Lädt ein Modell herunter, ohne es zu startenollama rm mistral: Löscht ein Modell und gibt den Speicherplatz freiollama show llama3.1: Zeigt Details zu einem Modell (Parameter, Lizenz, Beschreibung)ollama cp llama3.1 mein-assistent: Kopiert ein Modell unter einem neuen Namen, zum Beispiel für eigene Anpassungen
Modelle ausführen und steuern
ollama run llama3.1: Startet den interaktiven Chat-Modusollama run llama3.1 "Erkläre mir Python": Einzelne Anfrage direkt aus der Kommandozeileollama ps: Zeigt alle aktuell laufenden Modelle und ob GPU oder CPU genutzt wirdollama stop llama3.1: Entlädt ein Modell aus dem RAMollama serve: Startet den Ollama-Server manuell, falls er nicht automatisch läuft
Modell-Speicherort anpassen (OLLAMA_MODELS)
Standardmäßig speichert Ollama alle Modelle in %HOMEPATH%\.ollama\models. Wer Modelle auf einem anderen Laufwerk (z. B. einer schnellen SSD mit mehr Platz) speichern möchte, setzt nach der Ollama Installation die Umgebungsvariable OLLAMA_MODELS. Dazu unter Windows die Systemsteuerung öffnen, nach „Umgebungsvariablen" suchen und eine neue Benutzervariable anlegen:
Variable: OLLAMA_MODELS Wert: D:\OllamaModelsNach einem Neustart des Ollama-Dienstes werden alle neuen Modelle automatisch im angegebenen Verzeichnis gespeichert. Bereits heruntergeladene Modelle können manuell in den neuen Pfad verschoben werden. Windows-Einstellungen für Technik-Nutzer erklärt unser Guide.
Ollama Installation und die REST API nutzen
Ein großer Vorteil der Ollama Installation ist die eingebaute REST API, die auf http://localhost:11434 läuft. Dadurch kann Ollama von eigenen Skripten, Anwendungen oder Tools wie Open WebUI angesprochen werden. Die API ist vollständig mit der OpenAI-API kompatibel, was die Integration in bestehende Projekte besonders einfach macht.
API-Anfrage mit PowerShell
Eine einfache Testanfrage an die Ollama API direkt aus PowerShell nach der Ollama Installation:
Invoke-WebRequest -Uri "http://localhost:11434/api/generate" ` -Method POST ` -ContentType "application/json" ` -Body '{"model":"llama3.2","prompt":"Hallo, wer bist du?","stream":false}' | Select-Object -ExpandProperty ContentDie Antwort kommt als JSON zurück. Für Python-Entwickler ist das Paket ollama (via pip install ollama) der bequemste Weg, um nach der Ollama Installation Modelle direkt in eigenen Skripten zu nutzen. Python für KI-Einsteiger stellen wir in einem eigenen Artikel vor.
Open WebUI: Grafische Oberfläche für Ollama
Wer nach der Ollama Installation keine Kommandozeile nutzen möchte, kann Open WebUI installieren, eine grafische Chat-Oberfläche im Stil von ChatGPT, die direkt im Browser läuft. Open WebUI verbindet sich automatisch mit der Ollama API auf localhost:11434 und erlaubt das Wechseln zwischen Modellen, das Verwalten von Chat-Verläufen und das Hochladen von Dokumenten zur Analyse. Die Installation von Open WebUI erfolgt über Docker Desktop für Windows und dauert ebenfalls nur wenige Minuten. Mit dieser Kombination hat man nach der Ollama Installation einen vollwertigen, privaten KI-Assistenten, der optisch keinen Unterschied zu kommerziellen Diensten macht. Open WebUI einrichten erklärt unser weiterführender Guide.
Häufige Fragen zur Ollama Installation
Benötigt die Ollama Installation Administratorrechte?
Nein. Die Ollama Installation mit OllamaSetup.exe benötigt keine Administratorrechte und installiert sich vollständig im Benutzerverzeichnis. Das macht die Ollama Installation besonders interessant für Nutzer in Unternehmensumgebungen, wo Adminrechte oft eingeschränkt sind. Lediglich bestimmte Netzwerkkonfigurationen, das Freischalten der API für andere Geräte im lokalen Netzwerk oder das manuelle Einrichten von Systemumgebungsvariablen erfordern gelegentlich erhöhte Rechte. Software ohne Adminrechte installieren erklärt unser Ratgeber.
Wie viel Speicher brauche ich nach der Ollama Installation für Modelle?
Das hängt stark vom gewählten Modell ab. Kleine Modelle wie Llama 3.2 (3B) benötigen rund 2 GB, mittelgroße wie Llama 3.1 (8B) oder Mistral (7B) etwa 4 bis 5 GB, und große Modelle (70B) können 40 GB und mehr belegen. Ollama speichert Modelle standardmäßig in %HOMEPATH%\.ollama\models, was bei mehreren installierten Modellen schnell viel Platz auf dem Systemlaufwerk belegen kann. Es empfiehlt sich daher, nach der Ollama Installation früh die Umgebungsvariable OLLAMA_MODELS auf ein Laufwerk mit ausreichend Platz zu setzen. Für einen komfortablen Start empfiehlt sich ein freier Speicherplatz von mindestens 20 GB. Speicherplatz optimal verwalten erklärt unser Guide.
Läuft Ollama nach der Installation automatisch beim Windows-Start?
Ja. Nach der Ollama Installation trägt sich der Dienst als Autostart-Eintrag in Windows ein. Das Ollama-Symbol erscheint beim Systemstart automatisch in der Taskleiste. Wenn Ollama nicht automatisch gestartet werden soll, kann der Autostart-Eintrag über den Windows-Taskmanager (Reiter „Autostart") oder über die Windows-Einstellungen unter „Apps" deaktiviert werden. Ollama lässt sich danach jederzeit manuell über die Anwendung oder mit dem Befehl ollama serve starten.
Kann ich nach der Ollama Installation mehrere Modelle gleichzeitig nutzen?
Ollama lädt standardmäßig das zuletzt gestartete Modell in den Speicher und entlädt inaktive Modelle nach 5 Minuten automatisch. Mit der Umgebungsvariable OLLAMA_MAX_LOADED_MODELS kann nach der Ollama Installation eingestellt werden, wie viele Modelle gleichzeitig im RAM bleiben sollen. Das macht besonders Sinn, wenn genug VRAM oder RAM vorhanden ist. Ollama konfigurieren und optimieren erklärt ein eigener Ratgeber.
Die Ollama Installation auf Windows ist in wenigen Minuten erledigt und gibt sofortigen Zugang zu hunderten leistungsstarker KI-Modelle, die vollständig lokal und ohne laufende Kosten laufen. Von der einfachen Textgenerierung bis zur Code-Analyse, vom mehrsprachigen Assistenten bis zum Reasoning-Modell für komplexe Aufgaben: Die Vielfalt der verfügbaren Modelle macht Ollama zum idealen Einstieg in die Welt der lokalen KI. Die aktive Community rund um Ollama sorgt dafür, dass neue Modelle schnell verfügbar werden und das Programm selbst stetig verbessert wird. Wer die Ollama Installation einmal durchgeführt hat, wird schnell merken, wie viel Potenzial auf dem eigenen PC schlummert, und nie wieder auf den Datenschutz beim Umgang mit KI verzichten wollen. Alle KI-Anleitungen finden Sie gesammelt in unserem Technik-Bereich. KI im Alltag einsetzen erklärt unser weiterführender Guide.