Question 1

Brauche ich eine GPU?

Accepted Answer

Für kleine Modelle (bis ca. 7B Parameter) läuft der Betrieb auch auf moderner CPU-Hardware akzeptabel – für interne Tools mit überschaubarer Last oft ausreichend. Für flüssigen Produktionsbetrieb, größere Modelle oder höhere Nutzerzahlen empfehlen wir GPU-Hardware.

Question 2

Wie viel RAM wird benötigt?

Accepted Answer

Das hängt stark von der Modellgröße ab. Ein 7B-Modell in quantisierter Form (4-Bit) benötigt ca. 4–6 GB RAM. Ein 13B-Modell ca. 8–10 GB, ein 70B-Modell deutlich mehr.

Question 3

Wie groß sind die Modelldateien?

Accepted Answer

Je nach Modell und Quantisierung zwischen 2 GB (sehr kleine Modelle) und 40+ GB (große Modelle in voller Präzision). Quantisierte Modelle (z.B. 4-Bit) sind deutlich kleiner und für die meisten Anwendungsfälle gut geeignet.

Question 4

Ist der Betrieb auch komplett offline möglich?

Accepted Answer

Ja. Self-Hosted KI kann vollständig ohne Internetverbindung betrieben werden (Air-Gapped). Einmal installiert, benötigt das System keine externe Verbindung.

Question 5

Was kostet das?

Accepted Answer

Das hängt vom gewählten Betriebsmodell ab. On-Premise hat einmalige Einrichtungskosten und planbare Wartungskosten. Managed Hosting hat monatliche Betriebskosten, dafür keine eigene Hardware.

Question 6

Ist das wirklich DSGVO-konform?

Accepted Answer

Ja – unter der Voraussetzung, dass die KI auf deutschen oder europäischen Servern läuft und Daten die vereinbarte Infrastruktur nicht verlassen. Wir betreiben ausschließlich in Deutschland oder On-Premise beim Kunden.

Häufige Fragen zu Self-Hosted KI.

Noch offene Fragen?