Brauche ich eine GPU?

Für kleine Modelle (bis ca. 7B Parameter) läuft der Betrieb auch auf moderner CPU-Hardware akzeptabel – für interne Tools mit überschaubarer Last oft ausreichend. Für flüssigen Produktionsbetrieb, größere Modelle oder höhere Nutzerzahlen empfehlen wir GPU-Hardware. Wir beraten Sie je nach konkretem Anwendungsfall.

Wie viel RAM wird benötigt?

Das hängt stark von der Modellgröße ab. Als grobe Orientierung: Ein 7B-Modell in quantisierter Form (4-Bit) benötigt ca. 4–6 GB RAM. Ein 13B-Modell ca. 8–10 GB, ein 70B-Modell deutlich mehr. Für den produktiven Einsatz planen wir die Hardware gemeinsam mit Ihnen nach den konkreten Anforderungen.

Wie groß sind die Modelldateien?

Je nach Modell und Quantisierung zwischen 2 GB (sehr kleine Modelle) und 40+ GB (große Modelle in voller Präzision). Quantisierte Modelle (z.B. 4-Bit) sind deutlich kleiner und für die meisten Anwendungsfälle gut geeignet.

Ist der Betrieb auch komplett offline möglich?

Ja. Self-Hosted KI kann vollständig ohne Internetverbindung betrieben werden (Air-Gapped). Einmal installiert, benötigt das System keine externe Verbindung. Das ist besonders relevant für Kanzleien, Praxen und andere Organisationen mit besonders schützenswerten Daten.

Was kostet das?

Das hängt vom gewählten Betriebsmodell ab. On-Premise beim Kunden hat einmalige Einrichtungskosten und dann planbare Wartungskosten. Managed Hosting hat monatliche Betriebskosten, dafür keine eigene Hardware. Wir besprechen das gerne konkret in einem ersten Gespräch.

Ist das wirklich DSGVO-konform?

Ja – unter der Voraussetzung, dass die KI auf deutschen oder europäischen Servern läuft und Daten die vereinbarte Infrastruktur nicht verlassen. Wir betreiben ausschließlich in Deutschland oder On-Premise beim Kunden. Ein Auftragsverarbeitungsvertrag (AVV) kann abgeschlossen werden.

Noch offene Fragen?

Sprechen Sie mit uns – wir beantworten gerne auch technischere Fragen direkt.

Direkter Kontakt – ohne Umwege. Wir melden uns innerhalb eines Werktages.