Question 1

Was ist der Unterschied zwischen Cloud GPU und GPU Server?

Accepted Answer

Cloud GPU bietet virtuelle GPU-Instanzen (vGPU), die flexibel skaliert werden können — ideal für variable Workloads. GPU Server sind dedizierte physische Server mit fest zugewiesenen GPUs — optimal für dauerhaftes Training mit maximaler Performance.

Question 2

Welche GPU-Modelle stehen zur Verfügung?

Accepted Answer

Wir bieten vier NVIDIA-GPU-Klassen an: Tesla T4 (16 GB GDDR6) als kosteneffiziente Einstiegs-GPU, A10 (24 GB GDDR6) als Allrounder, A100 (80 GB HBM2e) für anspruchsvolle KI-Workloads und H200 (141 GB HBM3e) für maximale KI-Performance. Jede GPU kann in verschiedene Profile aufgeteilt werden — von kleinen Slices für Inferenz bis zur vollen GPU für Training.

Question 3

Was ist der Unterschied zwischen T4, A10 und A100?

Accepted Answer

Die Tesla T4 (Turing, 8,1 TFLOPS FP32) ist ideal für kosteneffiziente Inferenz, VDI und leichte ML-Workloads. Die A10 (Ampere, 31,2 TFLOPS FP32) ist ein Allrounder für ML-Training, 3D-Rendering und Virtual Desktops. Die A100 (Ampere, 80 GB HBM2e, 312 TFLOPS FP16 Tensor) bietet MIG-Isolation für anspruchsvolle KI-Workloads. Die H200 (Hopper, 141 GB HBM3e, 989 TFLOPS FP16 Tensor) liefert maximale Performance für LLM-Training und große Foundation Models.

Question 4

Was bedeutet vGPU?

Accepted Answer

vGPU (Virtual GPU) ermöglicht es, eine physische GPU in mehrere virtuelle Instanzen aufzuteilen. Jede vGPU-Instanz erhält dedizierte GPU-Ressourcen und VRAM. So können Sie genau die GPU-Leistung buchen, die Sie benötigen — ohne eine komplette GPU mieten zu müssen.

Question 5

Welche Frameworks werden unterstützt?

Accepted Answer

Volle Unterstützung für CUDA, cuDNN und TensorRT. Kompatibel mit allen gängigen ML-Frameworks wie PyTorch, TensorFlow, JAX und ONNX Runtime. Wir stellen vorkonfigurierte Container-Images bereit.

Question 6

Kann ich Cloud GPU mit Bare Metal kombinieren?

Accepted Answer

Ja, über Direct Connect können Sie Cloud-GPU-Instanzen nahtlos mit Ihren Bare-Metal-Servern und Colocation-Hardware verbinden — ideal für hybride KI-Pipelines.

Question 7

Wie wird abgerechnet?

Accepted Answer

Alle Ressourcen werden monatlich abgerechnet. Sie konfigurieren vGPU, vCores, RAM und Storage individuell und zahlen nur, was Sie nutzen. Keine Mindestvertragslaufzeit.

Question 8

Was sind Egress-Kosten?

Accepted Answer

Egress-Kosten sind Gebühren, die Cloud-Anbieter für ausgehenden Datenverkehr berechnen — also für Daten, die das Rechenzentrum in Richtung Internet oder andere Netzwerke verlassen. Jede API-Antwort, jeder Download, jeder Video-Stream und jede Backup-Replikation erzeugt Egress-Traffic. Die meisten Hyperscaler berechnen diese Kosten pro GB, was schnell zu einem erheblichen und schwer kalkulierbaren Kostenfaktor werden kann. Besonders bei datenintensiven Anwendungen summieren sich diese Gebühren rapide.

Question 9

Berechnet INGATE Egress-Kosten?

Accepted Answer

Nein. Bei INGATE ist der ausgehende Datenverkehr bereits im Preis enthalten — keine Gebühren pro GB, keine versteckten Aufschläge. Das macht Ihre Kosten vollständig planbar und transparent. Gerade bei datenintensiven Anwendungen wie CDN, Streaming, großen APIs oder Backup-Replikation ergibt sich dadurch ein massiver Kostenvorteil gegenüber den großen Hyperscalern.

Question 10

Wie hoch sind Egress-Kosten bei Hyperscalern?

Accepted Answer

AWS berechnet ca. $0,09/GB (erste 10 TB), Azure ca. $0,087/GB und Google Cloud ca. $0,12/GB. Ein Unternehmen, das 10 TB pro Monat überträgt, zahlt allein für ausgehenden Traffic ca. $900–1.200/Monat. Bei 100 TB sind es bereits $8.000–9.000+/Monat. Diese Kosten sind schwer vorhersehbar, da sie von Nutzerverhalten, API-Aufrufvolumen und Traffic-Mustern abhängen — was die TCO-Kalkulation erschwert und häufig zu unerwartet hohen Rechnungen führt (sog. „Bill Shock“). Bei INGATE ist Traffic inklusive, wodurch die Gesamtkosten von Tag eins an vollständig kalkulierbar sind.

GPU / Profil	VRAM	FP32	Preis / Monat
Tesla T4 — T4-4Q	4 GB GDDR6	2,0 TFLOPS	€ 69,00
Tesla T4 — T4-8Q	8 GB GDDR6	4,1 TFLOPS	€ 129,00
Tesla T4 — T4-16Q	16 GB GDDR6	8,1 TFLOPS	€ 249,00
NVIDIA A10 — A10-4Q	4 GB GDDR6	5,2 TFLOPS	€ 99,00
NVIDIA A10 — A10-8Q	8 GB GDDR6	10,4 TFLOPS	€ 189,00
NVIDIA A10 — A10-12Q	12 GB GDDR6	15,6 TFLOPS	€ 279,00
NVIDIA A10 — A10-24Q	24 GB GDDR6	31,2 TFLOPS	€ 549,00
NVIDIA A100 — 1g.10gb	10 GB HBM2e	2,8 TFLOPS	€ 179,00
NVIDIA A100 — 2g.20gb	20 GB HBM2e	5,6 TFLOPS	€ 349,00
NVIDIA A100 — 3g.40gb	40 GB HBM2e	8,4 TFLOPS	€ 529,00
NVIDIA A100 — 7g.80gb	80 GB HBM2e	19,5 TFLOPS	€ 999,00
NVIDIA H200 — 1g.20gb	20 GB HBM3e	9,6 TFLOPS	€ 349,00
NVIDIA H200 — 2g.40gb	40 GB HBM3e	19,1 TFLOPS	€ 679,00
NVIDIA H200 — 3g.70gb	70 GB HBM3e	28,7 TFLOPS	€ 999,00
NVIDIA H200 — 7g.141gb	141 GB HBM3e	67,0 TFLOPS	€ 1.899,00

GPU Cloud

GPU Server konfigurieren

Angebot anfordern

GPU-Modell

vGPU-Profil

Dedizierte vCores

RAM

NVMe Storage

Service-Level-Vereinbarung

GPU-Preise

Dedizierte GPU-Leistung — volle Kontrolle

Weitere Leistungen

Flexible GPU-Skalierung

CUDA-Ökosystem

Datensouveränität

Direct Connect

INGATE Premium Support

Container-Ready

Technische Highlights

Redundante Stromversorgung

Hocheffiziente Kühlung

Brandschutz

High-Speed Backbone

Physische Sicherheit

Nachhaltigkeit

Zertifizierte Rechenzentren

Häufig gestellte Fragen

Technologie-Partner & Mitgliedschaften