Vergleich

Eldric im Vergleich.

Wie sich Eldric gegenüber den Werkzeugen schlägt, die Teams abwägen, wenn sie KI auf einer Infrastruktur betreiben wollen, die sie selbst kontrollieren — fünf selbst hostbare Plattformen (Ollama, vLLM, Open WebUI, Dify, NVIDIA NIM) und fünf Cloud-APIs (OpenAI, xAI Grok, Anthropic, AWS Bedrock, Oracle Cloud OCI Generative AI).


Die meisten dieser Werkzeuge sind hervorragend in dem, wofür sie gebaut wurden. Der ehrliche Unterschied liegt im Umfang: Eldric ist eine einzige selbst gehostete Plattform, die den vollständigen Stack mitbringt — ein dauerhaftes Gedächtnis als „Gehirn“, native Inferenz, Clustering mit Hochverfügbarkeit und Föderation, Agenten, Training, Routing, Medien- und Domänen-Worker — während eine Laufzeitumgebung, eine Chat-Oberfläche, ein App-Builder, ein Inferenz-Microservice oder eine Cloud-API jeweils nur eine Ebene abdecken.

Jede Wettbewerber-Zelle gibt die eigene öffentliche Dokumentation des Anbieters mit Stand Juni 2026 wieder, je Plattform unten als Quelle belegt. Wo eine Fähigkeit zwar vorhanden, aber enger gefasst ist, kennzeichnen wir sie mit Teilweise / Add-on / Verwaltet statt mit einem bloßen „Nein“. Auf Eldrics Seite führen wir nur Fähigkeiten auf, die heute ausgeliefert und produktiv sind — gegateter oder in Entwicklung befindlicher Arbeit (ein allgemeines physisches Weltmodell, die vollständige Netzwerk-Geräteflotte) lassen wir bewusst weg.

Fähigkeit Eldric Selbst hostbar Cloud-API (anbieter-gehostet)
Ollama vLLM Open WebUI Dify NVIDIA NIM OpenAI Grok Anthropic AWS Bedrock Oracle Cloud23
Gedächtnis & Lernen — das „Gehirn“
Dauerhaftes assoziatives Gedächtnis-Substrat Ja NeinNeinNein1Nein2Add-on3 n. z.n. z.Nein4Verwaltet5 Nein
Gedächtnis übersteht Neustarts dauerhaft Ja NeinNeinTeilweiseTeilweiseAdd-on n. z.n. z.n. z.Verwaltet n. z.
Offline-Gedächtnis-Konsolidierung („Träumen“) Ja NeinNeinNeinNeinNein NeinNeinNeinNein Nein
Modellwissen ins Gedächtnis destillieren Ja NeinNeinNeinNeinNein6 Teilweise7NeinNeinVerwaltet6 Nein
Inferenz & Modelle
Native Inferenz-Engine, ohne externes Backend Ja JaJaNeinNeinTeilweise8 n. z.n. z.n. z.n. z. Verwaltet
Strukturiertes ML jenseits von Chat-LLMs9 Ja9 NeinTeilweiseNeinNeinAdd-on NeinNeinNeinn. z. Nein
Bündelt viele Inferenz-Backends (ein Gateway) Ja NeinNeinJaJaTeilweise NeinNeinNeinTeilweise Teilweise
Hardware & Betriebsspektrum
Hardware-unabhängig (CPU · NVIDIA · Apple · AMD · ARM) Ja JaJaJaJaNur NVIDIA10 n. z.n. z.n. z.n. z. n. z.
Eine Plattform vom Pi/Edge bis zum Rechenzentrum/H200 Ja TeilweiseTeilweiseTeilweiseTeilweiseTeilweise10 n. z.n. z.n. z.n. z. n. z.
Läuft vollständig offline / air-gapped (netzgetrennt) Ja JaJaJaJaJa NeinNeinNeinNein Nein
Einzelne, eigenständige Installation (ein Daemon) Ja JaJaTeilweiseNein11Nein n. z.n. z.n. z.n. z. n. z.
Rollierende Cluster-Selbstaktualisierung / Patching Ja NeinNeinNeinNeinAdd-on VerwaltetVerwaltetVerwaltetVerwaltet Verwaltet
Clustering & Föderation
Verteiltes Clustering über mehrere Knoten Ja NeinJa12TeilweiseTeilweiseTeilweise n. z.n. z.n. z.Verwaltet Verwaltet
Controller-Hochverfügbarkeit / kein Single Point of Failure Ja13 NeinNeinTeilweiseNeinAdd-on n. z.n. z.n. z.Verwaltet Verwaltet
Standort-übergreifende Föderation (Zentrale + Niederlassung / Mesh) Ja14 NeinNeinNeinNeinAdd-on n. z.n. z.n. z.Verwaltet Verwaltet
Föderiertes Lernen (knotenübergreifend trainieren, Daten bleiben lokal) Ja NeinNeinNeinNeinAdd-on15 NeinNeinNeinNein Nein
Agenten, Geräte & Domänen
Multi-Agenten-Orchestrierung / Schwarm Ja NeinNeinNeinTeilweiseAdd-on JaTeilweiseTeilweiseJa Ja
Integriertes RAG (Vektorspeicher + Retrieval) Ja NeinNeinJaJaAdd-on JaTeilweiseTeilweiseJa Ja
Integriertes Modelltraining / Feintuning Ja NeinNeinNeinNeinAdd-on JaNeinNein16Ja Ja
Intelligentes Request-Routing / Lastverteilung Ja NeinAdd-onTeilweiseTeilweiseTeilweise n. z.n. z.NeinJa n. z.
Industrielle Geräteverwaltung (OPC-UA/Modbus/MQTT) Ja17 NeinNeinNeinNeinNein NeinNeinNeinn. z. Nein
Integrierte Bibliothek wissenschaftlicher Daten-APIs Ja NeinNeinNeinNeinTeilweise NeinNeinNeinNein Nein
Agenten aus einer Beschreibung erstellen Ja NeinNeinNeinTeilweiseAdd-on TeilweiseNeinTeilweiseJa Teilweise
Medien-Pipeline (Sprache-zu-Text / Text-zu-Sprache / Video) Ja NeinTeilweiseJaTeilweiseJa18 TeilweiseTeilweiseNeinAdd-on19 Nein
Governance, Sicherheit & Datensouveränität
Mandantenfähige Datenisolierung Ja NeinNeinTeilweiseTeilweiseTeilweise TeilweiseNeinTeilweiseJa Ja
Rollenbasierte Zugriffssteuerung Teilweise20 NeinNeinJaJaTeilweise JaJaJaJa Ja
Backup & Notfall-Wiederherstellung Ja NeinNeinTeilweiseTeilweiseAdd-on n. z.n. z.n. z.Verwaltet Verwaltet
PKI / Zertifikatsverwaltung Ja NeinNeinNeinNeinAdd-on n. z.Neinn. z.n. z. n. z.
Datensouveränität (Sie bestimmen, was lokal bleibt) Ja TeilweiseNeinTeilweiseJaJa Neinn. z.NeinVerwaltet Verwaltet
Lizenz- / Kostenmodell Proprietär; selbst gehostet, keine Gebühren pro Token (kostenlose Stufe) Open Source (MIT)21 Open Source (Apache-2.0) Quelltext einsehbar Quelltext einsehbar Kostenpflichtig, pro GPU Abrechnung pro Token Abrechnung pro Token Abrechnung pro Token Abrechnung pro Token Abrechnung pro Token
Experimentell
Selbstverbessernde / selbstoptimierende Engine Experimentell22 NeinNeinNeinNeinNein NeinNeinNeinNein Nein

Ja = dokumentierte erstklassige Fähigkeit · Teilweise = vorhanden, aber enger gefasst/eingeschränkt · Add-on = über ein separates Produkt/Plugin, das Sie ergänzen · Verwaltet = die Cloud des Anbieters übernimmt es (Sie betreiben es nicht selbst) · n. z. = nicht zutreffend für einen reinen Cloud-Dienst · Nein = keine dokumentierte Funktion · Experimentell = optionales, in Entwicklung befindliches Modul. Die Cloud-API-Spalten sind auf den Achsen „auf eigener Hardware betreiben“ ehrlicherweise „n. z.“ — eine Cloud-API ist eine andere Bauform, nicht „schlechter“.

Anmerkungen & Quellen

  1. Das „Memory“ von Open WebUI ist ein nutzerbezogener Notizspeicher zur Personalisierung (Beta), kein sitzungsübergreifendes Substrat für assoziatives Erinnern. Doku ↗
  2. Das Gedächtnis von Dify ist auf Sitzung/Konversation begrenzt (Token-Puffer + Konversationsvariablen); für sitzungsübergreifende Persistenz braucht es ein Add-on von Drittanbietern. Doku ↗
  3. NVIDIA liefert eine Gedächtnis-Schnittstelle (NeMo Agent Toolkit Memory-Modul), die ein Backend von Drittanbietern voraussetzt (Mem0 / Redis / Zep) — die Schnittstelle, nicht das Substrat. Doku ↗
  4. Anthropic bietet ein clientseitiges Memory-Tool / verwaltete Memory-Speicher, die auf der Infrastruktur von Anthropic betrieben werden — kein Substrat, das Sie selbst hosten. Doku ↗
  5. Bedrock-Agenten behalten sitzungsübergreifenden Kontext über eine Memory-ID, der Speicher liegt jedoch AWS-verwaltet innerhalb von Bedrock. Doku ↗
  6. Modell-Destillation in NVIDIA NeMo und AWS Bedrock erfolgt Modell→Modell (Lehrer→Schüler); Eldric destilliert das Wissen eines Modells in sein Gedächtnis-Substrat. AWS ↗ · NVIDIA ↗
  7. Die OpenAI-Destillation erzeugt ein kleineres, von OpenAI gehostetes Modell, kein Gedächtnis-Artefakt, das Ihnen gehört. Doku ↗
  8. NVIDIA NIM betreibt Modelle in einem Container, intern läuft jedoch vLLM / TensorRT-LLM / SGLang auf NVIDIA-GPUs — ein verpacktes Backend, nicht backend-frei. Doku ↗
  9. Eldrics xLSTM-Workloads sind strukturiertes ML — Regelungspolicy, Zeitreihen-Prognose, Vision-Encoding, assoziatives Retrieval — kein Chat-Sprachmodell.
  10. NVIDIA NIM / AI Enterprise setzt NVIDIA-GPUs voraus (Edge Jetson → Rechenzentrum), nicht beliebige CPUs oder Hardware anderer Anbieter. Doku ↗
  11. Dify hostet sich selbst als Mehrdienst-Stack (~11 Container: 5 Kern + 6 abhängige), nicht als einzelne Binärdatei. Doku ↗
  12. vLLM verfügt über integrierte Tensor-/Pipeline-/Daten-Parallelität für verteilte Inferenz über mehrere Knoten. Doku ↗
  13. Eldrics Controller-Failover ist ausgeliefert (5.0.11) und wurde live validiert; vollständige Produktions-HA nutzt ein 3-Knoten-Quorum.
  14. Eldrics standort-übergreifende Föderation ist ausgeliefert (5.0.9); die Einzel-Controller-Föderation ruht bis zum Produktions-HA-Bootstrap.
  15. Föderiertes Lernen bei NVIDIA heißt NVIDIA FLARE und ist ein separates Produkt. Doku ↗
  16. Anthropic bietet kein eigenes Feintuning von Claude an; Feintuning von Claude ist ausschließlich über AWS Bedrock verfügbar. Doku ↗
  17. Eldric deckt die industrielle / IoT-Geräteverwaltung ab (OPC-UA / Modbus / MQTT / HomeKit / Matter); die breitere Netzwerk-Geräteflotte wird ausgebaut.
  18. NVIDIAs Sprachfunktionen (STT / TTS / Übersetzung) sind Riva-basierte Speech-NIM-Microservices, die daneben betrieben werden. Doku ↗
  19. Auf AWS sind Sprache-zu-Text / Text-zu-Sprache eigene Dienste (Amazon Transcribe / Polly), nicht Bedrock selbst. Transcribe ↗ · Polly ↗
  20. Eldric erzwingt heute mandantenfähige Datenisolierung; die feingranulare RBAC-Rollen-Durchsetzung reift in der 5.0-Linie weiter (in der 4.x-Linie bereits durchgesetzt). Auf Eldrics eigener Seite als Teilweise gekennzeichnet, statt sie als vollständig auszugeben.
  21. Die Ollama-Engine / -CLI ist MIT-lizenziert; vLLM ist Apache-2.0; Open WebUI ist quelltext-einsehbar (BSD-3-Basis + Branding-Klausel, ab v0.6.6); Dify ist quelltext-einsehbar (modifizierte Apache-2.0); NVIDIA AI Enterprise ist eine kostenpflichtige, proprietäre Lizenz pro GPU.
  22. Eldrics selbstverbessernde Engine (NOVA) ist ein optionales, experimentelles Modul — keine ausgelieferte Kernfähigkeit zum Vorzeigen.
  23. Oracle wird als der verwaltete Dienst OCI Generative AI bewertet (gehostete Cohere-/Llama-Modelle, dedizierte AI-Cluster, Generative AI Agents) — vergleichbar mit den übrigen verwalteten Cloud-APIs — nicht als OCIs reine GPU-Recheninstanzen. Doku ↗

Quellen je Plattform

Die Bewertungen jedes Wettbewerbers stammen aus der jeweils aktuellen Dokumentation des Anbieters (Stand Juni 2026). Primärquellen:

Die Wahl zwischen ihnen

Häufige Fragen

Was hat Eldric, das Ollama, vLLM, Open WebUI und Dify nicht haben?

Ein dauerhaftes assoziatives Gedächtnis als „Gehirn“, das Neustarts übersteht und offline konsolidiert, natives strukturiertes ML jenseits von Chat (Regelung / Prognose / Encoding / Retrieval), Controller-Hochverfügbarkeit und standort-übergreifende Föderation, föderiertes Lernen sowie integrierte Domänen-Worker (industrielles IoT, über 140 wissenschaftliche Daten-APIs, Messaging) — in einer einzigen selbst gehosteten Plattform, statt aus separaten Werkzeugen zusammengesetzt.

Was ist eine selbst gehostete Alternative zu den APIs von OpenAI, Anthropic oder Grok?

Eldric betreibt vergleichbare Fähigkeiten — Multi-Agenten-Orchestrierung, Retrieval, Feintuning und Routing — vollständig auf Hardware, die Ihnen gehört, einschließlich air-gapped (netzgetrennter) Netze, ganz ohne Abrechnung pro Token. Die Cloud-APIs sind verwaltete Dienste, die in der Cloud des Anbieters laufen.

Setzt Eldric NVIDIA-GPUs voraus?

Nein. Eldric ist hardware-unabhängig — CPUs, NVIDIA, AMD und Apple Silicon, dazu ARM-Edge-Geräte. NVIDIA NIM hingegen setzt NVIDIA-GPUs voraus.

Ist Eldric Open Source?

Nein — Eldric ist ein proprietäres, kommerziell lizenziertes Produkt mit einer kostenlosen Stufe. Ollama (MIT) und vLLM (Apache-2.0) sind Open Source; Open WebUI und Dify sind quelltext-einsehbar mit einigen Einschränkungen. Der Kompromiss lautet: Quelltext-Verfügbarkeit gegenüber einem integrierten, von einem einzigen Anbieter unterstützten Stack.

Wie lege ich mit Eldric los?

Installieren Sie das vorgefertigte Paket — dnf install eldric-aios unter RHEL / Fedora oder laden Sie das macOS-Installationsprogramm herunter — und rufen Sie die Chat-Oberfläche auf. Siehe Loslegen.


Methode. Die Wettbewerber-Bewertungen stammen aus der jeweils veröffentlichten Dokumentation, den Repositories und Lizenzdateien des Anbieters mit Stand Juni 2026 (siehe „Quellen je Plattform“). Fähigkeiten entwickeln sich weiter — sollte eine Zelle nicht mehr zur aktuellen Doku eines Anbieters passen, schreiben Sie uns an office@eldric.ai und wir korrigieren sie. Die aufgeführten Eldric-Fähigkeiten sind im aktuellen Release ausgeliefert und produktiv; gegatete oder in Entwicklung befindliche Arbeit ist bewusst ausgenommen.