Die xLSTM-Familie ist jetzt ein erstklassiger Workload-Typ. Admin-Bundle-Export und -Import für die Übertragung von Wissen zwischen Installationen. Edge-Runtime auf Raspberry Pi, Intel NUC und NVIDIA Jetson. Vollständiges mehrstufiges Memory-Subsystem mit ausfallsicherer Persistenz. Sechzehn Wissenschafts-Domänen. Der vollständige Multi-Worker-Stack mit 4.x-Funktions-Parität.
Eldric 5.0 liefert vom Gehirn inspirierte KI als Server, den Sie auf Ihrer eigenen Hardware betreiben — mehr-mandantenfähig, multi-Worker, mit portablen Wissens-Bundles, Edge-Deployment vom Pi bis zum Jetson und einem Structured-ML-Daemon für die xLSTM-Familie neben dem LLM-Stack.
Der eldric-xlstmd-Daemon (Port 8884) bedient vier Workload-Klassen aus einem Prozess: Policy-Ausführung (LRAM), Prognose (TiRex), Encoding (ViL) und assoziative Retrieval (Hopfield-artig). Der Router verteilt nach Workload-Typ; das Edge-Gateway leitet weiter; der IoT-Worker bindet die Policy-Ausführung an Echtzeit-Steuerungsschleifen mit Sicherheits-Interlocks. Das Retrieve-Backend ist nativer Code mit Mikrosekunden-Latenz auf CPU. Lizenz-Gating pro Workload, strukturierte Fehler-Antworten bei fehlender Capability.
Policy-gesteuerte Ansteuerung von OPC-UA-, Modbus- und MQTT-Sparkplug-B-Endpunkten über den IoT-Worker. Sicherheits-Interlocks von Anfang an: Magnituden-Clamp auf der Ausgabe, Joint-Limit-Prüfung, Watchdog-Timeout, NaN-Reject und ein Not-Aus-Pfad. Bindings können auf einen bestimmten xLSTM-Worker gepinnt sein oder automatisch failovern. Streaming via WebSocket-Transport für Sub-Tick-Latenz; OPC-UA und MQTT-Sparkplug-B für flotten-weite Subscriptions; Watchdog-getriebener Fallback (Null / Einfrieren / letzter-bekannter-Wert), wenn der Policy-Worker seinen Deadline verpasst. Details auf xLSTM & IoT-Transporte.
Matrix-Memory, Vektor-Dokumente, Wissensbasis-Quellen, ENRN-Klassifikatoren, Skills, Source-Registry-Einträge, Dream-Artefakte und Identity-Overlays einer Eldric-Installation in eine einzelne, signierte Datei packen. Übertragen. Auf einem anderen Cluster mit sauberem Merge auspacken — gleiche Version oder andere. Scope-Filter pro Mandant, so dass ein Export keine Daten anderer Mandanten mit sich trägt. Nützlich für Mandanten-Portabilität, Projekt-Übergabe, Seeding einer Edge-Installation, leichte Föderation zwischen regionalen Clustern und Disaster-Recovery.
Einzelknoten-Eldric-Installation auf Raspberry Pi 4 (4 GB+ RAM, 32 GB+ Speicher), Intel NUC und NVIDIA Jetson. Lokale Wissensbasis, lokale Matrix-Memory, lokales Chat-Serving ohne Controller in der Nähe. Puffert Schreibvorgänge, wenn die Verbindung zum zentralen Cluster abbricht, und spielt sie zurück, sobald sie wieder steht. Die kognitive Ebene einer autonomen Plattform, an der Plattform.
Mehrstufige Memory: Matrix-Memory (mLSTM-inspirierte Updates), Vektor-RAG (Volltext- und semantische Suche), ENRN-Klassifikatoren, Agent × Domain-Matrix (15 Agenten × 7 Domänen). Ausfallsichere Persistenz mit Integritäts-Prüfsummen. Sub-Millisekunden-Recall auf den heißen Pfaden.
Retrieval-Augmented Generation wird in 5.0 standardmäßig aktiv ausgeliefert. Dokumente hochladen (PDF, DOCX, Markdown, reiner Text, Code, CSV, Audio, Video, Sensor-Ströme), und die Plattform lässt sie durch inhaltsbewusstes Chunking laufen — verschiedene Strategien pro Inhaltstyp, mit dem intelligenten Upload-Fluss, der Parameter automatisch vorschlägt und Überschreiben vor dem Commit erlaubt. Das native GGUF-Embedding-Modell (~80 MB, läuft auf CPU) bettet lokal ein; der Daten-Worker speichert Chunks neben Vektoren; Anfragen zitieren die Quell-Passagen zum Nutzer zurück. Eigene Klassifikation (Pro+) lässt Sie dem Router Ihre eigenen Intent-Klassen beibringen. Die Retention-Schleife macht akzeptierte Antworten mit der Zeit zum nächsten Trainings-Korpus. Siehe RAG verwenden, RAG-Architektur, Chunking-Strategien, RAG bei Bedarf, Eigene Klassifikation.
Die Source-Registry (§43) gruppiert wissenschaftliche Datenquellen in sechzehn Kategorien mit achtundzwanzig Seed-Quellen und einem Plugin-Einstiegspunkt für eigene Ergänzungen. Elf vom LLM aufrufbare Tools werden über einen Endpunkt verteilt. Bioinformatik, Pharma, CRISPR, LIMS, Materialwissenschaft, Klima, Neurowissenschaft, Teilchenphysik, Gravitationswellen, Raumfahrt-Agenturen und mehr.
Communication-Worker (E-Mail, SMS, VoIP, WhatsApp, Signal, Teams, XMPP). Medien-Worker (STT, TTS, Video-Verarbeitung). Training-Worker (Unsloth, Axolotl, TRL, MLX, llama.cpp, xLSTM-Backends). Swarm-Controller, Agent-Worker, Daten-Worker, Cloud-Worker, Native-Inferenz-Daemon — alle produktionsreif mit 4.x-Funktions-Parität.
Der macOS-GUI-Client bringt einen kryptographisch signierten In-App-Updater mit. Neue Releases werden automatisch vom Paket-Server geholt, in der App leise angekündigt und beim nächsten Start angewendet. Update-Kanäle: stable als Standard und beta als Opt-in über die Einstellungen.
Eine Forschungs-Preview von Modern-Hopfield-Compressed-Retrieval wird in 5.0 als Opt-in ausgeliefert. Kundinnen und Kunden können die Matrix-Memory-Schicht einer Wissensbasis in eine komprimierte Darstellung überführen, die auf der Platte kleiner und bei hoher Parallelität schneller ist — bei einem kleinen Genauigkeits-Trade-off auf Grenz-Anfragen, bei denen exakte Retrieval-Treue am wichtigsten ist. Der vollpräzise Pfad bleibt daneben verfügbar. Details auf Erweiterte Retrieval.
Der Inferenz-Daemon konsultiert die Matrix-Memory-Schicht jetzt direkt an Prompt-Grenzen. Modell-Antworten sind in den Daten Ihres Mandanten verankert, ohne separaten Retrieval-Round-Trip — nützlich für Chat-Workloads, bei denen die Gesamtlatenz zählt, und für kunden-spezifische Inhalte, wo das Modell sonst eine generische Erst-Antwort produzieren würde. Unter 2 ms zusätzlicher Aufwand pro Token auf CPU. Pro+-Opt-in. Details auf Intelligente Memory-Inferenz.
Der iPad-Client landet als Teil der Universal-App-Form neben iPhone. Tablet-bewusste Split-Ansicht (Seitenleiste + Chat + Artefakt), schwebender Composer, Apple Pencil und Scribble, Drag-and-Drop-Ingestion aus Files / Fotos / Mail, Benachrichtigungs-Center für lang laufende Agent-Aufgaben. Theme-Einstellungen synchronisieren sich über alle Clients über den Controller. Mehrfenster-Betrieb für Stage Manager und Split View wird als Preview ausgeliefert. Heute auf TestFlight, App Store als Nächstes. Details auf iPad.
Der „KI, die KI baut“-Flow hat jetzt eine Admin-Oberfläche in der Chat-Shell. Den gewünschten Agenten beschreiben; die Plattform erzeugt Agent-Code, Tool-Definitionen, Prompts und Test-Fälle; Sandbox-Test-Läufe verifizieren das Verhalten vor dem Deployment. Generator und Builder teilen sich das Agent-Paket-Format; beide Pfade produzieren ein in sich abgeschlossenes agents/<name>/-Verzeichnis, das Sie versionsverwalten.
Ein ENRN-v18-Router-Intent-Klassifikator wird als Opt-in für Professional- und Enterprise-Tier ausgeliefert. Er ersetzt die Klein-LLM-Routing-Entscheidung durch einen einstufigen neuronalen Klassifikator, der auf den Routing-Mustern Ihres Clusters trainiert wurde. Niedrigere Latenz bei der Routing-Entscheidung, weniger GPU-Zeit für die Klassifikation; das LLM bleibt für tatsächlich mehrdeutige Anfragen im Loop. Mehr dazu auf Erweiterte Retrieval.
Das Minimum-Laufzeit-Paket wird jetzt als signierte aarch64-RPM neben x86-64 ausgeliefert. Derselbe Ein-Zeilen-Installer erkennt die Host-Architektur und installiert die richtige Variante. Verifiziert auf Raspberry Pi 4, generischen ARM64-Servern und NVIDIA Jetson. Siehe Edge-Installation.
Die xLSTM-Policy-Bindings des IoT-Workers steuern WebSocket, Modbus TCP und die Publish-Hälfte von MQTT-Sparkplug-B in GA an (Pro+-Tier). OPC-UA wird durch 5.0 RC1 als Preview ausgeliefert — der C++-Quellcode liegt im Release, die open62541-Bibliothek wird mit dem nächsten Cluster-RPM-Schnitt mitgebündelt. Die MQTT-Subscribe-Hälfte — Beobachtungen aus einer Sparkplug-B-Sensor-Flotte über den Policy-Worker — bleibt für die 5.0-Linie Preview und landet in 5.1. Der Sicherheits-Fallback (Null / Einfrieren / letzter-bekannter-Wert) gilt unbedingt für alle Transporte. Siehe xLSTM & IoT und Bekannte Probleme.
Jedes Modell in der Chat-Auswahl trägt ein kleines farbiges Kennzeichen für das Backend dahinter — Ollama, OpenAI, Eldric Inferenced, vLLM, llama.cpp, Anthropic, xAI, Groq und andere. Grün für Modelle im eigenen Cluster, Markenfarbe für externe APIs. Dasselbe Kennzeichen erscheint unter jeder Assistenten-Antwort, damit Sie immer sehen, welches Backend bedient hat. Kein stilles Umlenken zwischen lokal und extern. Mehr dazu auf Modell-Anbieter.
Ein neuer Schalter Werkzeug-Abfrage-Details anzeigen in den Chat-Einstellungen (standardmäßig an) druckt eine einzeilige Zusammenfassung jeder Werkzeug-Abfrage — Wissensbasis plus Namespace plus Anfrage plus Trefferzahl bei RAG, Quelle plus Anfrage bei Wissenschafts-Lookups, Suchmaschine plus Begriffe bei Web, Empfänger bei Comm. Abschaltbar für ein dichteres Transkript. In jedem Chat-Client verfügbar.
Im Chat gebaute Agenten lassen sich jetzt mit einem Klick im Mandanten teilen, zur Admin-Prüfung in den Marktplatz veröffentlichen und mit Versionierung an Ort und Stelle bearbeiten. Sandbox-Test-Läufe validieren jede Änderung vor dem Deployment. Das Agent-Paket-Format bleibt gleich — agents/<name>/ —, so dass manuelle Bearbeitung und die UI sich einig sind.
Phase D bringt Stage-Manager- und Split-View-Mehrfenster, eine umfassende Tastaturkürzel-Karte für Chat-Aktionen, fensterübergreifendes Drag-and-Drop zum Verzweigen eines Gesprächs und einen Kollisions-Toast, wenn zwei Clients dasselbe Theme bearbeiten. macOS zeigt lang laufende Aufgaben jetzt ebenfalls als native UNUserNotification-Einträge an, mit APNs-Anbindung für Remote-Pushs aus Cluster-Ereignissen. Siehe iPad-Seite.
Admin-UI für die vier xLSTM-Workload-Klassen — Policy, Forecast, Encode, Retrieve — mit mandantenweiter Aktivierung, Modellauswahl pro Klasse und Live-Last-Diagramm. Anfragen an den xLSTM-Worker zu lenken braucht jetzt keinen JSON-lesenden Admin mehr.
Bestehende Matrix-Memory-Namespaces lassen sich pro Namespace mit einem einzigen Befehl auf die Modern-Hopfield-Compressed-Variante migrieren. Die Chat-Oberfläche zeigt den Migrations-Fortschritt; Rollback ist ein einzelner Befehl. So lässt sich das neue Format auf den Namespaces einführen, bei denen es einen Vorteil bringt, ohne die ganze Installation auf einmal festzulegen.
5.0 GA liefert signierte RPMs für die Fedora-/RHEL-/CentOS-/Rocky-/Alma-Familie. Ubuntu-24.04- und Debian-12-DEB-Pakete folgen kurz nach GA. Kundinnen und Kunden auf Ubuntu / Debian können 5.0 heute über WSL2 oder Container betreiben.
Alle Verschiebungen sind im Funktions-Katalog mit WIP-Markierungen dokumentiert; die kundenseitige Liste mit Status liegt auf Bekannte Probleme.
Kundinnen und Kunden auf der 5.0-Alpha-Linie aktualisieren über den Rolling-Update-Orchestrator. sudo dnf update eldric-aios auf jedem Knoten in der vom Orchestrator vorgegebenen Reihenfolge; der Controller drainiert, installiert und startet jeden Knoten der Reihe nach, während der Rest des Clusters den Verkehr trägt. Für Einzelknoten-Installationen funktioniert das übliche dnf update direkt. Getesteter Upgrade-Pfad auf Fedora 42+, RHEL 9+, CentOS Stream 9+. 4.x-Kundinnen und -Kunden: schreiben Sie an support@eldric.ai für das Migrations-Playbook.
Die Basis-Lizenz umfasst den vollen Kernel: einen Controller, einen Router, zwei Worker, alle Funktionen für Evaluierung und Klein-Team-Einsatz. Standard / Professional / Enterprise ergänzen Kapazität, mehrmandantenfähige Funktionen, den Bundle-Export/-Import, die xLSTM-Workload-Klassen und Federated-Workflows. Lizenz-Dateien sind signiert und schalten Funktionen zur Laufzeit frei — siehe Preise für die Tier-Übersicht.
Zur Installation: Loslegen. Für die Details: Was ist neu. Für den vollen Funktions-Katalog: Funktionen. Für Plattform-in-Ihrer-Domäne: Eldric in Ihrer Domäne anwenden.