Funktionen

Was Eldric 5.0
tatsächlich liefert.

Ein geführter Rundgang durch das, was Eldric 5.0 ausliefert — fünfzehn Bereiche über den Kernel, die Worker, die Chat-Oberfläche, den iPad-Client und die Operator-Konsole. Die Release Notes haben die formale Version; diese Seite ist die Übersicht auf einen Blick.


Plattform-Kern

Der verteilte Kernel.

Mikrokernel-Laufzeit

Ein C++-Kernel beherbergt unabhängige Module (Edge, Controller, Router, Daten, Agent, Medien, Comm, Wissenschaft, Training, Inferenz, native Inferenz, xLSTM, IoT, Swarm, NOVA) — jedes auf eigenem Port.

Topologie-Push

Der Controller pusht die aktuelle Cluster-Topologie bei jedem Heartbeat. Worker entdecken Swarm-, Daten-, Peer-, Router-, Agent- und Medien-URLs automatisch.

Mandanten-Schutz

Header-only Kernel-Hook liefert 403 bei mandantenübergreifenden Versuchen auf Daten, Speicher, Vektor, Memory, Agent, Comm, Swarm und Mandanten-Pfaden.


Inferenz

Dreißig-plus LLM-Backends.

Einheitliche Backend-Schicht

Elf Backend-Typen: Ollama, vLLM, TGI, llama.cpp, MLX, NVIDIA Triton, TensorFlow Serving, TorchServe, ONNX, OpenAI-kompatibel, Eldric-Cluster-Durchreichung.

Cloud-Aggregation

Ein Endpunkt verbindet OpenAI, Anthropic, xAI/Grok, Together, Groq, DeepSeek, Mistral, Cohere, Fireworks, Perplexity. Priorisiertes Routing mit Fallback.

Native Inferenz

Inferenced lädt GGUF- und xLSTM-Modelle direkt über eingebettetes llama.cpp — kein Ollama, kein vLLM. Multi-GPU-Tensor-Split, spekulatives Dekodieren, Continuous Batching.


Routing

Acht Strategien, KI-gesteuert auf Wunsch.

Absichts-Klassifikation

Der Router klassifiziert jede Anfrage in 13 Absichten (Chat, RAG, AgentInvoke, Swarm, MemoryStore/Recall, Daten, Wissenschaft, Medien, Comm, Training, IoT, Admin) und leitet an die passende Worker-Klasse weiter.

Themen-Erkennung

Medizin, Recht, Code, Finanzen, Wissenschaft, Kreativ, Allgemein. Jedes Thema kann ein eigenes Standardmodell und eigene Regel-Überschreibungen mitbringen.

Ensemble

Eine Anfrage geht an mehrere Modelle, ein Synthese-Modell führt die Antworten zusammen. Nützlich für Entscheidungen mit hohem Einsatz.


Daten

Speicher, Vektoren, Matrix-Memory.

Mehrmandantenfähiger Speicher

Pro Mandant getrennter Dateispeicher mit Kontingenten. Chunk-Upload-Protokoll mit 4 MB Stücken und 24 h TTL für unvollständige Uploads.

Vektor / RAG

SQLite, FAISS, ChromaDB oder In-Memory-Backends. Hybride BM25- und Vektor-Suche. Auto-Chunking beim Hochladen. Re-Embedding bei Dokumentänderung.

Matrix-Memory

Assoziatives Gedächtnis nach dem mLSTM-Vorbild — aufgebaut aus Hebb'schen Updates über äußere Produkte. Komprimierter Abruf neben dem exakten Vektor-Speicher. .emm-Format v3 mit WAL und Checkpoint.


RAG mit Zitaten

Fundierte Antworten, standardmäßig an.

RAG verwenden

RAG ist in 5.0 standardmäßig an. PDFs, DOCX, Code, CSVs, Audio, Video, Sensor-Ströme hochladen. Fundierte Fragen stellen. Zitat-Chips zeigen auf die Quell-Passagen zurück.

RAG-Architektur

Controller lenkt; der native Inferenz-Daemon bettet mit einem GGUF-Modell ein (~80 MB, läuft auf CPU); der Daten-Worker speichert Chunks neben Vektoren. Drei Prozesse, drei Verantwortungen, eine Leitung.

Inhaltsbewusstes Chunking

Zwölf Standard-Strategien — semantisch für wissenschaftliche PDFs, an Funktions-Grenzen für Code, pro Zeile für CSVs, pro Äußerung für Audio, pro Fenster für Sensor-Ströme. Der intelligente Upload-Fluss schlägt Parameter vor; der Operator bestätigt.

RAG bei Bedarf

Vier-Stufen-Kaskade — ENRN gelernte Gewichte → EMM assoziatives Memory → RAG → externe Live-Quellen. Die Retention-Schleife macht akzeptierte Antworten mit der Zeit zum nächsten Trainings-Korpus.

Eigene Klassifikation

Der Router-Klassifikator liefert 128 eingebaute Klassen mit. Eigene Intent-Klassen hinzufügen — als Overlay aus gelabelten Beispielen trainiert oder LLM-Fallback mit Ihrer Taxonomie. Pro+.

Embedding vor Ort

Das Embedding-Modell läuft lokal auf Inferenced (oder einem beliebigen OpenAI-kompatiblen /v1/embeddings-Endpunkt, konfiguriert über ELDRIC_EMBED_BACKEND_URL). Dokumente verlassen den Cluster nicht.


Agentische Workflows

Fünfzehn Agent-Typen, agentic RAG, Workflows.

Agentic RAG (ReAct)

Wechselt Thought → Action → Observation bis zu einer konfigurierbaren Obergrenze. Werkzeuge umfassen Vektor-Suche, Web-Fetch, Datei-Lesen und jedes per Swarm registrierte Tool.

Orchestrierungs-Muster

Sequenziell, parallel, MapReduce, Abhängigkeits-Graph. Der Orchestrator wählt das passende Muster nach der Workflow-Form.

Trainings-Daten-Erzeugung

Durchläuft eine Wissensbasis und gibt LoRA-fertiges JSONL aus — code_qa, chat, alpaca, dpo. Wird genutzt, um Router-Training und Domänen-Adapter zu starten.


Kommunikation und Medien

Sieben Messaging-Protokolle, vollständige Sprach-Pipeline.

Sieben Protokolle

E-Mail (IMAP/SMTP), SMS (Twilio), WhatsApp (Business API), Signal (E2E), Microsoft Teams, XMPP, VoIP (SIP/RTP). Ein einheitlicher Nachrichten-Umschlag.

STT und TTS

Whisper.cpp, OpenAI Whisper, Faster-Whisper für die Transkription. Piper, ElevenLabs, OpenAI für die Synthese. Vollständige Telefon-KI-Anrufe sind in Entwicklung; heute liefert die Plattform Diktate, Besprechungs-Transkripte und Eingaben für Barrierefreiheit zuverlässig.

Multimedia-RAG

Audio- und Video-Inhalte werden indiziert und durchsuchbar. Wird vom Comm-Worker für die Voicemail-Erinnerung und von der Chat-Oberfläche für eingebettete Medien-Verweise genutzt.


Wissenschaft

Quellen-Registrierung mit sechzehn Kategorien.

Quellen-Registrierung

Ein Eintrag pro Datenquelle. Admins schalten Quellen frei; Nutzer sehen nur die aktiven. Die Kategorie custom ist der Plugin-Einstiegspunkt — keine Code-Änderung nötig.

11 LLM-Werkzeuge

Fünf Nutzer-Werkzeuge, sechs Admin-Werkzeuge. Nach Rolle gefiltert. Quellen auflisten, Aktivierung anfordern, Anfrage absetzen, Zugangsdaten verwalten, ausstehende Anfragen genehmigen oder ablehnen.

Fach-Pipelines

Bioinformatik (BLAST, Variant-Calling), Pharma (Docking, ADMET, AlphaFold), CRISPR (Guide-RNA, Off-Targets), LIMS (GLP, 21 CFR Part 11).


Training

Sechs Backends, acht Methoden, föderiert.

Backends

Unsloth (CUDA, 2× LoRA), Axolotl (YAML), TRL (RLHF/DPO), DeepSpeed (Multi-GPU), MLX (Apple Silicon), llama.cpp (GGUF). xLSTM-Training läuft über den xLSTM-Daemon (unten).

Methoden

LoRA, QLoRA, SFT, DPO, RLHF, PPO, Full-Fine-Tune, Destillation. Plus Latent-Reasoning-Techniken: COCONUT, Quiet-STaR, Pause-Tokens, Hidden CoT, DeepSeek DSA.

Föderiertes Lernen

Mehr-Runden-föderiertes Training über Worker-Knoten. Der Controller verteilt cluster://training/federated/{job}/round-N; Worker trainieren lokal; Gradienten aggregieren, ohne Daten zu teilen.


xLSTM-Workload-Daemon

Strukturiertes ML, vier Workload-Klassen.

Policy-Ausführung

Regelkreis-Policies (LRAM) steuern Echtzeit-Regelungen über WebSocket, Modbus, OPC-UA und MQTT-Sparkplug-B. Watchdog-getriebener Sicherheits-Fallback, wenn die Policy ihren Deadline verpasst.

Forecast und Encode

Zeitreihen-Vorhersage (TiRex) auf Telemetrie-Fenstern. Vision-Language-Kodierung (ViL) für Wahrnehmungsaufgaben. Beide pro Workload lizenz-gegated, strukturierte Fehler-Antworten bei fehlender Fähigkeit.

Assoziative Abfrage

Natives C++-Hopfield-artiges Retrieve-Backend — Mikrosekunden-Latenz auf CPU allein. Wird vom Router für schnelle Klassifikation und vom Daten-Worker für unscharfen Abruf genutzt.

Details auf xLSTM & IoT-Transporte.


IoT und Industrie

Verbraucher- und Industrie-IoT in einem Worker.

Verbraucher-IoT

Netatmo (Wetter, Sicherheit), HomeKit, Matter. Geräte-Anmeldung und Attribut-Lese/Schreib-Zugriff über die IoT-Worker-API.

Industrielle Protokolle

OPC-UA für SPS, SCADA, DCS. Modbus TCP/RTU für Bestandsanlagen. MQTT Sparkplug B. Alarmmanagement, Zeitreihen-Historian, OEE-Analytik.

Vorausschauende Wartung

Live-Tag-Werte fließen in Matrix-Memory. Ein Inferenz-Worker betreibt Anomalie-Erkennung und liefert Wartungs-Scores.


Clients und Portabilität

Wo Eldric läuft, wer mit ihm spricht.

Eldric für iPad

Universal-App-Form — NavigationSplitView, schwebender Composer, Apple Pencil und Scribble, Drag-and-Drop-Ingestion, Mehrfenster-Betrieb über Stage Manager und Split View. Heute auf TestFlight, App Store als Nächstes.

Mac, iOS, Web, CLI

Die native Mac-GUI fährt Auto-Update über Sparkle. iOS läuft in derselben Universal-App wie iPad. Die Chat-Oberfläche ist im Edge-Gateway unter /chat eingebettet — kein externer Client nötig.

Edge-Runtime

Einzelknoten-Eldric auf Raspberry Pi 4, Intel NUC, NVIDIA Jetson. Lokaler Chat, lokale Matrix-Memory, Store-and-Forward bei fehlender Verbindung zum zentralen Cluster. ARM64-Minimum-RPM.

.nexus Bundle-Export / -Import

Matrix-Memory, Vektor-Dokumente, Wissensbasen, Klassifikatoren und Identity-Overlays einer Eldric-Installation in eine einzelne signierte Datei packen. Mit sauberem Merge zwischen Installationen bewegen.

Cross-Distribution-Pakete

Signierte RPMs für Fedora 42+, Fedora 40, RHEL 9+, Rocky 9, Alma 9, CentOS Stream 9+, ARM64. macOS-PKG mit Auto-Update. Native Ubuntu-24.04- und Debian-12-DEBs folgen kurz nach GA.

Modell-Anbieter-Kennzeichen

Jedes Modell in der Chat-Auswahl trägt ein farbiges Anbieter-Kennzeichen — Ollama, Inferenced, OpenAI, Anthropic, xAI, HuggingFace, Groq. Grün für Cluster-lokal, Markenfarbe für externe APIs.


Cluster-Operationen

Was Ops braucht.

Rollendes Update

Laufende Anfragen abschließen lassen, Zustand sichern, installieren, SHA-256 prüfen, neu starten, prüfen, zum nächsten Knoten. Der Master verteilt das Update über alle Peers, authentisiert über das gemeinsame Cluster-Secret.

PKI und ACME

Interne CA plus Let's-Encrypt-Ausgabe und -Verlängerung über certbot. Erstellen, ausrollen, rotieren. Cluster-weiter Push vom Master.

Mandanten-Theming

Jeder Mandant bekommt sein eigenes Theme — Farben, Schriften, Seitenleiste — plus optionales Logo. Lesen öffentlich, Schreiben durch Admin, HTML-Sanitisierung im Server.

Backup und DR

Schnappschuss von Controller-Zustand, Vektor-Speicher, Matrix-Memory, Mandanten-Konfigurationen, Lizenz, Edge-Plugins. Idempotente Wiederherstellung.

OpenTelemetry

Optionaler OTLP-HTTP-Exporter für Spans, Counter, Histogramme. Niedrige Pfad-Kardinalität — keine ID-Explosion in der Observability-Rechnung.

Webhooks

Ausgehende Webhooks mit HMAC-SHA256-Signatur. Fehlgeschlagene Zustellungen schalten sich nach einem Schwellwert selbst ab.

Plugin-Marktplatz

Durchsuchen, installieren (SHA-256-Prüfung plus Manifest-Validierung), deinstallieren, aktualisieren. Wird vom Edge-Modul ausgeliefert.

Destillation

Modell → EMM Wissens-Destillation. Quell-Chunks werden zu Q&A-Paaren durch ein LLM, beide Seiten eingebettet, das Paar als äußeres Produkt in Matrix-Memory geschrieben.

Dream-Engine

Holt abgeschlossene Sitzungen, extrahiert Themen über ein LLM, ingestiert sie in Matrix-Memory. Kadenzen: manuell, stündlich, nächtlich, kontinuierlich, bei Leerlauf.

Plus Chunk-Upload, mDNS-Discovery, Mandanten-Schutz, 4.x → 5.0-Migration und Artefakt-Store. Die Release Notes gehen die formale Liste durch; die API-Referenz dokumentiert jeden Endpunkt hinter diesen Funktionen.


Weiter

Detail nötig? Schauen Sie in die Docs.

Die API-Referenz und die Release Notes sind die Entwickler-zugewandten Artefakte hinter jeder Funktion auf dieser Seite.