Eldric Nexus + Cortex — Erkennung und Reasoning, auf Ihre Hardware skaliert

Die drei Stufen auf einen Blick

Eine Familie. Drei Größenordnungen.

Stufe	Was sie macht	Hardware	Lizenz	Status
Nexus	Erkennt Themen aus jeder Konversation. Erkennung in Mikrosekunden.	Jede CPU — ab Raspberry Pi 5	Enthalten, alle Lizenzen	Heute verfügbar
Nexus Pro	Erkennt 100× mehr Themen. Vergleich gegen mehrere Beispiele pro Thema, für nuancierte Domänen.	Workstation: 1× RTX 6000 oder vergleichbar	Pro+	Kommt mit 5.3
Eldric Cortex	Reasoning über Ihre Daten. Generierung mit langem Kontext. Domänenspezialisierte Experten.	Zwei Workstation-Karten oder Rechenzentrum oder Eldric-Cloud	Enterprise	Erster Spezialist mit 5.4

Dasselbe Matrix-Memory-Prinzip trägt alle drei. Nexus ist die Erkennungs-Schicht, Pro ist dieselbe mit reichhaltigeren Repräsentationen pro Thema, Cortex ist die darauf aufbauende Reasoning-Schicht. Sie können alle drei in derselben Installation parallel betreiben; die Plattform leitet Aufgaben an die Stufe weiter, die lizenziert und verfügbar ist.

Stufe 1 · Nexus

Mustererkennung ohne LLM-Aufruf.

Die Erkennungs-Schicht der Plattform. Jede Konversation, jedes Dokument und jedes Ereignis bekommt eine Themen-Markierung, ohne ein Sprachmodell aufzurufen — eine einzige Matrix-Multiplikation erledigt das in Mikrosekunden. Aus einem Frontier-Modell destilliert, in ein kleines Artefakt gepackt, läuft auf der CPU, die Sie ohnehin haben. In jeder Eldric-Installation enthalten.

Ein konkretes Beispiel. Eine Benutzer-Nachricht liest sich:

„Mein Pod ist CrashLoopBackOff. Die Logs zeigen Exit-Code 1 sofort beim Start. Wenn ich `command: sleep 3600` setze und mich reinexece, läuft die App problemlos."

Nexus erkennt das mit hoher Konfidenz als devops/container/k8s und versieht die Konversation im Matrix-Memory der jeweiligen Installation mit dem Tag. Erledigt in ungefähr der Zeit, in der man das erste Wort dieses Satzes liest.

Wo es passt: Automotive, Edge, IoT, Mobile — überall dort, wo keine GPU verfügbar ist und Erkennung trotzdem kontinuierlich passieren muss. Der Raspberry Pi 5 in einer Werkstatt, der SoC im geparkten Auto über Nacht, der NUC im IT-Schrank einer Klinik.

Stufe 2 · Nexus Pro

Reichhaltigere Erkennung für tiefe Domänen.

Nexus Pro behält das Matrix-Memory-Prinzip bei, speichert aber mehrere repräsentative Exemplare pro Thema statt eines gemittelten Vektors. Ein Thema wie „Python ML-Data-Wrangling" wird nicht mit „Python Web-Backend" verschmolzen, weil die Exemplare getrennt gespeichert und einzeln verglichen werden. Ergebnis: rund 100× mehr Themen, schärfere Unterscheidung zwischen nahe verwandten Konzepten und ein sauberes Neuheits-Signal, wenn eine Anfrage zu keinem gespeicherten Exemplar passt.

Für wen das ist: Kunden mit tiefen, spezialisierten Vokabularen. Die Fall-Taxonomie einer Anwaltskanzlei. Die klinische Terminologie eines Krankenhauses. Die Projektstruktur eines Forschungslabors. Die Transaktions-Klassen-Hierarchie einer Bank. Überall dort, wo „168 generische Themen" nicht granular genug ist.

Was es braucht: Workstation-Hardware. Eine einzelne RTX-6000-Klasse-Karte hält Nexus Pro mit komfortablem Spielraum im Speicher; eine Workstation mit zwei Karten erlaubt zusätzlich einen kleinen LLM für Schicht-3-Reasoning daneben, ohne dass es eng wird.

Wie Kunden es einschalten: Ein Admin auf der Pro+-Lizenz öffnet das Dashboard, wählt „Nexus Pro" als Erkennungs-Stufe, und die Plattform lädt das passende Modell-Artefakt bei der Aktivierung. Das Standard-Nexus bleibt als Fallback für jeden Worker verfügbar, der die Hardware nicht hat.

Stufe 3 · Eldric Cortex

Reasoning über Ihre Daten.

Cortex ist nicht mehr nur ein Klassifizierer — es ist die Reasoning-Schicht, die erzeugt, was Nexus und Nexus Pro erkennen. Wenn Sie verstehen wollen, warum eine Konversation neuartig ist, ein Jahr Kontext in einem Durchlauf zusammenfassen müssen oder eine Antwort komponieren müssen, die auf der gesamten institutionellen Historie des Kunden basiert, ist Cortex das Modell, das das macht.

Auf demselben Prinzip gebaut, hochskaliert. Cortex verwendet xLSTM-Matrix-Memory-Blöcke — denselben assoziativen Recall, der Nexus und Nexus Pro trägt, gestapelt zu einem generativen Modell in Frontier-Größe. Lineare Attention (nicht quadratisch) bedeutet, dass Cortex ein Jahr an Sitzungs-Historie in einem einzigen Durchgang lesen kann, ohne dass die Kontextfenster-Begrenzung auftritt, die transformer-basierte Reasoning-Modelle limitiert.

Domänenspezialisiert, nicht generisch. Cortex kommt als Familie von Domänen-Experten — Automotive, Code, Medizin, Finanzen, Recht, Wissenschaft und so weiter — kombiniert über einen Mixture-of-Experts-Router. Die meisten Anfragen aktivieren nur ein oder zwei Experten, sodass die effektive Rechenlast viel geringer ist als die Gesamt-Modellgröße. Kunden, die nur eine Domäne betreiben (ein Krankenhaus, ein Flottenbetreiber, eine Bank), können den passenden Spezialisten allein lizenzieren und auf einer Workstation mit zwei High-End-Karten laufen lassen. Kunden, die den vollen Multi-Domänen-Reasoner wollen, lizenzieren das zusammengestellte Modell als Paket und betreiben es auf Rechenzentrums-Hardware oder beziehen es aus der Eldric-Cloud.

Wofür es da ist:

Langzeit-Zusammenfassungen. „Woran hat dieser Benutzer diesen Monat gearbeitet?" — ein Jahr an Sitzungs-Embeddings als Eingangskontext, in einem Durchlauf zusammengefasst.
Domänen-übergreifendes Reasoning. „Die Regex-Fragen dieses Benutzers im Code-Bereich hängen mit seiner Compliance-Arbeit zusammen — er parst Rechtstexte" — Cortex komponiert die Verbindung.
Erklärung neuartiger Themen. Wenn Nexus oder Pro eine Sitzung als ungewöhnlich weit von allen bekannten Themen entfernt markieren, erklärt Cortex, warum sie neuartig ist und was sie über die Entwicklung des Benutzers aussagt.
Anomalie-Berichte. Die Art von klarer Prosa-Erklärung, die ein menschlicher Analyst schreiben würde, automatisch aus Matrix-Memory-Mustern erzeugt.

Cortex' Domänen-Experten erscheinen einzeln, beginnend mit 5.4. Jeder Experte erscheint als eigenständiges Produkt für Kunden, die nur eine Domäne brauchen, bevor die volle Multi-Domänen-Zusammenstellung abgeschlossen ist. Ein Krankenhaus kann Cortex Medizin kaufen, ohne auf Cortex Finanzen zu warten. Eine Bank kann Cortex Finanzen kaufen, ohne auf Cortex Recht zu warten. Kontinuierlicher Fortschritt, nicht eine einzige Veröffentlichung, in der schließlich alles funktioniert.

Wie es zusammenpasst

Die drei Schichten des Träumens.

Eldrics Traum-Engine läuft in drei Schichten — jede auf anderer Hardware tragfähig. Die Stufen bilden sich auf die Schichten ab:

Schicht 1 — Gedächtnis. Jede Konversation wird in das eigene Matrix-Memory Ihrer Installation eingefaltet. Nur CPU, Millisekunden pro Ereignis. Mitgeliefert.
Schicht 2 — Mustererkennung. Nexus (Standard, CPU) oder Nexus Pro (Workstation, mehrere Beispiele pro Thema). Dieselbe assoziative Recall-Operation, die das Gedächtnis ausmacht, angewandt gegen den Erkennungs-Klassifizierer, um Themen zu extrahieren. Mikrosekunden pro Ereignis.
Schicht 3 — Einsicht. Das Reasoning-Modell, das Erklärungen, Zusammenfassungen und Anomalie-Berichte erzeugt. Kunden können hier jedes beliebige LLM konfigurieren — aber Cortex ist die Modell-Familie, die speziell für diese Schicht entworfen wurde, mit linearer Attention für langen Kontext und domänenspezialisierten Experten.

Die ersten beiden Schichten sind in jeder Eldric-Installation enthalten. Die dritte ist optional, ausdrücklich aktiviert und durch die Rechenleistung begrenzt, die Sie zuzuteilen entschieden haben. Siehe Was kommt für die 5.2-Architektur-Vorschau.

Eine Architektur über alle drei

Assoziatives Gedächtnis, drei Mal skaliert.

Nexus, Nexus Pro und Cortex sind alle auf demselben Prinzip aufgebaut: assoziatives Matrix-Memory mit assoziativen Updates und Direkt-Recall. Nexus verwendet es direkt mit einem gemittelten Vektor pro Thema. Nexus Pro erweitert es mit mehreren Beispiel-Vektoren pro Thema und komprimiertem Softmax-Retrieval. Cortex verwendet es als Baustein jedes xLSTM-Experten in einem Mixture-of-Experts-Reasoning-Modell. Die Familie skaliert durch mehr Gedächtnis und mehr Rechenleistung — niemals durch Architektur-Wechsel.

Diese Kohärenz zählt operativ: Ein Kunde, der von Nexus auf Nexus Pro umsteigt, behält dieselbe Themen-Taxonomie. Ein Kunde, der Cortex über Pro hinaus ergänzt, behält dieselbe Domänen-Struktur. Die ganze Familie versteht dieselbe Welt; die Stufen verstehen sie nur in unterschiedlicher Tiefe.

Was Sie auf jeder Eldric-Installation bekommen

Nexus mitgeliefert. Pro und Cortex aktiviert.

Standard-Nexus ist in jeder Eldric-Installation enthalten. Kein separater Download, keine Einrichtung, keine GPU nötig. Themen-Erkennung in Mikrosekunden auf jeder CPU.
Nexus Pro ist eine Pro+-Aktivierung. Admin schaltet es im Dashboard ein; die Plattform lädt das Artefakt beim ersten Gebrauch. Erfordert eine Workstation-GPU; fällt auf das Standard-Nexus zurück, wenn die Hardware nicht verfügbar ist.
Cortex ist eine Enterprise-Aktivierung. Spezialisten pro Domäne werden separat lizenziert für Kunden, die eine Vertikale betreiben (Krankenhaus, Flotte, Bank). Die volle Multi-Domänen-Zusammenstellung wird als Paket lizenziert für domänen-übergreifende Installationen. Eldric-Cloud-Option für Kunden ohne Rechenzentrums-Hardware.
Die Datenschutz-Haltung ist über alle Stufen konsistent. Nexus und Nexus Pro laufen ausschließlich auf dem Gerät. Cortex läuft standardmäßig vor Ort; die Cloud-Option erfordert ausdrückliche Admin-Zustimmung je Anfrage-Typ.

Versionen + Domänen

Generell standardmäßig. Spezialisiert, wo es zählt.

Jede Stufe kommt in einer generellen Variante; für Branchen, in denen das Vokabular zählt, sind domänen-spezialisierte Varianten verfügbar:

Generell — der Standard. Deckt Konversation, Code, DevOps, IT, Sicherheit, Kreatives, Finanzen, Medizin, Recht, Wissenschaft, Industrie, Automotive und Prognosen ab.
Code — spezialisiert auf Software-Engineering-Workflows.
Medizin — spezialisiert auf klinische und pharmazeutische Terminologie. Pro+-Tier.
Finanzen — spezialisiert auf Portfolio, Märkte, Banken, regulatorische Kontexte. Pro+-Tier.
Automotive — spezialisiert auf Fahrzeug-Telemetrie, Fahrmuster, Flotten-Operationen. Enterprise Tier (Cortex Automotive — der erste 5.4-Spezialist).

Weitere Branchen — Recht, Wissenschaft, Industrie, DevOps, IT, Sicherheit — folgen in späteren Releases als Cortex-Experten. Admins wählen Varianten im Dashboard; der Wechsel ist ein Datei-Tausch, kein Service-Neustart.

Warum das funktioniert

Erkennen ist nicht Erzeugen.

Moderne Gehirne erkennen weit mehr, als sie erzeugen. Wenn Sie einen vertrauten Raum betreten, verfassen Sie keine Beschreibung von ihm — Sie wissen einfach, was er ist. Erkennen ist Muster-Vergleich gegen Gedächtnis. Erzeugen ist ein anderer Prozess, und es kostet mehr.

Die meisten KI-Architekturen vermengen die beiden — jede Klassifikation wird zu einem Modell-Aufruf. Das funktioniert auf einer Workstation mit GPU. Es bricht auf einem Raspberry Pi, in einem geparkten Auto, auf einem Server in einer Außenstelle. Eldrics Erkennungs-Familie ist die Wette, dass Erkennen getrennt von Erzeugen leben kann — und dass diese Trennung der Plattform erlaubt, überall zu laufen.

Die Wette scheint aufzugehen. Nexus antwortet in Mikrosekunden, wo ein generativer Klassifizierer Sekunden braucht. Der Kunde mit einem 4-Personen-Service-Desk auf einem NUC bekommt das gleiche Gedächtnis- und Erkennungs-Verhalten wie der Kunde mit einer 200-Personen-Engineering-Organisation auf einem Rechenzentrums-Cluster — unterschiedliche Hardware, gleiches Recall-Verhalten. Und wenn Reasoning das ist, was die Situation tatsächlich braucht — wenn ein Kunde will, dass Cortex aufschreibt, warum eine Konversation ungewöhnlich ist, nicht nur dass sie es ist — skaliert die Familie dorthin, ohne aufzugeben, was die Erkennungs-Schicht überhaupt funktionieren ließ.

Wohin das führt

Der Fahrplan.

5.2 (heute): Nexus v0-Pilot ist im 5.2.0-Alpha-Zyklus enthalten. Steht jetzt für Tests bereit.
5.3: Nexus v1 Produktion, aktualisierter Standard. Nexus Pro beginnt als Pro+-Option für Workstation-Kunden zu erscheinen.
5.4: Erster Cortex-Spezialist erscheint. Cortex Automotive für Flottenbetreiber und OEMs — auf bestehender Kunden-Hardware, auf Workstation-Tier mit zwei RTX PRO 6000 oder über Eldric-Cloud-Offload von im Fahrzeug laufenden Nexus-Instanzen über Nacht.
5.5 und folgende: Cortex Code, dann Cortex Finanzen, dann Cortex Medizin, dann Recht / Industrie / Wissenschaft / DevOps / IT / Sicherheit / Kreatives. Jeder erscheint zuerst eigenständig, dann wird er über Mixture-of-Experts-Routing in den zusammengestellten Multi-Domänen-Cortex integriert.

Kunden, die nur einen Cortex-Spezialisten betreiben, können auf Workstation-Tier einsetzen. Kunden, die den vollen Multi-Domänen-Cortex wollen, beziehen ihn über die Eldric-Cloud oder hosten ihn auf Rechenzentrums-Tier selbst, sobald die volle Zusammenstellung gelandet ist.

Siehe Was kommt für die breitere Architektur-Vorschau oder die Dokumentation für die Integrations-Geschichte.

Drei Stufen, eine Architektur,auf Ihre Hardware skaliert.