Die Erkennungs-Familie

Drei Stufen, eine Architektur,
auf Ihre Hardware skaliert.

Eldrics Erkennungs- und Reasoning-Schicht kommt in drei Stufen — dasselbe architektonische Prinzip in jeder Größenordnung, nur mit mehr Gedächtnis, mehr Experten und mehr Tiefe, je nachdem wie viel Hardware Sie hinzufügen. Nexus ist in jeder Installation enthalten und läuft auf einem Raspberry Pi 5. Nexus Pro braucht eine Workstation. Eldric Cortex braucht ein Rechenzentrum. Sie wählen die Stufe; die Plattform erledigt den Rest.


Die drei Stufen auf einen Blick

Eine Familie. Drei Größenordnungen.

Stufe Was sie macht Hardware Lizenz Status
Nexus Erkennt Themen aus jeder Konversation. Erkennung in Mikrosekunden. Jede CPU — ab Raspberry Pi 5 Enthalten, alle Lizenzen Heute verfügbar
Nexus Pro Erkennt 100× mehr Themen. Vergleich gegen mehrere Beispiele pro Thema, für nuancierte Domänen. Workstation: 1× RTX 6000 oder vergleichbar Pro+ Kommt mit 5.3
Eldric Cortex Reasoning über Ihre Daten. Generierung mit langem Kontext. Domänenspezialisierte Experten. Zwei Workstation-Karten oder Rechenzentrum oder Eldric-Cloud Enterprise Erster Spezialist mit 5.4

Dasselbe Matrix-Memory-Prinzip trägt alle drei. Nexus ist die Erkennungs-Schicht, Pro ist dieselbe mit reichhaltigeren Repräsentationen pro Thema, Cortex ist die darauf aufbauende Reasoning-Schicht. Sie können alle drei in derselben Installation parallel betreiben; die Plattform leitet Aufgaben an die Stufe weiter, die lizenziert und verfügbar ist.


Stufe 1 · Nexus

Mustererkennung ohne LLM-Aufruf.

Die Erkennungs-Schicht der Plattform. Jede Konversation, jedes Dokument und jedes Ereignis bekommt eine Themen-Markierung, ohne ein Sprachmodell aufzurufen — eine einzige Matrix-Multiplikation erledigt das in Mikrosekunden. Aus einem Frontier-Modell destilliert, in ein kleines Artefakt gepackt, läuft auf der CPU, die Sie ohnehin haben. In jeder Eldric-Installation enthalten.

Ein konkretes Beispiel. Eine Benutzer-Nachricht liest sich:

„Mein Pod ist CrashLoopBackOff. Die Logs zeigen Exit-Code 1 sofort beim Start. Wenn ich `command: sleep 3600` setze und mich reinexece, läuft die App problemlos."

Nexus erkennt das mit hoher Konfidenz als devops/container/k8s und versieht die Konversation im Matrix-Memory der jeweiligen Installation mit dem Tag. Erledigt in ungefähr der Zeit, in der man das erste Wort dieses Satzes liest.

Wo es passt: Automotive, Edge, IoT, Mobile — überall dort, wo keine GPU verfügbar ist und Erkennung trotzdem kontinuierlich passieren muss. Der Raspberry Pi 5 in einer Werkstatt, der SoC im geparkten Auto über Nacht, der NUC im IT-Schrank einer Klinik.


Stufe 2 · Nexus Pro

Reichhaltigere Erkennung für tiefe Domänen.

Nexus Pro behält das Matrix-Memory-Prinzip bei, speichert aber mehrere repräsentative Exemplare pro Thema statt eines gemittelten Vektors. Ein Thema wie „Python ML-Data-Wrangling" wird nicht mit „Python Web-Backend" verschmolzen, weil die Exemplare getrennt gespeichert und einzeln verglichen werden. Ergebnis: rund 100× mehr Themen, schärfere Unterscheidung zwischen nahe verwandten Konzepten und ein sauberes Neuheits-Signal, wenn eine Anfrage zu keinem gespeicherten Exemplar passt.

Für wen das ist: Kunden mit tiefen, spezialisierten Vokabularen. Die Fall-Taxonomie einer Anwaltskanzlei. Die klinische Terminologie eines Krankenhauses. Die Projektstruktur eines Forschungslabors. Die Transaktions-Klassen-Hierarchie einer Bank. Überall dort, wo „168 generische Themen" nicht granular genug ist.

Was es braucht: Workstation-Hardware. Eine einzelne RTX-6000-Klasse-Karte hält Nexus Pro mit komfortablem Spielraum im Speicher; eine Workstation mit zwei Karten erlaubt zusätzlich einen kleinen LLM für Schicht-3-Reasoning daneben, ohne dass es eng wird.

Wie Kunden es einschalten: Ein Admin auf der Pro+-Lizenz öffnet das Dashboard, wählt „Nexus Pro" als Erkennungs-Stufe, und die Plattform lädt das passende Modell-Artefakt bei der Aktivierung. Das Standard-Nexus bleibt als Fallback für jeden Worker verfügbar, der die Hardware nicht hat.


Stufe 3 · Eldric Cortex

Reasoning über Ihre Daten.

Cortex ist nicht mehr nur ein Klassifizierer — es ist die Reasoning-Schicht, die erzeugt, was Nexus und Nexus Pro erkennen. Wenn Sie verstehen wollen, warum eine Konversation neuartig ist, ein Jahr Kontext in einem Durchlauf zusammenfassen müssen oder eine Antwort komponieren müssen, die auf der gesamten institutionellen Historie des Kunden basiert, ist Cortex das Modell, das das macht.

Auf demselben Prinzip gebaut, hochskaliert. Cortex verwendet xLSTM-Matrix-Memory-Blöcke — denselben assoziativen Recall, der Nexus und Nexus Pro trägt, gestapelt zu einem generativen Modell in Frontier-Größe. Lineare Attention (nicht quadratisch) bedeutet, dass Cortex ein Jahr an Sitzungs-Historie in einem einzigen Durchgang lesen kann, ohne dass die Kontextfenster-Begrenzung auftritt, die transformer-basierte Reasoning-Modelle limitiert.

Domänenspezialisiert, nicht generisch. Cortex kommt als Familie von Domänen-Experten — Automotive, Code, Medizin, Finanzen, Recht, Wissenschaft und so weiter — kombiniert über einen Mixture-of-Experts-Router. Die meisten Anfragen aktivieren nur ein oder zwei Experten, sodass die effektive Rechenlast viel geringer ist als die Gesamt-Modellgröße. Kunden, die nur eine Domäne betreiben (ein Krankenhaus, ein Flottenbetreiber, eine Bank), können den passenden Spezialisten allein lizenzieren und auf einer Workstation mit zwei High-End-Karten laufen lassen. Kunden, die den vollen Multi-Domänen-Reasoner wollen, lizenzieren das zusammengestellte Modell als Paket und betreiben es auf Rechenzentrums-Hardware oder beziehen es aus der Eldric-Cloud.

Wofür es da ist:

Cortex' Domänen-Experten erscheinen einzeln, beginnend mit 5.4. Jeder Experte erscheint als eigenständiges Produkt für Kunden, die nur eine Domäne brauchen, bevor die volle Multi-Domänen-Zusammenstellung abgeschlossen ist. Ein Krankenhaus kann Cortex Medizin kaufen, ohne auf Cortex Finanzen zu warten. Eine Bank kann Cortex Finanzen kaufen, ohne auf Cortex Recht zu warten. Kontinuierlicher Fortschritt, nicht eine einzige Veröffentlichung, in der schließlich alles funktioniert.


Wie es zusammenpasst

Die drei Schichten des Träumens.

Eldrics Traum-Engine läuft in drei Schichten — jede auf anderer Hardware tragfähig. Die Stufen bilden sich auf die Schichten ab:

Die ersten beiden Schichten sind in jeder Eldric-Installation enthalten. Die dritte ist optional, ausdrücklich aktiviert und durch die Rechenleistung begrenzt, die Sie zuzuteilen entschieden haben. Siehe Was kommt für die 5.2-Architektur-Vorschau.


Eine Architektur über alle drei

Assoziatives Gedächtnis, drei Mal skaliert.

Nexus, Nexus Pro und Cortex sind alle auf demselben Prinzip aufgebaut: assoziatives Matrix-Memory mit assoziativen Updates und Direkt-Recall. Nexus verwendet es direkt mit einem gemittelten Vektor pro Thema. Nexus Pro erweitert es mit mehreren Beispiel-Vektoren pro Thema und komprimiertem Softmax-Retrieval. Cortex verwendet es als Baustein jedes xLSTM-Experten in einem Mixture-of-Experts-Reasoning-Modell. Die Familie skaliert durch mehr Gedächtnis und mehr Rechenleistung — niemals durch Architektur-Wechsel.

Diese Kohärenz zählt operativ: Ein Kunde, der von Nexus auf Nexus Pro umsteigt, behält dieselbe Themen-Taxonomie. Ein Kunde, der Cortex über Pro hinaus ergänzt, behält dieselbe Domänen-Struktur. Die ganze Familie versteht dieselbe Welt; die Stufen verstehen sie nur in unterschiedlicher Tiefe.


Was Sie auf jeder Eldric-Installation bekommen

Nexus mitgeliefert. Pro und Cortex aktiviert.


Versionen + Domänen

Generell standardmäßig. Spezialisiert, wo es zählt.

Jede Stufe kommt in einer generellen Variante; für Branchen, in denen das Vokabular zählt, sind domänen-spezialisierte Varianten verfügbar:

Weitere Branchen — Recht, Wissenschaft, Industrie, DevOps, IT, Sicherheit — folgen in späteren Releases als Cortex-Experten. Admins wählen Varianten im Dashboard; der Wechsel ist ein Datei-Tausch, kein Service-Neustart.


Warum das funktioniert

Erkennen ist nicht Erzeugen.

Moderne Gehirne erkennen weit mehr, als sie erzeugen. Wenn Sie einen vertrauten Raum betreten, verfassen Sie keine Beschreibung von ihm — Sie wissen einfach, was er ist. Erkennen ist Muster-Vergleich gegen Gedächtnis. Erzeugen ist ein anderer Prozess, und es kostet mehr.

Die meisten KI-Architekturen vermengen die beiden — jede Klassifikation wird zu einem Modell-Aufruf. Das funktioniert auf einer Workstation mit GPU. Es bricht auf einem Raspberry Pi, in einem geparkten Auto, auf einem Server in einer Außenstelle. Eldrics Erkennungs-Familie ist die Wette, dass Erkennen getrennt von Erzeugen leben kann — und dass diese Trennung der Plattform erlaubt, überall zu laufen.

Die Wette scheint aufzugehen. Nexus antwortet in Mikrosekunden, wo ein generativer Klassifizierer Sekunden braucht. Der Kunde mit einem 4-Personen-Service-Desk auf einem NUC bekommt das gleiche Gedächtnis- und Erkennungs-Verhalten wie der Kunde mit einer 200-Personen-Engineering-Organisation auf einem Rechenzentrums-Cluster — unterschiedliche Hardware, gleiches Recall-Verhalten. Und wenn Reasoning das ist, was die Situation tatsächlich braucht — wenn ein Kunde will, dass Cortex aufschreibt, warum eine Konversation ungewöhnlich ist, nicht nur dass sie es ist — skaliert die Familie dorthin, ohne aufzugeben, was die Erkennungs-Schicht überhaupt funktionieren ließ.


Wohin das führt

Der Fahrplan.

Kunden, die nur einen Cortex-Spezialisten betreiben, können auf Workstation-Tier einsetzen. Kunden, die den vollen Multi-Domänen-Cortex wollen, beziehen ihn über die Eldric-Cloud oder hosten ihn auf Rechenzentrums-Tier selbst, sobald die volle Zusammenstellung gelandet ist.

Siehe Was kommt für die breitere Architektur-Vorschau oder die Dokumentation für die Integrations-Geschichte.