Eldric Nexus + Cortex — riconoscimento e ragionamento, scalati al tuo hardware

I tre tier a colpo d'occhio

Una famiglia. Tre scale.

Tier	Cosa fa	Hardware	Licenza	Stato
Nexus	Riconosce i temi da ogni conversazione. Richiamo al microsecondo.	Qualsiasi CPU — da Raspberry Pi 5 in su	In bundle, tutti i tier	Disponibile oggi
Nexus Pro	Riconosce 100× più temi. Matching multi-esemplare per domini sfumati.	Workstation: 1 RTX 6000 o equivalente	Pro+	In arrivo con 5.3
Eldric Cortex	Ragiona sui tuoi dati. Generazione long-context. Esperti specializzati per dominio.	Doppia scheda da workstation OPPURE datacenter OPPURE cloud ospitato da Eldric	Enterprise	Primo specialista con 5.4

La stessa primitiva di matrix-memory alimenta tutti e tre. Nexus è lo strato di riconoscimento, Pro è lo stesso con rappresentazioni per-tema più ricche, Cortex è lo strato di ragionamento sopra. Puoi eseguire tutti e tre sulla stessa installazione; la piattaforma instrada il lavoro al tier licenziato e disponibile.

Tier 1 · Nexus

Riconoscimento di pattern senza una chiamata LLM.

Lo strato di riconoscimento della piattaforma. Ogni conversazione, documento ed evento ottiene un tag tematico senza chiamare un modello linguistico — una singola moltiplicazione matriciale lo fa in microsecondi. Distillato da un modello frontier, impacchettato in un piccolo artefatto, gira sulla CPU che hai già. In bundle con ogni installazione di Eldric.

Un esempio concreto. Un messaggio utente recita:

"Il mio pod è CrashLoopBackOff. I log mostrano che l'app crasha con exit code 1 subito. Aggiungendo `command: sleep 3600` e facendo exec dentro per fare debug — l'app gira bene così."

Nexus riconosce questo come devops/container/k8s con alta confidenza e tagga la conversazione nella matrix memory dell'installazione del cliente. Fatto, all'incirca, nel tempo che serve a leggere la prima parola di questa frase.

Dove sta bene: automotive, edge, IoT, mobile — ovunque non sia disponibile una GPU e il riconoscimento debba comunque avvenire in continuo. Il Raspberry Pi 5 in officina, il SoC nell'auto parcheggiata di notte, il NUC nello sgabuzzino IT di una clinica.

Tier 2 · Nexus Pro

Riconoscimento più ricco per domini profondi.

Nexus Pro mantiene la primitiva di matrix-memory ma memorizza più esemplari rappresentativi per tema invece di un singolo vettore mediato. Un tema come "Python ML data wrangling" non viene collassato con "Python web backend" perché gli esemplari sono memorizzati separatamente e abbinati individualmente. Risultato: all'incirca 100× più temi, una disambiguazione più fine tra concetti vicini e un segnale di novità pulito quando una query non corrisponde a nessun esemplare memorizzato.

Per chi è: clienti con vocabolari profondi e specializzati. La tassonomia dei fascicoli di uno studio legale. La terminologia clinica di un ospedale. La struttura dei progetti di un laboratorio di ricerca. La gerarchia delle classi di transazione di una banca. Ovunque "168 temi generici" smetta di essere abbastanza granulare.

Cosa serve: hardware di tier workstation. Una singola scheda di classe RTX 6000 tiene Nexus Pro in memoria con headroom comodo; una workstation a doppia scheda lascia che giri accanto a un piccolo LLM per il ragionamento di Layer 3 senza thrashing.

Come i clienti la attivano: un amministratore di tier Pro+ apre la dashboard, seleziona "Nexus Pro" come tier di riconoscimento, e la piattaforma scarica l'artefatto del modello appropriato all'attivazione. Il Nexus di default resta disponibile come fallback per qualsiasi worker che non abbia l'hardware.

Tier 3 · Eldric Cortex

Ragionare sui tuoi dati.

Cortex non è più solo un classificatore — è lo strato di ragionamento che genera insight da ciò che Nexus e Nexus Pro riconoscono. Quando devi spiegare PERCHÉ una conversazione è nuova, riassumere un anno di contesto in un solo passaggio o comporre una risposta che attinga all'intera storia istituzionale del cliente, Cortex è il modello che lo fa.

Costruito sulla stessa primitiva, scalato in alto. Cortex usa blocchi di matrix-memory ad architettura xLSTM — lo stesso richiamo associativo per prodotto esterno che alimenta Nexus e Nexus Pro, impilato in un modello generativo a scala frontier. L'attenzione lineare (non quadratica) significa che può leggere un anno di storia di sessioni in un singolo passaggio in avanti, senza l'esplosione della finestra di contesto che limita i modelli di ragionamento tradizionali basati su transformer.

Specializzato per dominio, non generico. Cortex viene rilasciato come famiglia di esperti di dominio — automotive, codice, medicale, finanza, legale, scienza, e così via — combinati attraverso un router Mixture-of-Experts. La maggior parte delle query attiva solo uno o due esperti, quindi il calcolo effettivo è molto inferiore alla dimensione totale del modello. I clienti che eseguono un solo dominio (un ospedale, un operatore di flotta, una banca) possono licenziare lo specialista corrispondente da solo ed eseguirlo su una workstation con doppia scheda di fascia alta. I clienti che vogliono il ragionatore multi-dominio completo licenziano il modello assemblato e lo eseguono su un tier datacenter, oppure lo consumano dal cloud ospitato da Eldric.

A cosa serve:

Riassunti ad arco lungo. "Su cosa ha lavorato questo utente questo mese?" — un anno di embedding di sessione come contesto di input, riassunto in un solo passaggio.
Ragionamento cross-dominio. "Le domande di codice di questo utente sulle regex sono collegate al suo lavoro di compliance — sta parsando testo legale" — Cortex compone la connessione.
Spiegazione di topic novelli. Quando Nexus o Pro segnala una sessione come insolitamente distante da qualsiasi tema noto, Cortex spiega perché è nuova e cosa suggerisce sulla traiettoria dell'utente.
Report di anomalie. Il tipo di spiegazione in prosa chiara che scriverebbe un analista umano, generata automaticamente dai pattern della matrix-memory.

Gli esperti di dominio di Cortex vengono rilasciati uno alla volta, a partire da 5.4. Ogni esperto viene rilasciato come prodotto a sé stante per i clienti che hanno bisogno di un solo dominio, PRIMA che l'assemblaggio multi-dominio completo sia finito. Un ospedale può comprare Cortex Medical senza aspettare Cortex Finance. Una banca può comprare Cortex Finance senza aspettare Cortex Legal. Progresso continuo, non un singolo rilascio in cui finalmente tutto funziona.

Come si incastra il tutto

I tre strati del sogno.

Il motore di "sogno" di Eldric gira su tre strati — ciascuno trattabile su hardware diverso. I tier mappano sui livelli:

Livello 1 — Memoria. Ogni conversazione viene ripiegata nella matrix memory della tua installazione. Solo CPU, millisecondi per evento. In bundle.
Livello 2 — Riconoscimento di pattern. Nexus (default, CPU) o Nexus Pro (workstation, multi-esemplare). L'operazione matrice-vettore che alimenta la memoria, applicata contro il classificatore di riconoscimento per estrarre i temi. Microsecondi per evento.
Livello 3 — Insight. Il modello di ragionamento che genera spiegazioni, riassunti e report di anomalia. I clienti possono configurare qualsiasi LLM qui — ma Cortex è la famiglia di modelli specificamente progettata per questo livello, con contesto lungo ad attenzione lineare ed esperti specializzati per dominio.

I primi due livelli sono inclusi in ogni installazione di Eldric. Il terzo è opzionale, opt-in, e si abbina al calcolo che hai deciso di allocare. Vedi in arrivo per l'anteprima architettura di 5.2.

Un'unica architettura tra i tre

Memoria a prodotto esterno, scalata in tre modi.

Nexus, Nexus Pro e Cortex sono tutti costruiti sulla stessa primitiva: matrix memory associativa con aggiornamenti a prodotto esterno e richiamo matrice-vettore. Nexus la usa direttamente con un vettore mediato per tema. Nexus Pro la estende con più vettori esemplari per tema e retrieval in stile modern-Hopfield con softmax. Cortex la usa come blocco costitutivo di ogni esperto xLSTM in un modello di ragionamento Mixture-of-Experts. La famiglia scala aggiungendo più memoria e più calcolo — mai cambiando architettura.

Quella coerenza conta operativamente: un cliente che fa l'upgrade da Nexus a Nexus Pro mantiene la stessa tassonomia di temi. Un cliente che aggiunge Cortex sopra Pro mantiene la stessa struttura di dominio. L'intera famiglia capisce lo stesso mondo; i tier lo capiscono solo a profondità diverse.

Cosa ottieni con ogni installazione di Eldric

Nexus in bundle. Pro e Cortex opt-in.

Il Nexus di default è in bundle con ogni installazione di Eldric. Nessun download separato, nessun setup, nessuna GPU richiesta. Richiamo dei temi al microsecondo su qualsiasi CPU tu abbia.
Nexus Pro è opt-in tier Pro+. L'amministratore lo attiva dalla dashboard; la piattaforma scarica l'artefatto al primo uso. Richiede una GPU da workstation; ricade sul Nexus di default se l'hardware non è disponibile.
Cortex è opt-in Enterprise. Specialisti per dominio licenziati separatamente per i clienti che eseguono un singolo settore verticale (ospedale, flotta, banca). Assemblaggio multi-dominio completo licenziato come pacchetto per deployment cross-verticali. Opzione cloud ospitata da Eldric per i clienti senza hardware da datacenter.
La postura di privacy è coerente tra i tier. Nexus e Nexus Pro girano interamente in locale. Cortex gira on-premise di default; l'opzione cloud richiede consenso esplicito dell'amministratore per classe di query.

Versioni + domini

Generale di default. Specializzata dove conta.

Ogni tier viene rilasciato in una variante generale di default, con varianti specializzate per dominio disponibili per i verticali in cui il vocabolario conta:

Generale — il default. Copre conversazione, codice, devops, IT, sicurezza, creatività, finanza, medicina, legale, scienza, industria, automotive e forecasting fuori dalla scatola.
Codice — specializzata per i workflow di software engineering.
Medicale — specializzata per la terminologia clinica e farmaceutica. Tier Pro+.
Finanza — specializzata per portafogli, mercati, banche, contesti regolatori. Tier Pro+.
Automotive — specializzata per telemetria veicolare, pattern di guida, operazioni di flotta. Tier Enterprise (Cortex Automotive — il primo specialista 5.4).

Verticali aggiuntivi — legale, scienza, industria, devops, IT, sicurezza — atterrano nei rilasci successivi come esperti Cortex. Gli amministratori scelgono le varianti nella dashboard; lo switching è uno scambio di file, nessun riavvio del servizio.

Perché funziona

Riconoscere non è generare.

I cervelli moderni riconoscono molto più di quanto generino. Quando entri in una stanza familiare non componi una descrizione di essa — la riconosci e basta. Il riconoscimento è un pattern match contro la memoria. La generazione è un processo diverso, e costa di più.

La maggior parte delle architetture AI collassa queste due — ogni classificazione diventa una chiamata LLM. Funziona su una workstation con GPU. Si rompe su un Raspberry Pi, su un'auto parcheggiata di notte, su un server di una sede remota. La famiglia di riconoscimento di Eldric è la scommessa che il riconoscimento può vivere separatamente dalla generazione — e che separarli è ciò che permette alla piattaforma di girare ovunque.

La scommessa sembra funzionare. Nexus risponde in microsecondi dove un classificatore basato su generazione impiegherebbe secondi. Il cliente che gestisce un service desk con 4 ingegneri su un NUC ottiene lo stesso comportamento di memoria e riconoscimento del cliente che gestisce un'organizzazione di engineering da 200 persone su un cluster da datacenter — hardware diverso, stessa forma di richiamo. E quando il ragionamento è ciò di cui la situazione ha davvero bisogno — quando un cliente vuole che Cortex scriva perché una conversazione è insolita, non solo che lo è — la famiglia scala fin lì senza abbandonare ciò che ha fatto funzionare lo strato di riconoscimento.

Dove sta andando

La roadmap.

5.2 (oggi): il pilot di Nexus v0 è in bundle con il ciclo 5.2.0-alpha. Disponibile per i test fin da subito.
5.3: Nexus v1 in produzione, default rinfrescato. Nexus Pro inizia il rilascio come opzione Pro+ per i clienti workstation.
5.4: rilascio del primo specialista Cortex. Cortex Automotive per operatori di flotta e OEM — girando sull'hardware esistente dei clienti, su workstation a doppia RTX PRO 6000, oppure via cloud-offload ospitato da Eldric dalle istanze Nexus in-vehicle durante la notte.
5.5 e oltre: Cortex Code, poi Cortex Finance, poi Cortex Medical, poi Legale / Industriale / Scienza / Devops / IT / Sicurezza / Creativo. Ciascuno viene rilasciato dapprima a sé stante, poi entra nell'assemblato Cortex multi-dominio tramite il routing Mixture-of-Experts.

I clienti che eseguono un solo specialista Cortex possono fare deployment su tier workstation. I clienti che vogliono il Cortex multi-dominio completo lo consumano via cloud ospitato da Eldric, oppure lo self-host su tier datacenter quando l'assemblaggio completo atterra.

Vedi in arrivo per l'anteprima architetturale più ampia, oppure la documentazione per la storia di integrazione.

Tre tier, una sola architettura,scalati al tuo hardware.