La capacità di riconoscimento + ragionamento di Eldric arriva in tre tier — la stessa primitiva architetturale a ogni scala, semplicemente più memoria, più esperti, più profondità man mano che aggiungi hardware. Nexus è in bundle con ogni installazione e gira su un Raspberry Pi 5. Nexus Pro richiede una workstation. Eldric Cortex richiede un datacenter. Tu scegli il tier; la piattaforma fa il resto.
| Tier | Cosa fa | Hardware | Licenza | Stato |
|---|---|---|---|---|
| Nexus | Riconosce i temi da ogni conversazione. Richiamo al microsecondo. | Qualsiasi CPU — da Raspberry Pi 5 in su | In bundle, tutti i tier | Disponibile oggi |
| Nexus Pro | Riconosce 100× più temi. Matching multi-esemplare per domini sfumati. | Workstation: 1 RTX 6000 o equivalente | Pro+ | In arrivo con 5.3 |
| Eldric Cortex | Ragiona sui tuoi dati. Generazione long-context. Esperti specializzati per dominio. | Doppia scheda da workstation OPPURE datacenter OPPURE cloud ospitato da Eldric | Enterprise | Primo specialista con 5.4 |
La stessa primitiva di matrix-memory alimenta tutti e tre. Nexus è lo strato di riconoscimento, Pro è lo stesso con rappresentazioni per-tema più ricche, Cortex è lo strato di ragionamento sopra. Puoi eseguire tutti e tre sulla stessa installazione; la piattaforma instrada il lavoro al tier licenziato e disponibile.
Lo strato di riconoscimento della piattaforma. Ogni conversazione, documento ed evento ottiene un tag tematico senza chiamare un modello linguistico — una singola moltiplicazione matriciale lo fa in microsecondi. Distillato da un modello frontier, impacchettato in un piccolo artefatto, gira sulla CPU che hai già. In bundle con ogni installazione di Eldric.
Un esempio concreto. Un messaggio utente recita:
"Il mio pod è CrashLoopBackOff. I log mostrano che l'app crasha con exit code 1 subito. Aggiungendo `command: sleep 3600` e facendo exec dentro per fare debug — l'app gira bene così."
Nexus riconosce questo come devops/container/k8s con alta confidenza e tagga la conversazione nella matrix memory dell'installazione del cliente. Fatto, all'incirca, nel tempo che serve a leggere la prima parola di questa frase.
Dove sta bene: automotive, edge, IoT, mobile — ovunque non sia disponibile una GPU e il riconoscimento debba comunque avvenire in continuo. Il Raspberry Pi 5 in officina, il SoC nell'auto parcheggiata di notte, il NUC nello sgabuzzino IT di una clinica.
Nexus Pro mantiene la primitiva di matrix-memory ma memorizza più esemplari rappresentativi per tema invece di un singolo vettore mediato. Un tema come "Python ML data wrangling" non viene collassato con "Python web backend" perché gli esemplari sono memorizzati separatamente e abbinati individualmente. Risultato: all'incirca 100× più temi, una disambiguazione più fine tra concetti vicini e un segnale di novità pulito quando una query non corrisponde a nessun esemplare memorizzato.
Per chi è: clienti con vocabolari profondi e specializzati. La tassonomia dei fascicoli di uno studio legale. La terminologia clinica di un ospedale. La struttura dei progetti di un laboratorio di ricerca. La gerarchia delle classi di transazione di una banca. Ovunque "168 temi generici" smetta di essere abbastanza granulare.
Cosa serve: hardware di tier workstation. Una singola scheda di classe RTX 6000 tiene Nexus Pro in memoria con headroom comodo; una workstation a doppia scheda lascia che giri accanto a un piccolo LLM per il ragionamento di Layer 3 senza thrashing.
Come i clienti la attivano: un amministratore di tier Pro+ apre la dashboard, seleziona "Nexus Pro" come tier di riconoscimento, e la piattaforma scarica l'artefatto del modello appropriato all'attivazione. Il Nexus di default resta disponibile come fallback per qualsiasi worker che non abbia l'hardware.
Cortex non è più solo un classificatore — è lo strato di ragionamento che genera insight da ciò che Nexus e Nexus Pro riconoscono. Quando devi spiegare PERCHÉ una conversazione è nuova, riassumere un anno di contesto in un solo passaggio o comporre una risposta che attinga all'intera storia istituzionale del cliente, Cortex è il modello che lo fa.
Costruito sulla stessa primitiva, scalato in alto. Cortex usa blocchi di matrix-memory ad architettura xLSTM — lo stesso richiamo associativo per prodotto esterno che alimenta Nexus e Nexus Pro, impilato in un modello generativo a scala frontier. L'attenzione lineare (non quadratica) significa che può leggere un anno di storia di sessioni in un singolo passaggio in avanti, senza l'esplosione della finestra di contesto che limita i modelli di ragionamento tradizionali basati su transformer.
Specializzato per dominio, non generico. Cortex viene rilasciato come famiglia di esperti di dominio — automotive, codice, medicale, finanza, legale, scienza, e così via — combinati attraverso un router Mixture-of-Experts. La maggior parte delle query attiva solo uno o due esperti, quindi il calcolo effettivo è molto inferiore alla dimensione totale del modello. I clienti che eseguono un solo dominio (un ospedale, un operatore di flotta, una banca) possono licenziare lo specialista corrispondente da solo ed eseguirlo su una workstation con doppia scheda di fascia alta. I clienti che vogliono il ragionatore multi-dominio completo licenziano il modello assemblato e lo eseguono su un tier datacenter, oppure lo consumano dal cloud ospitato da Eldric.
A cosa serve:
Gli esperti di dominio di Cortex vengono rilasciati uno alla volta, a partire da 5.4. Ogni esperto viene rilasciato come prodotto a sé stante per i clienti che hanno bisogno di un solo dominio, PRIMA che l'assemblaggio multi-dominio completo sia finito. Un ospedale può comprare Cortex Medical senza aspettare Cortex Finance. Una banca può comprare Cortex Finance senza aspettare Cortex Legal. Progresso continuo, non un singolo rilascio in cui finalmente tutto funziona.
Il motore di "sogno" di Eldric gira su tre strati — ciascuno trattabile su hardware diverso. I tier mappano sui livelli:
I primi due livelli sono inclusi in ogni installazione di Eldric. Il terzo è opzionale, opt-in, e si abbina al calcolo che hai deciso di allocare. Vedi in arrivo per l'anteprima architettura di 5.2.
Nexus, Nexus Pro e Cortex sono tutti costruiti sulla stessa primitiva: matrix memory associativa con aggiornamenti a prodotto esterno e richiamo matrice-vettore. Nexus la usa direttamente con un vettore mediato per tema. Nexus Pro la estende con più vettori esemplari per tema e retrieval in stile modern-Hopfield con softmax. Cortex la usa come blocco costitutivo di ogni esperto xLSTM in un modello di ragionamento Mixture-of-Experts. La famiglia scala aggiungendo più memoria e più calcolo — mai cambiando architettura.
Quella coerenza conta operativamente: un cliente che fa l'upgrade da Nexus a Nexus Pro mantiene la stessa tassonomia di temi. Un cliente che aggiunge Cortex sopra Pro mantiene la stessa struttura di dominio. L'intera famiglia capisce lo stesso mondo; i tier lo capiscono solo a profondità diverse.
Ogni tier viene rilasciato in una variante generale di default, con varianti specializzate per dominio disponibili per i verticali in cui il vocabolario conta:
Verticali aggiuntivi — legale, scienza, industria, devops, IT, sicurezza — atterrano nei rilasci successivi come esperti Cortex. Gli amministratori scelgono le varianti nella dashboard; lo switching è uno scambio di file, nessun riavvio del servizio.
I cervelli moderni riconoscono molto più di quanto generino. Quando entri in una stanza familiare non componi una descrizione di essa — la riconosci e basta. Il riconoscimento è un pattern match contro la memoria. La generazione è un processo diverso, e costa di più.
La maggior parte delle architetture AI collassa queste due — ogni classificazione diventa una chiamata LLM. Funziona su una workstation con GPU. Si rompe su un Raspberry Pi, su un'auto parcheggiata di notte, su un server di una sede remota. La famiglia di riconoscimento di Eldric è la scommessa che il riconoscimento può vivere separatamente dalla generazione — e che separarli è ciò che permette alla piattaforma di girare ovunque.
La scommessa sembra funzionare. Nexus risponde in microsecondi dove un classificatore basato su generazione impiegherebbe secondi. Il cliente che gestisce un service desk con 4 ingegneri su un NUC ottiene lo stesso comportamento di memoria e riconoscimento del cliente che gestisce un'organizzazione di engineering da 200 persone su un cluster da datacenter — hardware diverso, stessa forma di richiamo. E quando il ragionamento è ciò di cui la situazione ha davvero bisogno — quando un cliente vuole che Cortex scriva perché una conversazione è insolita, non solo che lo è — la famiglia scala fin lì senza abbandonare ciò che ha fatto funzionare lo strato di riconoscimento.
I clienti che eseguono un solo specialista Cortex possono fare deployment su tier workstation. I clienti che vogliono il Cortex multi-dominio completo lo consumano via cloud ospitato da Eldric, oppure lo self-host su tier datacenter quando l'assemblaggio completo atterra.
Vedi in arrivo per l'anteprima architetturale più ampia, oppure la documentazione per la storia di integrazione.