Release notes — Eldric 5.0 GA

Eldric 5.0.
Disponibile in generale.

Pubblicato il 2026-05-24 come v5.0.0; aggiornato a v5.0.1 il 2026-05-25. La famiglia xLSTM è ora un tipo di workload di prima classe. Export/import bundle lato admin per spostare conoscenza fra installazioni. Installazione del runtime edge su Raspberry Pi, Intel NUC e NVIDIA Jetson. Sottosistema di memoria multi-livello completo con persistenza resistente ai crash. Sedici domini scientifici. Lo stack multi-worker completo con parità di funzionalità rispetto alla 4.x.


Patch — v5.0.1 (2026-05-25)

Cosa corregge la 5.0.1.

La v5.0.1 esce un giorno dopo la GA della v5.0.0. L'auto-aggiornamento Sparkle su macOS porta le installazioni esistenti v5.0.0 (e qualsiasi build alpha precedente) alla v5.0.1 al prossimo ciclo di polling; i clienti Linux eseguono sudo dnf update eldric-aios.


Titolo

In una frase.

Eldric 5.0 distribuisce IA ispirata al cervello come server che eseguite sul vostro hardware — multi-tenant, multi-worker, con bundle di conoscenza portabili, deployment edge da Pi a Jetson e un daemon ML strutturato per la famiglia xLSTM accanto allo stack LLM.


Novità della 5.0

Gli avanzamenti principali.

Worker xLSTM per ML strutturato

Il daemon eldric-xlstmd (porta 8884) serve quattro classi di workload da un unico processo: esecuzione di policy (LRAM), forecasting (TiRex), encoding (ViL) e retrieval associativo (in stile Hopfield). Il router gli inoltra per tipo di workload; il gateway edge fa da proxy; il worker IoT vincola l'esecuzione delle policy a loop di controllo in tempo reale con interlock di sicurezza. Il backend di retrieve è codice nativo con latenza dell'ordine dei microsecondi sulla sola CPU. Soggetto a licenza per workload, risposte di errore strutturate sulle capacità mancanti.

Binding IoT a loop chiuso

Controllo guidato da policy di endpoint OPC-UA, Modbus e MQTT-Sparkplug-B attraverso il worker IoT. Gli interlock di sicurezza sono attivi per impostazione predefinita: clamp di magnitudo sull'output, controlli sui limiti di giunto, timeout watchdog, rifiuto dei NaN e un percorso di emergency-stop. I binding possono essere fissati a uno specifico worker xLSTM o impostati per il failover automatico. Streaming tramite trasporto WebSocket per latenza sub-tick; OPC-UA e MQTT-Sparkplug-B per sottoscrizioni a livello di flotta; fallback guidato dal watchdog (zero / freeze / last-known-good) quando il worker di policy non rispetta la scadenza. Dettagli su xLSTM & trasporti IoT.

Export / import bundle lato admin

Impacchettate la matrix memory, i documenti vettoriali, le sorgenti delle basi di conoscenza, i classificatori ENRN, le skill, le voci del registro sorgenti, gli artefatti di dreaming e le overlay di identità di un'installazione Eldric in un singolo file firmato. Spedirlo. Spacchettare su un altro cluster con un merge pulito — stessa versione o diversa. Filtri di ambito per tenant in modo che un export non porti mai con sé dati di altri tenant. Utile per la portabilità del tenant, il passaggio di progetto, il seeding dell'edge, la federazione leggera fra cluster regionali e il disaster recovery.

Runtime edge

Installazione Eldric a nodo singolo su Raspberry Pi 4 (4 GB+ di RAM, 32 GB+ di storage), Intel NUC e NVIDIA Jetson. Base di conoscenza locale, matrix memory locale, chat locale senza un controller in vista. Mette in buffer le scritture quando il collegamento al cluster centrale è giù e le svuota quando torna. Il livello cognitivo di una piattaforma autonoma, sulla piattaforma.

Sottosistema di memoria

Memoria multi-livello: matrix memory (aggiornamenti ispirati a mLSTM), vector RAG (ricerca full-text + semantica), classificatori ENRN, la matrice Agente × Dominio (15 agenti × 7 domini). Persistenza resistente ai crash con checksum di integrità. Richiamo di memoria sotto il millisecondo sui percorsi caldi.

RAG con citazioni

La generazione aumentata dal retrieval è attiva per impostazione predefinita nella 5.0. Caricate documenti (PDF, DOCX, Markdown, testo semplice, codice, CSV, audio, video, stream da sensori) e la piattaforma li fa passare attraverso un chunking basato sul contenuto — strategie diverse per ogni tipo di contenuto, con il flusso di upload intelligente che suggerisce i parametri e vi permette di sovrascriverli prima del commit. Il modello GGUF nativo di embedding (~80 MB, gira su CPU) effettua l'embedding in locale; il data worker memorizza i chunk accanto ai vettori; le query citano i passaggi di origine all'utente. La classificazione personalizzata (Pro+) vi permette di insegnare al router le vostre classi di intent. Il loop di ritenzione trasforma nel tempo le risposte accettate nel prossimo corpus di addestramento. Si veda usare il RAG, architettura RAG, strategie di chunking, RAG on demand, classificazione personalizzata.

Scienza

Il Registro delle sorgenti (§43) raggruppa le sorgenti di dati scientifici in sedici categorie con ventotto sorgenti inizializzate e un punto di ingresso per plugin per aggiungere le proprie. Undici strumenti richiamabili dall'LLM inoltrati tramite un unico endpoint. Bioinformatica, farmacologia, CRISPR, LIMS, materiali, clima, neuroscienze, fisica delle particelle, onde gravitazionali, agenzie spaziali e altro ancora.

Altri worker

Worker di comunicazione (email, SMS, VoIP, WhatsApp, Signal, Teams, XMPP). Worker media (STT, TTS, elaborazione video). Worker di training (backend Unsloth, Axolotl, TRL, MLX, llama.cpp, xLSTM). Swarm controller, Agent worker, Data worker, Cloud worker, daemon Native Inference — tutti pronti per la produzione con parità di funzionalità rispetto alla 4.x.

Auto-aggiornamento su macOS

Il client GUI macOS porta un aggiornatore in-app firmato crittograficamente. I nuovi rilasci vengono raccolti automaticamente dal server dei pacchetti con una piccola notifica nell'app; l'aggiornamento si applica al prossimo avvio. I canali di aggiornamento sono stable per impostazione predefinita e beta come opt-in dalle impostazioni della GUI.

Memoria più veloce e più piccola (anteprima)

Un'anteprima di ricerca del retrieval Modern Hopfield Compressed è disponibile nella 5.0 come opt-in. I clienti possono convertire il livello di matrix memory di una base di conoscenza in una rappresentazione compressa più piccola su disco e più veloce ad alta concorrenza, con un piccolo compromesso di accuratezza sul tipo di query limite in cui il retrieval esatto conta di più. Il percorso a precisione piena resta disponibile accanto. Dettagli su retrieval avanzato.

Inferenza con memoria intelligente (anteprima)

Il daemon di inferenza ora consulta il livello di matrix memory direttamente ai confini del prompt. Le risposte del modello sono ancorate ai dati del vostro tenant senza un round-trip di retrieval separato — utile per workload in stile chat dove la latenza totale conta e per contenuti specifici del cliente dove altrimenti il modello produrrebbe una prima passata generica. Overhead per token sotto i 2 ms su CPU. Opt-in Pro+. Dettagli su inferenza con memoria intelligente.

Eldric per iPad

Il client iPad arriva come parte della forma universale dell'app accanto a iPhone. Vista divisa consapevole del tablet (sidebar + chat + artefatto), composer flottante, Apple Pencil e Scribble, drag-and-drop di ingest da File / Foto / Mail, centro notifiche per attività agentiche di lunga durata. Le impostazioni del tema si sincronizzano fra tutti i client tramite il controller. Multi-finestra per Stage Manager + Split View arriva come anteprima. TestFlight oggi, App Store dopo. Dettagli su iPad.

Interfaccia admin Agent Builder

Il flusso "IA che costruisce IA" ha ora un'interfaccia admin nella shell di chat. Descrivete l'agente che volete; la piattaforma genera il codice dell'agente, le definizioni degli strumenti, i prompt e i casi di test; esecuzioni di test sandboxate verificano il comportamento prima del deployment. Il generatore e il builder condividono il formato del pacchetto agente; entrambi i percorsi producono una directory agents/<nome>/ autonoma da mettere sotto controllo di versione.

Classificatore router distillato (anteprima)

Un classificatore di router-intent ENRN v18 è disponibile come opt-in per i livelli Professional ed Enterprise. Sostituisce la decisione di routing di un piccolo LLM con un classificatore neurale a passata singola, addestrato sui pattern di routing accumulati dal vostro cluster. Latenza più bassa sulla decisione di routing, meno tempo GPU consumato nella classificazione; l'LLM resta nel loop per le query genuinamente ambigue. Si veda retrieval avanzato per il dettaglio orientato al cliente.

Runtime edge minimale ARM64 — live

Il pacchetto del runtime minimale ora viene fornito come RPM aarch64 firmato accanto a x86-64. Lo stesso installer in una riga rileva l'architettura dell'host e installa la build giusta. Verificato su Raspberry Pi 4, server ARM64 generici e NVIDIA Jetson. Si veda installazione edge per i percorsi di deployment.

Trasporti industriali

I binding di policy xLSTM del worker IoT pilotano WebSocket, Modbus TCP e la metà publish di MQTT-Sparkplug-B in GA (livello Pro+). OPC-UA arriva in anteprima nella 5.0 GA — il codice sorgente C++ è nel rilascio, la libreria open62541 viene impacchettata nell'RPM del cluster al prossimo taglio. La metà subscribe di MQTT — l'ingresso di osservazioni da una flotta di sensori Sparkplug-B attraverso il worker di policy — resta in anteprima per la linea 5.0 e arriva con prossime patch 5.0.x. Il fallback di sicurezza (zero / freeze / last-known-good) è incondizionato su tutti i trasporti. Si veda xLSTM & IoT e problemi noti.

Badge modello in chat

Ogni modello nel picker di chat mostra un piccolo badge colorato che identifica il backend che lo serve — Ollama, OpenAI, Eldric Inferenced, vLLM, llama.cpp, Anthropic, xAI, Groq e gli altri. Verde per i modelli sul vostro cluster, colore del brand per le API esterne. Lo stesso badge appare sotto ogni messaggio dell'assistente, così vedete sempre quale backend lo ha servito. Nessun re-routing silenzioso fra locale ed esterno. Dettaglio rivolto al cliente su fornitori di modelli.

Informazioni sulle query degli strumenti in chat

Un nuovo toggle Mostra dettagli query strumento nelle impostazioni di chat (attivo per impostazione predefinita) stampa un riepilogo in una riga di ciò che ogni strumento ha effettivamente interrogato — base di conoscenza + namespace + query + numero di hit per il RAG, sorgente + query per le ricerche scientifiche, motore di ricerca + termini per il web, destinatario per il worker di comunicazione. Disattivatelo per una trascrizione più densa. Disponibile in tutti i client di chat.

Agent Builder share, publish, edit

Gli agenti che costruite nella shell di chat hanno ora condivisione con un clic all'interno del tenant, pubblicazione sul marketplace per la revisione dell'admin di cluster e un editor in-place con versionamento. Esecuzioni di test sandboxate validano ogni cambiamento prima del deploy. Il formato del pacchetto agente resta lo stesso — agents/<nome>/ — così editing manuale e UI sono allineati.

iPad Fase D — multi-finestra, scorciatoie da tastiera, drag-and-drop

La Fase D aggiunge multi-finestra Stage Manager + Split View, una mappa completa di scorciatoie da tastiera per le azioni di chat, drag tra finestre per biforcare una conversazione e un toast di collisione quando due client modificano lo stesso tema. macOS mostra ora anche le attività di lunga durata come voci native UNUserNotification, con APNs collegate per i push remoti da eventi del cluster. Si veda pagina iPad.

Piano di controllo dei workload xLSTM

UI admin per le quattro classi di workload xLSTM — policy, forecast, encode, retrieve — con abilitazione per tenant, selettore di modello per classe e grafico di carico live. Indirizzare le richieste al worker xLSTM non richiede più che un admin legga del JSON.

CLI di migrazione mHC e toggle per namespace

I namespace di matrix memory esistenti possono essere migrati alla variante Modern Hopfield Compressed su base per-namespace con un singolo comando. La shell di chat mostra l'avanzamento della migrazione; il rollback è un singolo comando. Permette ai clienti di adottare il nuovo formato sui namespace che ne beneficiano senza impegnare l'intera installazione in un colpo solo.

Packaging multi-distro — in arrivo poco dopo la GA

La 5.0 GA distribuisce RPM firmati per la famiglia Fedora / RHEL / CentOS / Rocky / Alma. I pacchetti DEB di Ubuntu 24.04 e Debian 12 seguono poco dopo la GA. I clienti su Ubuntu / Debian oggi possono eseguire la 5.0 tramite WSL2 o container.


In arrivo con prossime patch 5.0.x

Cosa arriva nel treno di patch.

Tutti i rinvii sono documentati sul catalogo funzionalità con marcatori WIP, e l'elenco rivolto al cliente con stato è su problemi noti.


Noti alla GA

Follow-up della prima settimana.

L'elenco completo degli open items vive su problemi noti. L'ambito condensato della prima settimana — voci che la chiusura GA ha intercettato per il ciclo 5.0.1:


Aggiornamento

Da 5.0-alpha a 5.0 GA.

I clienti sulla linea 5.0-alpha si aggiornano tramite l'orchestratore di rolling-update. sudo dnf update eldric-aios su ogni nodo, nell'ordine specificato dall'orchestratore; il controller fa il drain, installa e riavvia ogni nodo a turno mentre il resto del cluster gestisce il traffico. Per le installazioni a nodo singolo, lo standard dnf update funziona direttamente. Percorso di aggiornamento testato su Fedora 42+, RHEL 9+, CentOS Stream 9+. Clienti su 4.x: scrivete a support@eldric.ai per il playbook di migrazione.


Licenza

Livelli e funzionalità.

Il livello free include il kernel completo: un controller, un router, due worker, tutte le funzionalità per la valutazione e l'uso di piccoli team. I livelli Standard / Professional / Enterprise aggiungono capacità, funzionalità multi-tenant, l'export/import dei bundle, le classi di workload xLSTM e i workflow federati. I file di licenza sono firmati e gestiscono le funzionalità a runtime — si veda prezzi per la suddivisione dei livelli.


Avanti.

Per installare: inizia. Per vedere cosa è cambiato in dettaglio: novità. Per il catalogo completo delle funzionalità: funzionalità. Per la piattaforma applicata al vostro dominio: applicate Eldric al vostro dominio.