Eldric 5.0 GA — release notes

Novità della 5.0

Gli avanzamenti principali.

Worker xLSTM per ML strutturato

Il daemon eldric-xlstmd (porta 8884) serve quattro classi di workload da un unico processo: esecuzione di policy (LRAM), forecasting (TiRex), encoding (ViL) e retrieval associativo (in stile Hopfield). Il router gli inoltra per tipo di workload; il gateway edge fa da proxy; il worker IoT vincola l'esecuzione delle policy a loop di controllo in tempo reale con interlock di sicurezza. Il backend di retrieve è codice nativo con latenza dell'ordine dei microsecondi sulla sola CPU. Soggetto a licenza per workload, risposte di errore strutturate sulle capacità mancanti.

Binding IoT a loop chiuso

Controllo guidato da policy di endpoint OPC-UA, Modbus e MQTT-Sparkplug-B attraverso il worker IoT. Gli interlock di sicurezza sono attivi per impostazione predefinita: clamp di magnitudo sull'output, controlli sui limiti di giunto, timeout watchdog, rifiuto dei NaN e un percorso di emergency-stop. I binding possono essere fissati a uno specifico worker xLSTM o impostati per il failover automatico. Streaming tramite trasporto WebSocket per latenza sub-tick; OPC-UA e MQTT-Sparkplug-B per sottoscrizioni a livello di flotta; fallback guidato dal watchdog (zero / freeze / last-known-good) quando il worker di policy non rispetta la scadenza. Dettagli su xLSTM & trasporti IoT.

Export / import bundle lato admin

Impacchettate la matrix memory, i documenti vettoriali, le sorgenti delle basi di conoscenza, i classificatori ENRN, le skill, le voci del registro sorgenti, gli artefatti di dreaming e le overlay di identità di un'installazione Eldric in un singolo file firmato. Spedirlo. Spacchettare su un altro cluster con un merge pulito — stessa versione o diversa. Filtri di ambito per tenant in modo che un export non porti mai con sé dati di altri tenant. Utile per la portabilità del tenant, il passaggio di progetto, il seeding dell'edge, la federazione leggera fra cluster regionali e il disaster recovery.

Runtime edge

Installazione Eldric a nodo singolo su Raspberry Pi 4 (4 GB+ di RAM, 32 GB+ di storage), Intel NUC e NVIDIA Jetson. Base di conoscenza locale, matrix memory locale, chat locale senza un controller in vista. Mette in buffer le scritture quando il collegamento al cluster centrale è giù e le svuota quando torna. Il livello cognitivo di una piattaforma autonoma, sulla piattaforma.

Sottosistema di memoria

Memoria multi-livello: matrix memory (aggiornamenti ispirati a mLSTM), vector RAG (ricerca full-text + semantica), classificatori ENRN, la matrice Agente × Dominio (15 agenti × 7 domini). Persistenza resistente ai crash con checksum di integrità. Richiamo di memoria sotto il millisecondo sui percorsi caldi.

RAG con citazioni

La generazione aumentata dal retrieval è attiva per impostazione predefinita nella 5.0. Caricate documenti (PDF, DOCX, Markdown, testo semplice, codice, CSV, audio, video, stream da sensori) e la piattaforma li fa passare attraverso un chunking basato sul contenuto — strategie diverse per ogni tipo di contenuto, con il flusso di upload intelligente che suggerisce i parametri e vi permette di sovrascriverli prima del commit. Il modello GGUF nativo di embedding (~80 MB, gira su CPU) effettua l'embedding in locale; il data worker memorizza i chunk accanto ai vettori; le query citano i passaggi di origine all'utente. La classificazione personalizzata (Pro+) vi permette di insegnare al router le vostre classi di intent. Il loop di ritenzione trasforma nel tempo le risposte accettate nel prossimo corpus di addestramento. Si veda usare il RAG, architettura RAG, strategie di chunking, RAG on demand, classificazione personalizzata.

Scienza

Il Registro delle sorgenti (§43) raggruppa le sorgenti di dati scientifici in sedici categorie con ventotto sorgenti inizializzate e un punto di ingresso per plugin per aggiungere le proprie. Undici strumenti richiamabili dall'LLM inoltrati tramite un unico endpoint. Bioinformatica, farmacologia, CRISPR, LIMS, materiali, clima, neuroscienze, fisica delle particelle, onde gravitazionali, agenzie spaziali e altro ancora.

Altri worker

Worker di comunicazione (email, SMS, VoIP, WhatsApp, Signal, Teams, XMPP). Worker media (STT, TTS, elaborazione video). Worker di training (backend Unsloth, Axolotl, TRL, MLX, llama.cpp, xLSTM). Swarm controller, Agent worker, Data worker, Cloud worker, daemon Native Inference — tutti pronti per la produzione con parità di funzionalità rispetto alla 4.x.

Auto-aggiornamento su macOS

Il client GUI macOS porta un aggiornatore in-app firmato crittograficamente. I nuovi rilasci vengono raccolti automaticamente dal server dei pacchetti con una piccola notifica nell'app; l'aggiornamento si applica al prossimo avvio. I canali di aggiornamento sono stable per impostazione predefinita e beta come opt-in dalle impostazioni della GUI.

Memoria più veloce e più piccola (anteprima)

Un'anteprima di ricerca del retrieval Modern Hopfield Compressed è disponibile nella 5.0 come opt-in. I clienti possono convertire il livello di matrix memory di una base di conoscenza in una rappresentazione compressa più piccola su disco e più veloce ad alta concorrenza, con un piccolo compromesso di accuratezza sul tipo di query limite in cui il retrieval esatto conta di più. Il percorso a precisione piena resta disponibile accanto. Dettagli su retrieval avanzato.

Inferenza con memoria intelligente (anteprima)

Il daemon di inferenza ora consulta il livello di matrix memory direttamente ai confini del prompt. Le risposte del modello sono ancorate ai dati del vostro tenant senza un round-trip di retrieval separato — utile per workload in stile chat dove la latenza totale conta e per contenuti specifici del cliente dove altrimenti il modello produrrebbe una prima passata generica. Overhead per token sotto i 2 ms su CPU. Opt-in Pro+. Dettagli su inferenza con memoria intelligente.

Eldric per iPad

Il client iPad arriva come parte della forma universale dell'app accanto a iPhone. Vista divisa consapevole del tablet (sidebar + chat + artefatto), composer flottante, Apple Pencil e Scribble, drag-and-drop di ingest da File / Foto / Mail, centro notifiche per attività agentiche di lunga durata. Le impostazioni del tema si sincronizzano fra tutti i client tramite il controller. Multi-finestra per Stage Manager + Split View arriva come anteprima. TestFlight oggi, App Store dopo. Dettagli su iPad.

Interfaccia admin Agent Builder

Il flusso "IA che costruisce IA" ha ora un'interfaccia admin nella shell di chat. Descrivete l'agente che volete; la piattaforma genera il codice dell'agente, le definizioni degli strumenti, i prompt e i casi di test; esecuzioni di test sandboxate verificano il comportamento prima del deployment. Il generatore e il builder condividono il formato del pacchetto agente; entrambi i percorsi producono una directory agents/<nome>/ autonoma da mettere sotto controllo di versione.

Classificatore router distillato (anteprima)

Un classificatore di router-intent ENRN v18 è disponibile come opt-in per i livelli Professional ed Enterprise. Sostituisce la decisione di routing di un piccolo LLM con un classificatore neurale a passata singola, addestrato sui pattern di routing accumulati dal vostro cluster. Latenza più bassa sulla decisione di routing, meno tempo GPU consumato nella classificazione; l'LLM resta nel loop per le query genuinamente ambigue. Si veda retrieval avanzato per il dettaglio orientato al cliente.

Runtime edge minimale ARM64 — live

Il pacchetto del runtime minimale ora viene fornito come RPM aarch64 firmato accanto a x86-64. Lo stesso installer in una riga rileva l'architettura dell'host e installa la build giusta. Verificato su Raspberry Pi 4, server ARM64 generici e NVIDIA Jetson. Si veda installazione edge per i percorsi di deployment.

Trasporti industriali

I binding di policy xLSTM del worker IoT pilotano WebSocket, Modbus TCP e la metà publish di MQTT-Sparkplug-B in GA (livello Pro+). OPC-UA arriva in anteprima nella 5.0 GA — il codice sorgente C++ è nel rilascio, la libreria open62541 viene impacchettata nell'RPM del cluster al prossimo taglio. La metà subscribe di MQTT — l'ingresso di osservazioni da una flotta di sensori Sparkplug-B attraverso il worker di policy — resta in anteprima per la linea 5.0 e arriva con prossime patch 5.0.x. Il fallback di sicurezza (zero / freeze / last-known-good) è incondizionato su tutti i trasporti. Si veda xLSTM & IoT e problemi noti.

Badge modello in chat

Ogni modello nel picker di chat mostra un piccolo badge colorato che identifica il backend che lo serve — Ollama, OpenAI, Eldric Inferenced, vLLM, llama.cpp, Anthropic, xAI, Groq e gli altri. Verde per i modelli sul vostro cluster, colore del brand per le API esterne. Lo stesso badge appare sotto ogni messaggio dell'assistente, così vedete sempre quale backend lo ha servito. Nessun re-routing silenzioso fra locale ed esterno. Dettaglio rivolto al cliente su fornitori di modelli.

Informazioni sulle query degli strumenti in chat

Un nuovo toggle Mostra dettagli query strumento nelle impostazioni di chat (attivo per impostazione predefinita) stampa un riepilogo in una riga di ciò che ogni strumento ha effettivamente interrogato — base di conoscenza + namespace + query + numero di hit per il RAG, sorgente + query per le ricerche scientifiche, motore di ricerca + termini per il web, destinatario per il worker di comunicazione. Disattivatelo per una trascrizione più densa. Disponibile in tutti i client di chat.

Agent Builder share, publish, edit

Gli agenti che costruite nella shell di chat hanno ora condivisione con un clic all'interno del tenant, pubblicazione sul marketplace per la revisione dell'admin di cluster e un editor in-place con versionamento. Esecuzioni di test sandboxate validano ogni cambiamento prima del deploy. Il formato del pacchetto agente resta lo stesso — agents/<nome>/ — così editing manuale e UI sono allineati.

iPad Fase D — multi-finestra, scorciatoie da tastiera, drag-and-drop

La Fase D aggiunge multi-finestra Stage Manager + Split View, una mappa completa di scorciatoie da tastiera per le azioni di chat, drag tra finestre per biforcare una conversazione e un toast di collisione quando due client modificano lo stesso tema. macOS mostra ora anche le attività di lunga durata come voci native UNUserNotification, con APNs collegate per i push remoti da eventi del cluster. Si veda pagina iPad.

Piano di controllo dei workload xLSTM

UI admin per le quattro classi di workload xLSTM — policy, forecast, encode, retrieve — con abilitazione per tenant, selettore di modello per classe e grafico di carico live. Indirizzare le richieste al worker xLSTM non richiede più che un admin legga del JSON.

CLI di migrazione mHC e toggle per namespace

I namespace di matrix memory esistenti possono essere migrati alla variante Modern Hopfield Compressed su base per-namespace con un singolo comando. La shell di chat mostra l'avanzamento della migrazione; il rollback è un singolo comando. Permette ai clienti di adottare il nuovo formato sui namespace che ne beneficiano senza impegnare l'intera installazione in un colpo solo.

Packaging multi-distro — in arrivo poco dopo la GA

La 5.0 GA distribuisce RPM firmati per la famiglia Fedora / RHEL / CentOS / Rocky / Alma. I pacchetti DEB di Ubuntu 24.04 e Debian 12 seguono poco dopo la GA. I clienti su Ubuntu / Debian oggi possono eseguire la 5.0 tramite WSL2 o container.

In arrivo con prossime patch 5.0.x

Cosa arriva nel treno di patch.

Ruoli a nome cliente (RBAC). Gli amministratori del tenant compongono i propri ruoli ("Revisore", "Tecnico di laboratorio", "Finance") partendo dall'insieme di permessi sottostante. La 5.0 distribuisce quattro ruoli incorporati; una prossima patch 5.0.x aggiunge il livello di composizione.
Federazione multi-regione (§18). Replica multi-regione completa in tempo reale con il modello a livelli WLCG. La 5.0 distribuisce federazione leggera tramite il formato bundle; una prossima patch 5.0.x aggiunge il percorso di replica sempre attiva.
NOVA kernel opzionale. Il modulo sperimentale di auto-miglioramento resta esplicitamente sperimentale e disattivato per impostazione predefinita nella 5.0. Lo status di produzione (e la documentazione orientata al cliente oltre l'inquadramento di ricerca) arriva più avanti in 5.0.x.
xLSTM nativo su Mac arm64 (Livello 1 JAX-XLA). Il backend xLSTM nativo di Livello 1 compila pulito nella 5.0 con il flag di build disattivato. Collegarlo come backend predefinito su Apple Silicon — con integrazione del link IREE — arriva con prossime patch 5.0.x.
Quantizzazione int8 per mHC. Il retrieval Modern Hopfield Compressed viene fornito a precisione piena nella 5.0. La variante quantizzata a int8 — file .emm più piccoli sui nodi edge — arriva con prossime patch 5.0.x.
Palette tema personalizzata. La 5.0 distribuisce cinque temi (Frost più altri quattro) con sincronizzazione di cluster. Palette di colori personalizzabili dal cliente all'interno dell'editor dei temi arrivano con prossime patch 5.0.x.
Automazione modalità offline (§29). Drain automatizzato + TTL + coda di dead-letter + back-pressure sul buffer quando un'interruzione prolungata minaccia di causare overflow. La 5.0 distribuisce la primitiva di buffering; una prossima patch 5.0.x aggiunge l'orchestrazione.
Orchestrazione cerebrale unificata (§102). Apprendimento cross-tier nel sottosistema di memoria con integrazione più profonda fra i worker.
ENRN v8. Container Mixture-of-Experts con routing dinamico degli esperti. La 5.0 distribuisce ENRN v5–v7 più il router distillato v18-GQA.
Dreaming intelligente (§42) orchestrazione completa. La 5.0 distribuisce il motore dei sogni; una prossima patch 5.0.x aggiunge l'orchestrazione di cadenza a livello di cluster.
Automazione rollback aggiornamenti cluster (§70). La 5.0 ha l'orchestratore di rolling-update; una prossima patch 5.0.x aggiunge il rollback automatizzato su fallimento dei controlli di salute.
Backup / DR su destinazione remota (§40). La 5.0 distribuisce snapshot su destinazione locale; una prossima patch 5.0.x aggiunge il percorso offsite.
Catalogo event-bus rivolto al cliente. I webhook della 5.0 sono sottoscrivibili; una prossima patch 5.0.x pubblica il catalogo degli eventi così che gli autori di plugin sappiano dove possono agganciarsi.

Tutti i rinvii sono documentati sul catalogo funzionalità con marcatori WIP, e l'elenco rivolto al cliente con stato è su problemi noti.

Noti alla GA

Follow-up della prima settimana.

L'elenco completo degli open items vive su problemi noti. L'ambito condensato della prima settimana — voci che la chiusura GA ha intercettato per il ciclo 5.0.1:

Base di conoscenza AI papers — contenuto rado. La base di conoscenza ai-papers-at importata dalla 4.x è più sottile del corpus 4.x; i paper di Hochreiter in particolare sono rappresentati in modo rado. Re-import in corso; la 5.0.1 porta il corpus ricostruito.
Statistiche del picker di modelli — riscaldamento al primo avvio. I badge più-usati / recentemente-usati nel picker di modelli richiedono una passata di riscaldamento per popolarsi. La shell di chat gestisce questo automaticamente mentre i clienti usano i modelli; gli admin che hanno bisogno di statistiche pre-popolate dal primo giorno possono richiedere la routine di warm-up tramite support@eldric.ai.
Ricerca vettoriale — visualizzazione conteggio namespace. Il "conteggio namespace" mostrato accanto a una base di conoscenza nella console admin può essere obsoleto immediatamente dopo l'upload. I conteggi di documenti e chunk sono corretti; il conteggio dei namespace si aggiorna al prossimo ciclo di aggregazione. La correzione arriva nella 5.0.1.
Database demo — registrazione opt-in. I connettori demo ClickHouse e Postgres non sono registrati con la piattaforma per impostazione predefinita. I clienti che li vogliono disponibili eseguono gli script di setup nella guida operativa; la 5.0.1 li cablerà come attivati per impostazione predefinita con un toggle a un clic nella console admin.
Binario CLI — variabili d'ambiente. I client di riga di comando costruiti localmente richiedono ELDRIC_EDGE_URL e ELDRIC_API_KEY nell'ambiente per raggiungere un cluster. La CLI installata via RPM legge la configurazione automaticamente da /etc/eldric/cli.conf.
Tema e branding del tenant Edge — raggiungibilità pubblica. Gli endpoint di tema e branding per tenant (/api/v1/tenants/{id}/theme, /api/v1/tenants/{id}/branding/logo) non sono ancora raggiungibili tramite il gateway Edge pubblico. I clienti Pro+ che configurano il branding personalizzato li chiamano dall'interno della rete del cluster per la linea 5.0; l'aggiornamento dell'allowlist Edge arriva nella 5.0.1.

Eldric 5.0.
Disponibile in generale.

Cosa corregge la 5.0.1.

In una frase.

Gli avanzamenti principali.

Worker xLSTM per ML strutturato

Binding IoT a loop chiuso

Export / import bundle lato admin

Runtime edge

Sottosistema di memoria

RAG con citazioni

Scienza

Altri worker

Auto-aggiornamento su macOS

Memoria più veloce e più piccola (anteprima)

Inferenza con memoria intelligente (anteprima)

Eldric per iPad

Interfaccia admin Agent Builder

Classificatore router distillato (anteprima)

Runtime edge minimale ARM64 — live

Trasporti industriali

Badge modello in chat

Informazioni sulle query degli strumenti in chat

Agent Builder share, publish, edit

iPad Fase D — multi-finestra, scorciatoie da tastiera, drag-and-drop

Piano di controllo dei workload xLSTM

CLI di migrazione mHC e toggle per namespace

Packaging multi-distro — in arrivo poco dopo la GA

Cosa arriva nel treno di patch.

Follow-up della prima settimana.

Da 5.0-alpha a 5.0 GA.

Livelli e funzionalità.

Avanti.

Eldric 5.0.Disponibile in generale.

Cosa corregge la 5.0.1.

In una frase.

Gli avanzamenti principali.

Worker xLSTM per ML strutturato

Binding IoT a loop chiuso

Export / import bundle lato admin

Runtime edge

Sottosistema di memoria

RAG con citazioni

Scienza

Altri worker

Auto-aggiornamento su macOS

Memoria più veloce e più piccola (anteprima)

Inferenza con memoria intelligente (anteprima)

Eldric per iPad

Interfaccia admin Agent Builder

Classificatore router distillato (anteprima)

Runtime edge minimale ARM64 — live

Trasporti industriali

Badge modello in chat

Informazioni sulle query degli strumenti in chat

Agent Builder share, publish, edit

iPad Fase D — multi-finestra, scorciatoie da tastiera, drag-and-drop

Piano di controllo dei workload xLSTM

CLI di migrazione mHC e toggle per namespace

Packaging multi-distro — in arrivo poco dopo la GA

Cosa arriva nel treno di patch.

Follow-up della prima settimana.

Da 5.0-alpha a 5.0 GA.

Livelli e funzionalità.

Avanti.

Eldric 5.0.
Disponibile in generale.