Una breve guida per applicare Eldric a un dominio che non copre già pronto all'uso. Il principio è lo stesso ovunque — fate l'ingest, consolidate, distillate, distribuite, interrogate. I dettagli sono i vostri; la piattaforma fornisce le corsie.
Portate i vostri dati nella piattaforma. I documenti passano attraverso il protocollo di upload a chunk verso una base di conoscenza; i dati strutturati tramite il connettore di database; i feed dei sensori tramite il worker IoT; i messaggi tramite il worker di comunicazione. I dati restano sul vostro hardware dal momento in cui arrivano.
Normalizzate fra le sorgenti. Un laboratorio farmaceutico estrae cartelle cliniche da un EHR, linee guida cliniche da un altro corpus e protocolli di studio da un terzo. Il data worker li porta sotto un unico tenant con metadati coerenti, così che una singola query raggiunga tutti e tre.
Mettete la conoscenza giusta nella forma giusta. Embedding vettoriali per il retrieval esatto; matrix memory per il richiamo compresso e generalizzante; un piccolo modello affinato per la terminologia della vostra casa. La pipeline di distillazione (§50) legge da una sorgente vettoriale, chiede a un LLM coppie domanda-risposta e scrive entrambi i lati come associazioni a prodotto esterno in un file .emm portabile.
Il file di matrix memory .emm è un singolo binario che cattura la conoscenza di dominio che avete consolidato. Si sposta fra cluster, viene spedito a dispositivi edge, viene versionato insieme al vostro codice. Portate con voi la memoria del vostro ospedale alla clinica sul campo; distribuite la memoria della vostra linea di fabbrica al robot.
Spingete l'IA dove il lavoro accade. Un cluster da datacenter per il knowledge worker centrale. Un Raspberry Pi sulla linea per inferenza soft-real-time. Un kernel a bordo sul robot per il funzionamento offline quando il collegamento radio cade. Stesso binario, stesso formato di memoria, scale diverse.
L'interfaccia di chat, l'API OpenAI-compatibile, l'invocazione di agenti, il dispatch di strumenti scientifici, la voce — tutto colpisce la stessa memoria sottostante e gli stessi agenti. Una query restituisce la risposta nella vostra terminologia, citata dalle vostre sorgenti, con la traccia di audit che la conformità richiede.
Il worker scientifico ha sedici categorie con ventotto sorgenti incorporate oggi (NASA, CERN, PubMed, GBIF, …). Il vostro dominio potrebbe non esserci — ma la categoria custom è il punto di ingresso per i plugin. Registrate una nuova sorgente tramite POST /api/v1/science/sources con i metadati del catalogo, puntate al vostro endpoint, e il flusso di dispatch su /api/v1/science/tools/execute la raccoglie accanto a quelle incorporate.
Ogni cliente ottiene l'upload di base di conoscenza dal primo giorno — il flusso Console di amministrazione → Basi di conoscenza → Nuova KB accetta PDF, DOCX, Markdown, testo semplice, HTML. Chunking ed embedding avvengono in locale; i vettori restano sul vostro data worker. Le query RAG dalla shell di chat o tramite /api/v1/agent/knowledge-bases/{id}/search recuperano e citano.
POST /api/v1/agent/generate-training sul worker Agent legge da una KB e produce campioni di addestramento in formato Alpaca / OpenAI / DPO. Consegnate il dataset al worker di training per LoRA, QLoRA, SFT o DPO. L'output è un piccolo modello affinato che parla la vostra terminologia — e non ha mai lasciato la vostra rete.
I plugin sono add-on Python o JavaScript che l'host plugin di Edge carica a runtime. Cinque tipi: Tool (capacità lato server che l'LLM può chiamare), Filter (elaborazione di messaggi pre/post-LLM), Pipe (modelli virtuali / backend personalizzati), Action (estensione UI lato client), Widget (pannello UI lato client). Installateli dal catalogo marketplace su /api/v1/marketplace/catalog o mettete i vostri nella directory dei plugin.
L'Agent Builder prende una descrizione e genera un agente — definizioni degli strumenti, prompt di sistema, casi di test. L'Agent Generator fa lo stesso da un template di dominio (finance, medical, devops, legal, science, support). Gli agenti generati approdano in agents/<nome>/ come un pacchetto autonomo da mettere sotto controllo di versione.
Sottoscrivete eventi della piattaforma su /api/v1/webhooks/subscriptions. Ogni POST in uscita è firmato HMAC-SHA256; le consegne fallite si auto-disattivano oltre soglia. Collegate il vostro LIMS a valle, il sistema di ticketing o lo stack di monitoraggio all'event bus della piattaforma.
Un laboratorio di genomica in un ospedale di ricerca vuole assistenza AI per l'interpretazione delle varianti, ma i suoi genomi dei pazienti sono vincolati da GDPR + HIPAA e non possono lasciare l'istituzione. Ecco cosa hanno fatto, passo per passo.
Un nodo di classe DGX nel laboratorio di genomica più un piccolo data worker su storage adiacente. curl https://repo.eldric.ai/install.sh | sudo bash, poi dnf install eldric-aios su ognuno. Controller sul DGX, data worker sul box di storage. File di licenza da license@core.at per il livello Professional.
Tre KB create tramite la Console di amministrazione: clinical-guidelines (standard ACMG di interpretazione delle varianti, protocolli ospedalieri), recent-literature (paper PubMed in cache degli ultimi due anni), institutional-cases (sintesi di casi precedenti de-identificate). Il protocollo di upload a chunk ha gestito i batch di PDF da più GB.
Il worker Science abilita BLAST, Ensembl, GTEx, OpenFDA pronto all'uso. Database BLAST locali sul data worker — i metadati di query escono, i dati di sequenza no. Il laboratorio aggiunge due sorgenti personalizzate tramite il registro §43: il database interno delle varianti e la tabella di frequenza condivisa dal consorzio a cui ha accesso.
Lo stile di ragionamento sull'interpretazione delle varianti del laboratorio è specifico — verdetto breve, motivazione strutturata, criteri ACMG citati esplicitamente. POST /api/v1/agent/generate-training sulla KB institutional-cases ha prodotto 4.800 campioni di addestramento; un run QLoRA su Llama-3.2-8B ha dato al laboratorio il suo modello di casa in circa dodici ore.
La conoscenza combinata — linee guida ACMG + letteratura recente + pattern istituzionali — è distillata in un file .emm gerarchico (dominio: genomics, rank 256, dim 1024). La matrix memory siede accanto al vector store. Il richiamo compresso è veloce ad alta concorrenza; il retrieval con citazione esatta colpisce ancora il vector store quando serve.
I genetisti interrogano tramite la chat web con il tenant variant-interp attivo. Il RAG agentico attraversa tutte e tre le KB più l'output BLAST del worker Science. Il registro di audit cattura ogni decisione assistita dall'IA per l'IRB. I genomi dei pazienti non hanno mai attraversato il confine della LAN; solo la risposta lo ha fatto.
Il file di matrix memory portabile è la chiave per eseguire un'IA consapevole del dominio fuori dal datacenter. Una clinica sul campo con un Raspberry Pi riceve lo stesso file .emm dell'ospedale centrale; un gateway edge in fabbrica riceve una variante calibrata sulla manifattura; un robot in pista riceve la fetta di esecuzione di policy tramite il daemon xLSTM. Stesso binario, stesso formato di memoria, scala di deployment diversa.
I dettagli operativi (verifica degli artefatti firmati, pinning di versione, store-and-forward per il funzionamento offline, politica di replica per mantenere aggiornate le repliche) sono trattati nella documentazione del runtime Edge — si veda per le imprese per la panoramica architetturale e il catalogo funzionalità §14 per la superficie per ogni funzione.
Sedici pagine di settore coprono i settori con i pattern di deployment più consolidati: ospedali, banche, studi legali, assicurazioni, farmacologia, genomica, fabbriche, automotive, robotica, logistica, trading desk, agenzie spaziali e osservatori, osservazione della Terra, scienza dei materiali, neuroscienze, CRISPR.
Se il vostro dominio non è ancora su quell'elenco, il principio in sei passi sopra è comunque valido. Scrivete a office@eldric.ai con uno schizzo di ciò che desiderate fare; vi diremo quali punti di estensione si adattano, come sarebbe l'esempio svolto per il vostro settore e se il risultato richiede una patch 5.0 o si adatta al rilascio attuale.