Quando apri il selettore di modello della chat, ogni voce porta un piccolo badge colorato che identifica il fornitore dietro quel modello — Ollama sul tuo cluster, Ollama Cloud, Eldric Inferenced, OpenAI, Anthropic, xAI, HuggingFace e così via. Lo stesso badge appare sotto ogni risposta dell'assistente. Il punto è semplice: due modelli con lo stesso nome possono arrivare da fornitori diversi e comportarsi diversamente. Il badge ti dice quale sta servendo in questo momento.
Il badge è un quadrato arrotondato colorato con un codice breve o un marchio del fornitore al centro. Colori diversi per fornitori diversi — così puoi scansionare il selettore e individuare la rotta a colpo d'occhio, senza leggere il testo piccolo sotto. Due voci chiamate gpt-oss-120b servite da fornitori diversi porteranno badge diversi, e il chip dell'assistente sotto le loro risposte sarà coerente.
Altri fornitori — Together, Mistral, Fireworks, Cohere, Perplexity, Azure OpenAI, NVIDIA NIM e ogni endpoint custom — ricevono le loro varianti con colori dedicati man mano che la piattaforma li riconosce. Se colleghi un fornitore che la piattaforma non conosce ancora, vedrai il badge ? con l'id reale disponibile al passaggio del mouse.
Il badge sta accanto al nome del modello nel selettore, così fai una scelta informata prima di iniziare. La pill del "modello attivo" sotto il composer porta lo stesso badge mentre digiti. Sotto ogni turno dell'assistente, un piccolo chip mostra il fornitore che ha effettivamente servito quel singolo messaggio — la prova di chi ha risposto. Se il cluster cambia rotta durante la conversazione (un worker cade, un backend ti impone il rate-limit, cambi modello), vedi cambiare il badge. Il sistema non scambia mai silenziosamente di fornitore tra un turno e l'altro.
Se due voci nel selettore condividono il nome del modello (caso comune con i modelli a pesi aperti ospitati da più fornitori), guarda il badge per distinguerle. O gpt-oss-120b è il runtime Ollama del tuo cluster locale; O gpt-oss-120b è Ollama Cloud. Sono gli stessi pesi, ma l'inferenza avviene in posti diversi, su hardware diverso, con caratteristiche di latenza diverse — e le risposte possono differire leggermente per via del sampling o di una deriva di versione tra gli host.
Il badge è il modo più semplice di rispondere a "da dove arriva questa risposta?" senza uscire dalla chat.