Chat

Chi sta servendo
la risposta.

Quando apri il selettore di modello della chat, ogni voce porta un piccolo badge colorato che identifica il fornitore dietro quel modello — Ollama sul tuo cluster, Ollama Cloud, Eldric Inferenced, OpenAI, Anthropic, xAI, HuggingFace e così via. Lo stesso badge appare sotto ogni risposta dell'assistente. Il punto è semplice: due modelli con lo stesso nome possono arrivare da fornitori diversi e comportarsi diversamente. Il badge ti dice quale sta servendo in questo momento.

La convenzione dei colori

Ogni fornitore ha il suo colore.

Il badge è un quadrato arrotondato colorato con un codice breve o un marchio del fornitore al centro. Colori diversi per fornitori diversi — così puoi scansionare il selettore e individuare la rotta a colpo d'occhio, senza leggere il testo piccolo sotto. Due voci chiamate gpt-oss-120b servite da fornitori diversi porteranno badge diversi, e il chip dell'assistente sotto le loro risposte sarà coerente.

I badge, per fornitore

Legenda dei fornitori.

O Ollama

Un runtime Ollama su uno degli inference worker del tuo cluster. La rotta più comune per i modelli locali a pesi aperti.

O Ollama Cloud

Il servizio Ollama hosted. Stesso protocollo dell'Ollama locale, colore diverso — la richiesta esce dal tuo cluster verso ollama.com.

EI Eldric Inferenced

Il runtime nativo GGUF / xLSTM incluso nella piattaforma. Nessuna dipendenza da Ollama, nessun processo esterno. La rotta per i deployment più piccoli e per i siti air-gapped.

L Locale — altro

vLLM, llama.cpp, MLX, TGI o Triton su uno dei tuoi inference worker. Copre qualunque runtime locale che non sia Ollama o Inferenced.

AI OpenAI

L'API di OpenAI. Richiesta e risposta transitano sull'infrastruttura OpenAI.

A Anthropic

L'API di Anthropic (modelli Claude). Esterno.

X xAI / Grok

L'API di xAI (modelli Grok). Esterno.

🤗 HuggingFace

HuggingFace Inference API o endpoint TGI. Esterno.

G Groq

L'API di inferenza ad alta velocità di Groq. Esterno.

? Non riconosciuto

Un backend custom o di fallback per cui la piattaforma non ha un badge specifico. Passa sopra il badge per vedere l'id grezzo del fornitore.

Altri fornitori — Together, Mistral, Fireworks, Cohere, Perplexity, Azure OpenAI, NVIDIA NIM e ogni endpoint custom — ricevono le loro varianti con colori dedicati man mano che la piattaforma li riconosce. Se colleghi un fornitore che la piattaforma non conosce ancora, vedrai il badge ? con l'id reale disponibile al passaggio del mouse.

Dove appare il badge

Selettore, modello attivo, ogni risposta.

Il badge sta accanto al nome del modello nel selettore, così fai una scelta informata prima di iniziare. La pill del "modello attivo" sotto il composer porta lo stesso badge mentre digiti. Sotto ogni turno dell'assistente, un piccolo chip mostra il fornitore che ha effettivamente servito quel singolo messaggio — la prova di chi ha risposto. Se il cluster cambia rotta durante la conversazione (un worker cade, un backend ti impone il rate-limit, cambi modello), vedi cambiare il badge. Il sistema non scambia mai silenziosamente di fornitore tra un turno e l'altro.

Due modelli, stesso nome

Distinguerli.

Se due voci nel selettore condividono il nome del modello (caso comune con i modelli a pesi aperti ospitati da più fornitori), guarda il badge per distinguerle. O gpt-oss-120b è il runtime Ollama del tuo cluster locale; O gpt-oss-120b è Ollama Cloud. Sono gli stessi pesi, ma l'inferenza avviene in posti diversi, su hardware diverso, con caratteristiche di latenza diverse — e le risposte possono differire leggermente per via del sampling o di una deriva di versione tra gli host.

Il badge è il modo più semplice di rispondere a "da dove arriva questa risposta?" senza uscire dalla chat.

Chi sta servendola risposta.

Ogni fornitore ha il suo colore.

Legenda dei fornitori.

Selettore, modello attivo, ogni risposta.

Distinguerli.

Chi sta servendo
la risposta.