Chat-Oberfläche

Wer Ihre
Antwort bedient.

In der Modellauswahl des Chats trägt jeder Eintrag ein kleines farbiges Kennzeichen, das den Anbieter hinter diesem Modell identifiziert — Ollama auf Ihrem Cluster, Ollama Cloud, Eldric Inferenced, OpenAI, Anthropic, xAI, HuggingFace und andere. Dasselbe Kennzeichen erscheint unter jeder Assistenten-Antwort. Der Punkt ist einfach: zwei Modelle mit demselben Namen können von verschiedenen Anbietern kommen und sich unterschiedlich verhalten. Das Kennzeichen sagt Ihnen, welches gerade bedient.

Die Farbregel

Jeder Anbieter hat seine eigene Farbe.

Das Kennzeichen ist ein farbiges abgerundetes Quadrat mit einem Kurzcode oder Marken-Symbol darin. Verschiedene Farben für verschiedene Anbieter — so erkennen Sie den Pfad mit einem Blick, ohne den Kleintext darunter zu lesen. Zwei Einträge namens gpt-oss-120b von verschiedenen Anbietern tragen verschiedene Kennzeichen, und der Assistenten-Chip unter ihren Antworten passt dazu.

Die Kennzeichen, nach Anbieter

Anbieter-Tabelle.

O Ollama

Eine Ollama-Runtime auf einem Ihrer Cluster-Inferenz-Worker. Der häufigste Pfad für lokale Open-Weight-Modelle.

O Ollama Cloud

Der gehostete Ollama-Dienst. Dasselbe Protokoll wie lokales Ollama, andere Farbe — die Anfrage verlässt Ihren Cluster zu ollama.com.

EI Eldric Inferenced

Die native GGUF-/xLSTM-Runtime, die mit der Plattform mitgeliefert wird. Keine Ollama-Abhängigkeit, kein externer Prozess. Der Pfad für die kleinsten Installationen und Air-Gap-Standorte.

L Lokal — andere

vLLM, llama.cpp, MLX, TGI oder Triton auf einem Ihrer Inferenz-Worker. Deckt jede lokale Runtime ab, die nicht Ollama oder native Inferenz ist.

AI OpenAI

Die OpenAI-API. Anfrage und Antwort laufen über die Infrastruktur von OpenAI.

A Anthropic

Die Anthropic-API (Claude-Modelle). Extern.

X xAI / Grok

Die xAI-API (Grok-Modelle). Extern.

🤗 HuggingFace

HuggingFace Inference API oder TGI-Endpunkte. Extern.

G Groq

Die Groq-Inferenz-API mit hoher Geschwindigkeit. Extern.

? Unbekannt

Ein benutzerdefiniertes oder Fallback-Backend, für das die Plattform kein spezifisches Kennzeichen hat. Maus über das Kennzeichen zeigt die rohe Anbieter-ID.

Andere Anbieter — Together, Mistral, Fireworks, Cohere, Perplexity, Azure OpenAI, NVIDIA NIM und alle benutzerdefinierten Endpunkte — bekommen ihre eigenen Farb-Varianten, sobald die Plattform sie kennt. Wenn Sie einen Anbieter konfigurieren, den die Plattform noch nicht kennt, sehen Sie das ?-Kennzeichen mit der tatsächlichen ID beim Hover.

Wo das Kennzeichen erscheint

Auswahl, aktives Modell, jede Antwort.

Das Kennzeichen steht in der Auswahl neben dem Modellnamen, damit Sie informiert wählen, bevor Sie beginnen. Die „Aktives Modell“-Pille unten in der Eingabezeile trägt dasselbe Kennzeichen, während Sie tippen. Unter jeder Assistenten-Antwort zeigt ein kleiner Chip den Anbieter, der diese eine Nachricht tatsächlich bedient hat — als Beleg, wer geantwortet hat. Lenkt der Cluster mitten im Gespräch um (ein Worker fällt aus, ein Backend rate-limitet, Sie wechseln das Modell), sehen Sie das Kennzeichen wechseln. Das System tauscht zwischen Turns nie still den Anbieter.

Zwei Modelle, ein Name

Sie unterscheiden.

Wenn zwei Einträge in der Auswahl denselben Modellnamen tragen (üblich bei Open-Weight-Modellen, die mehrere Anbieter hosten), erkennen Sie sie am Kennzeichen. O gpt-oss-120b ist die Ollama-Runtime Ihres lokalen Clusters; O gpt-oss-120b ist Ollama Cloud. Dieselben Gewichte, aber die Inferenz läuft an verschiedenen Orten, auf verschiedener Hardware, mit verschiedenen Latenz-Eigenschaften — und die Antworten können sich durch Sampling oder Versions-Drift zwischen Hosts subtil unterscheiden.

Das Kennzeichen ist der einfachste Weg, die Frage „woher kommt diese Antwort?“ zu beantworten, ohne den Chat zu verlassen.

Wer IhreAntwort bedient.

Jeder Anbieter hat seine eigene Farbe.

Anbieter-Tabelle.

Auswahl, aktives Modell, jede Antwort.

Sie unterscheiden.

Wer Ihre
Antwort bedient.