Chat-Modelle
319 Modelle
Ideal für Kundendienst, Alltagsgespräche, Büroassistenz und Content-Erstellung — die vielseitigste KI-Fähigkeit.
| Modell | Anbieter | Eingabe /1M | Ausgabe /1M | Kontext | API | Details |
|---|---|---|---|---|---|---|
GPT-4o热门 GPT-4o ist ein schnelles multimodales Modell von OpenAI, optimiert für Dialog, Code und Bildanalyse. | OpenAI | $2.50 | $10.00 | 128K | Ansehen → | |
Body Builder (beta) ist ein KI-Modell für allgemeinem Dialog von Openrouter, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 128K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $-1000000/Mio. Token, Ausgabe $-1000000/Mio. Token. (Offizielle Beschreibung: Transform your natural language requests into structured OpenRouter API request objects.) | Openrouter | Nicht tokenbasiert | — | 128K | Ansehen → | |
IBM: Granite 4.0 Micro ist ein KI-Modell für allgemeinem Dialog von Ibm-granite, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.017/Mio. Token, Ausgabe $0.11/Mio. Token. (Offizielle Beschreibung: Granite-4.0-H-Micro is a 3B parameter from the Granite 4 family of models.) | Ibm-granite | $0.017 | $0.11 | 131K | Ansehen → | |
Meta: Llama 3.1 8B Instruct ist ein KI-Modell für allgemeinem Dialog von Meta, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 16K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.02/Mio. Token, Ausgabe $0.05/Mio. Token. (Offizielle Beschreibung: Meta's latest class of model (Llama 3.1) launched with a variety of sizes & flavors.) | Meta | $0.02 | $0.05 | 16K | Ansehen → | |
Mistral: Mistral Nemo ist ein KI-Modell für allgemeinem Dialog von Mistral AI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.02/Mio. Token, Ausgabe $0.03/Mio. Token. (Offizielle Beschreibung: A 12B parameter model with a 128k token context length built by Mistral in collaboration with NVIDIA.) | Mistral AI | $0.02 | $0.03 | 131K | Ansehen → | |
Meta: Llama 3.2 1B Instruct ist ein KI-Modell für allgemeinem Dialog von Meta, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 60K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.027/Mio. Token, Ausgabe $0.2/Mio. Token. (Offizielle Beschreibung: Llama 3.2 1B is a 1-billion-parameter language model focused on efficiently performing natural language tasks, such as summarization, dialogue, and multilingual text analysis.) | Meta | $0.027 | $0.20 | 60K | Ansehen → | |
LiquidAI: LFM2-24B-A2B ist ein KI-Modell für allgemeinem Dialog von Liquid AI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 33K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.03/Mio. Token, Ausgabe $0.12/Mio. Token. (Offizielle Beschreibung: LFM2-24B-A2B is the largest model in the LFM2 family of hybrid architectures designed for efficient on-device deployment.) | Liquid AI | $0.03 | $0.12 | 33K | Ansehen → | |
OpenAI: gpt-oss-20b ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.03/Mio. Token, Ausgabe $0.14/Mio. Token. (Offizielle Beschreibung: gpt-oss-20b is an open-weight 21B parameter model released by OpenAI under the Apache 2.0 license.) | OpenAI | $0.03 | $0.14 | 131K | Ansehen → | |
Qwen: Qwen-Turbo ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit schneller Antwortzeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.0325/Mio. Token, Ausgabe $0.13/Mio. Token. (Offizielle Beschreibung: Qwen-Turbo, based on Qwen2.5, is a 1M context model that provides fast speed and low cost, suitable for simple tasks.) | Alibaba | $0.0325 | $0.13 | 131K | Ansehen → | |
Amazon: Nova Micro 1.0 ist ein KI-Modell für allgemeinem Dialog von Amazon, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.035/Mio. Token, Ausgabe $0.14/Mio. Token. (Offizielle Beschreibung: Amazon Nova Micro 1.0 is a text-only model that delivers the lowest latency responses in the Amazon Nova family of models at a very low cost.) | Amazon | $0.035 | $0.14 | 128K | Ansehen → | |
Cohere: Command R7B (12-2024) ist ein KI-Modell für allgemeinem Dialog von Cohere, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 128K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.0375/Mio. Token, Ausgabe $0.15/Mio. Token. (Offizielle Beschreibung: Command R7B (12-2024) is a small, fast update of the Command R+ model, delivered in December 2024.) | Cohere | $0.0375 | $0.15 | 128K | Ansehen → | |
OpenAI: gpt-oss-120b ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.039/Mio. Token, Ausgabe $0.18/Mio. Token. (Offizielle Beschreibung: gpt-oss-120b is an open-weight, 117B-parameter Mixture-of-Experts (MoE) language model from OpenAI designed for high-reasoning, agentic, and general-purpose production use cases.) | OpenAI | $0.039 | $0.18 | 131K | Ansehen → | |
Qwen: Qwen2.5 7B Instruct ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 33K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.04/Mio. Token, Ausgabe $0.1/Mio. Token. (Offizielle Beschreibung: Qwen2.5 7B is the latest series of Qwen large language models.) | Alibaba | $0.04 | $0.10 | 33K | Ansehen → | |
Qwen: Qwen3.5-9B ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.04/Mio. Token, Ausgabe $0.15/Mio. Token. (Offizielle Beschreibung: Qwen3.5-9B is a multimodal foundation model from the Qwen3.5 family, designed to deliver strong reasoning, coding, and visual understanding in an efficient 9B-parameter architecture.) | Alibaba | $0.04 | $0.15 | 262K | Ansehen → | |
Google: Gemma 3 12B ist ein KI-Modell für allgemeinem Dialog von Google, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.04/Mio. Token, Ausgabe $0.13/Mio. Token. (Offizielle Beschreibung: Gemma 3 introduces multimodality, supporting vision-language input and text outputs.) | $0.04 | $0.13 | 131K | Ansehen → | ||
Google: Gemma 3 4B ist ein KI-Modell für allgemeinem Dialog von Google, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Bildanalyse, API-Zugang. Preis: Eingabe $0.04/Mio. Token, Ausgabe $0.08/Mio. Token. (Offizielle Beschreibung: Gemma 3 introduces multimodality, supporting vision-language input and text outputs.) | $0.04 | $0.08 | 131K | Ansehen → | ||
Meta: Llama 3 8B Instruct ist ein KI-Modell für allgemeinem Dialog von Meta, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 8K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.04/Mio. Token, Ausgabe $0.04/Mio. Token. (Offizielle Beschreibung: Meta's latest class of model (Llama 3) launched with a variety of sizes & flavors.) | Meta | $0.04 | $0.04 | 8K | Ansehen → | |
NVIDIA: Nemotron Nano 9B V2 ist ein KI-Modell für allgemeinem Dialog von NVIDIA, mit schneller Antwortzeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.04/Mio. Token, Ausgabe $0.16/Mio. Token. (Offizielle Beschreibung: NVIDIA-Nemotron-Nano-9B-v2 is a large language model (LLM) trained from scratch by NVIDIA, and designed as a unified model for both reasoning and non-reasoning tasks.) | NVIDIA | $0.04 | $0.16 | 131K | Ansehen → | |
Sao10K: Llama 3 8B Lunaris ist ein KI-Modell für allgemeinem Dialog von Sao10K, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 8K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.04/Mio. Token, Ausgabe $0.05/Mio. Token. (Offizielle Beschreibung: Lunaris 8B is a versatile generalist and roleplaying model based on Llama 3.) | Sao10K | $0.04 | $0.05 | 8K | Ansehen → | |
Arcee AI: Trinity Mini ist ein KI-Modell für allgemeinem Dialog von Arcee-ai, mit schneller Antwortzeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.045/Mio. Token, Ausgabe $0.15/Mio. Token. (Offizielle Beschreibung: Trinity Mini is a 26B-parameter (3B active) sparse mixture-of-experts language model featuring 128 experts with 8 active per token.) | Arcee-ai | $0.045 | $0.15 | 131K | Ansehen → | |
Qwen: Qwen3 8B ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 41K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.05/Mio. Token, Ausgabe $0.4/Mio. Token. (Offizielle Beschreibung: Qwen3-8B is a dense 8.2B parameter causal language model from the Qwen3 series, designed for both reasoning-heavy tasks and efficient dialogue.) | Alibaba | $0.05 | $0.40 | 41K | Ansehen → | |
IBM: Granite 4.1 8B ist ein KI-Modell für allgemeinem Dialog von Ibm-granite, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.05/Mio. Token, Ausgabe $0.1/Mio. Token. (Offizielle Beschreibung: Granite 4.1 8B is a dense, decoder-only 8-billion-parameter language model from IBM, part of the Granite 4.1 family.) | Ibm-granite | $0.05 | $0.10 | 131K | Ansehen → | |
Mistral: Mistral Small 3 ist ein KI-Modell für allgemeinem Dialog von Mistral AI, mit schneller Antwortzeit. Kontextfenster bis zu 33K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.05/Mio. Token, Ausgabe $0.08/Mio. Token. (Offizielle Beschreibung: Mistral Small 3 is a 24B-parameter language model optimized for low-latency performance across common AI tasks.) | Mistral AI | $0.05 | $0.08 | 33K | Ansehen → | |
NVIDIA: Nemotron 3 Nano 30B A3B ist ein KI-Modell für allgemeinem Dialog von NVIDIA, mit schneller Antwortzeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.05/Mio. Token, Ausgabe $0.2/Mio. Token. (Offizielle Beschreibung: NVIDIA Nemotron 3 Nano 30B A3B is a small language MoE model with highest compute efficiency and accuracy for developers to build specialized agentic AI systems.) | NVIDIA | $0.05 | $0.20 | 262K | Ansehen → | |
OpenAI: GPT-5 Nano ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit schneller Antwortzeit. Kontextfenster bis zu 400K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.05/Mio. Token, Ausgabe $0.4/Mio. Token. (Offizielle Beschreibung: GPT-5-Nano is the smallest and fastest variant in the GPT-5 system, optimized for developer tools, rapid interactions, and ultra-low latency environments.) | OpenAI | $0.05 | $0.40 | 400K | Ansehen → | |
Meta: Llama 3.2 3B Instruct ist ein KI-Modell für allgemeinem Dialog von Meta, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 80K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.051/Mio. Token, Ausgabe $0.34/Mio. Token. (Offizielle Beschreibung: Llama 3.2 3B is a 3-billion-parameter multilingual large language model, optimized for advanced natural language processing tasks like dialogue generation, reasoning, and summarization.) | Meta | $0.051 | $0.34 | 80K | Ansehen → | |
Qwen: Qwen3 14B ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 41K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.06/Mio. Token, Ausgabe $0.24/Mio. Token. (Offizielle Beschreibung: Qwen3-14B is a dense 14.8B parameter causal language model from the Qwen3 series, designed for both complex reasoning and efficient dialogue.) | Alibaba | $0.06 | $0.24 | 41K | Ansehen → | |
Amazon: Nova Lite 1.0 ist ein KI-Modell für allgemeinem Dialog von Amazon, mit schneller Antwortzeit. Kontextfenster bis zu 300K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.06/Mio. Token, Ausgabe $0.24/Mio. Token. (Offizielle Beschreibung: Amazon Nova Lite 1.0 is a very low-cost multimodal model from Amazon that focused on fast processing of image, video, and text inputs to generate text output.) | Amazon | $0.06 | $0.24 | 300K | Ansehen → | |
Google: Gemma 3n 4B ist ein KI-Modell für allgemeinem Dialog von Google, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 33K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.06/Mio. Token, Ausgabe $0.12/Mio. Token. (Offizielle Beschreibung: Gemma 3n E4B-it is optimized for efficient execution on mobile and low-resource devices, such as phones, laptops, and tablets.) | $0.06 | $0.12 | 33K | Ansehen → | ||
Google: Gemma 4 26B A4B ist ein KI-Modell für allgemeinem Dialog von Google, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.06/Mio. Token, Ausgabe $0.33/Mio. Token. (Offizielle Beschreibung: Gemma 4 26B A4B IT is an instruction-tuned Mixture-of-Experts (MoE) model from Google DeepMind.) | $0.06 | $0.33 | 262K | Ansehen → | ||
MythoMax 13B ist ein KI-Modell für allgemeinem Dialog von Gryphe, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 4K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.06/Mio. Token, Ausgabe $0.06/Mio. Token. (Offizielle Beschreibung: One of the highest performing and most popular fine-tunes of Llama 2 13B, with rich descriptions and roleplay.) | Gryphe | $0.06 | $0.06 | 4K | Ansehen → | |
Z.ai: GLM 4.7 Flash ist ein KI-Modell für allgemeinem Dialog von Z-ai, mit schneller Antwortzeit. Kontextfenster bis zu 203K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.06/Mio. Token, Ausgabe $0.4/Mio. Token. (Offizielle Beschreibung: As a 30B-class SOTA model, GLM-4.7-Flash offers a new option that balances performance and efficiency.) | Z-ai | $0.06 | $0.40 | 203K | Ansehen → | |
Qwen: Qwen3.5-Flash ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit schneller Antwortzeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.065/Mio. Token, Ausgabe $0.26/Mio. Token. (Offizielle Beschreibung: The Qwen3.5 native vision-language Flash models are built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency.) | Alibaba | $0.065 | $0.26 | 1.0M | Ansehen → | |
Microsoft: Phi 4 ist ein KI-Modell für allgemeinem Dialog von Microsoft, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 16K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.065/Mio. Token, Ausgabe $0.14/Mio. Token. (Offizielle Beschreibung: Microsoft Research Phi-4 is designed to perform well in complex reasoning tasks and can operate efficiently in situations with limited memory or where quick responses are needed.) | Microsoft | $0.065 | $0.14 | 16K | Ansehen → | |
Tencent: Hy3 preview ist ein KI-Modell für allgemeinem Dialog von Tencent, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.066/Mio. Token, Ausgabe $0.26/Mio. Token. (Offizielle Beschreibung: Hy3 preview is a high-efficiency Mixture-of-Experts model from Tencent designed for agentic workflows and production use.) | Tencent | $0.066 | $0.26 | 262K | Ansehen → | |
Baidu: ERNIE 4.5 21B A3B ist ein KI-Modell für allgemeinem Dialog von Baidu, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 120K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.07/Mio. Token, Ausgabe $0.28/Mio. Token. (Offizielle Beschreibung: A sophisticated text-based Mixture-of-Experts (MoE) model featuring 21B total parameters with 3B activated per token, delivering exceptional multimodal understanding and generation through heterogeneous MoE structures and modality-isolated routing.) | Baidu | $0.07 | $0.28 | 120K | Ansehen → | |
Qwen: Qwen3 235B A22B Instruct 2507 ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.071/Mio. Token, Ausgabe $0.1/Mio. Token. (Offizielle Beschreibung: Qwen3-235B-A22B-Instruct-2507 is a multilingual, instruction-tuned mixture-of-experts language model based on the Qwen3-235B architecture, with 22B active parameters per forward pass.) | Alibaba | $0.071 | $0.10 | 262K | Ansehen → | |
ByteDance Seed: Seed 1.6 Flash ist ein KI-Modell für allgemeinem Dialog von Bytedance-seed, mit schneller Antwortzeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.075/Mio. Token, Ausgabe $0.3/Mio. Token. (Offizielle Beschreibung: Seed 1.6 Flash is an ultra-fast multimodal deep thinking model by ByteDance Seed, supporting both text and visual understanding.) | Bytedance-seed | $0.075 | $0.30 | 262K | Ansehen → | |
Google: Gemini 2.0 Flash Lite ist ein KI-Modell für allgemeinem Dialog von Google, mit schneller Antwortzeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.075/Mio. Token, Ausgabe $0.3/Mio. Token. (Offizielle Beschreibung: Gemini 2.0 Flash Lite offers a significantly faster time to first token (TTFT) compared to Gemini Flash 1.5, while maintaining quality on par with larger models like Gemini Pro 1.5,) | $0.075 | $0.30 | 1.0M | Ansehen → | ||
Mistral: Mistral Small 3.2 24B ist ein KI-Modell für allgemeinem Dialog von Mistral AI, mit schneller Antwortzeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.075/Mio. Token, Ausgabe $0.2/Mio. Token. (Offizielle Beschreibung: Mistral-Small-3.2-24B-Instruct-2506 is an updated 24B parameter model from Mistral optimized for instruction following, repetition reduction, and improved function calling.) | Mistral AI | $0.075 | $0.20 | 128K | Ansehen → | |
OpenAI: gpt-oss-safeguard-20b ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.075/Mio. Token, Ausgabe $0.3/Mio. Token. (Offizielle Beschreibung: gpt-oss-safeguard-20b is a safety reasoning model from OpenAI built upon gpt-oss-20b.) | OpenAI | $0.075 | $0.30 | 131K | Ansehen → | |
Qwen: Qwen3 32B ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 41K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.08/Mio. Token, Ausgabe $0.28/Mio. Token. (Offizielle Beschreibung: Qwen3-32B is a dense 32.8B parameter causal language model from the Qwen3 series, optimized for both complex reasoning and efficient dialogue.) | Alibaba | $0.08 | $0.28 | 41K | Ansehen → | |
Qwen: Qwen3 VL 8B Instruct ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.08/Mio. Token, Ausgabe $0.5/Mio. Token. (Offizielle Beschreibung: Qwen3-VL-8B-Instruct is a multimodal vision-language model from the Qwen3-VL series, built for high-fidelity understanding and reasoning across text, images, and video.) | Alibaba | $0.08 | $0.50 | 131K | Ansehen → | |
Google: Gemma 3 27B ist ein KI-Modell für allgemeinem Dialog von Google, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.08/Mio. Token, Ausgabe $0.16/Mio. Token. (Offizielle Beschreibung: Gemma 3 introduces multimodality, supporting vision-language input and text outputs.) | $0.08 | $0.16 | 131K | Ansehen → | ||
inclusionAI: Ling-2.6-flash ist ein KI-Modell für allgemeinem Dialog von Inclusionai, mit schneller Antwortzeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.08/Mio. Token, Ausgabe $0.24/Mio. Token. (Offizielle Beschreibung: Ling-2.6-flash is an instant (instruct) model from inclusionAI with 104B total parameters and 7.4B active parameters, designed for real-world agents that require fast responses, strong execution, and high token efficiency) | Inclusionai | $0.08 | $0.24 | 262K | Ansehen → | |
Meta: Llama 4 Scout ist ein KI-Modell für allgemeinem Dialog von Meta, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 328K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.08/Mio. Token, Ausgabe $0.3/Mio. Token. (Offizielle Beschreibung: Llama 4 Scout 17B Instruct (16E) is a mixture-of-experts (MoE) language model developed by Meta, activating 17 billion parameters out of a total of 109B.) | Meta | $0.08 | $0.30 | 328K | Ansehen → | |
Microsoft: Phi 4 Mini Instruct ist ein KI-Modell für allgemeinem Dialog von Microsoft, mit schneller Antwortzeit. Kontextfenster bis zu 128K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.08/Mio. Token, Ausgabe $0.35/Mio. Token. (Offizielle Beschreibung: Phi-4-mini-instruct is a lightweight open model built upon synthetic data and filtered publicly available websites - with a focus on high-quality, reasoning dense data.) | Microsoft | $0.08 | $0.35 | 128K | Ansehen → | |
Qwen: Qwen3 30B A3B ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 41K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.09/Mio. Token, Ausgabe $0.45/Mio. Token. (Offizielle Beschreibung: Qwen3, the latest generation in the Qwen large language model series, features both dense and mixture-of-experts (MoE) architectures to excel in reasoning, multilingual support, and advanced agent tasks.) | Alibaba | $0.09 | $0.45 | 41K | Ansehen → | |
Qwen: Qwen3 30B A3B Instruct 2507 ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.09/Mio. Token, Ausgabe $0.3/Mio. Token. (Offizielle Beschreibung: Qwen3-30B-A3B-Instruct-2507 is a 30.5B-parameter mixture-of-experts language model from Qwen, with 3.3B active parameters per inference.) | Alibaba | $0.09 | $0.30 | 262K | Ansehen → | |
Qwen: Qwen3 Next 80B A3B Instruct ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.09/Mio. Token, Ausgabe $1.1/Mio. Token. (Offizielle Beschreibung: Qwen3-Next-80B-A3B-Instruct is an instruction-tuned chat model in the Qwen3-Next series optimized for fast, stable responses without “thinking” traces.) | Alibaba | $0.09 | $1.10 | 262K | Ansehen → | |
Tongyi DeepResearch 30B A3B ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.09/Mio. Token, Ausgabe $0.45/Mio. Token. (Offizielle Beschreibung: Tongyi DeepResearch is an agentic large language model developed by Tongyi Lab, with 30 billion total parameters activating only 3 billion per token.) | Alibaba | $0.09 | $0.45 | 131K | Ansehen → | |
NVIDIA: Nemotron 3 Super ist ein KI-Modell für allgemeinem Dialog von NVIDIA, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.09/Mio. Token, Ausgabe $0.45/Mio. Token. (Offizielle Beschreibung: NVIDIA Nemotron 3 Super is a 120B-parameter open hybrid MoE model, activating just 12B parameters for maximum compute efficiency and accuracy in complex multi-agent applications.) | NVIDIA | $0.09 | $0.45 | 262K | Ansehen → | |
Gemini 2.0 Flash ist Googles Allzweckmodell — schnell, effizient und multimodal. | $0.10 | $0.40 | 1.0M | Ansehen → | ||
ByteDance: UI-TARS 7B ist ein KI-Modell für allgemeinem Dialog von ByteDance, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Bildanalyse, API-Zugang. Preis: Eingabe $0.1/Mio. Token, Ausgabe $0.2/Mio. Token. (Offizielle Beschreibung: UI-TARS-1.5 is a multimodal vision-language agent optimized for GUI-based environments, including desktop interfaces, web browsers, mobile systems, and games.) | ByteDance | $0.10 | $0.20 | 128K | Ansehen → | |
ByteDance Seed: Seed-2.0-Mini ist ein KI-Modell für allgemeinem Dialog von Bytedance-seed, mit schneller Antwortzeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.1/Mio. Token, Ausgabe $0.4/Mio. Token. (Offizielle Beschreibung: Seed-2.0-mini targets latency-sensitive, high-concurrency, and cost-sensitive scenarios, emphasizing fast response and flexible inference deployment.) | Bytedance-seed | $0.10 | $0.40 | 262K | Ansehen → | |
Google: Gemini 2.0 Flash ist ein KI-Modell für allgemeinem Dialog von Google, mit schneller Antwortzeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.1/Mio. Token, Ausgabe $0.4/Mio. Token. (Offizielle Beschreibung: Gemini Flash 2.0 offers a significantly faster time to first token (TTFT) compared to Gemini Flash 1.5, while maintaining quality on par with larger models like Gemini Pro 1.5.) | $0.10 | $0.40 | 1.0M | Ansehen → | ||
Google: Gemini 2.5 Flash Lite ist ein KI-Modell für allgemeinem Dialog von Google, mit schneller Antwortzeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.1/Mio. Token, Ausgabe $0.4/Mio. Token. (Offizielle Beschreibung: Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency.) | $0.10 | $0.40 | 1.0M | Ansehen → | ||
Google: Gemini 2.5 Flash Lite Preview 09-2025 ist ein KI-Modell für allgemeinem Dialog von Google, mit schneller Antwortzeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.1/Mio. Token, Ausgabe $0.4/Mio. Token. (Offizielle Beschreibung: Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency.) | $0.10 | $0.40 | 1.0M | Ansehen → | ||
Meta: Llama 3.3 70B Instruct ist ein KI-Modell für allgemeinem Dialog von Meta, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.1/Mio. Token, Ausgabe $0.32/Mio. Token. (Offizielle Beschreibung: The Meta Llama 3.3 multilingual large language model (LLM) is a pretrained and instruction tuned generative model in 70B (text in/text out).) | Meta | $0.10 | $0.32 | 131K | Ansehen → | |
Mistral: Devstral Small 1.1 ist ein KI-Modell für allgemeinem Dialog von Mistral AI, mit schneller Antwortzeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.1/Mio. Token, Ausgabe $0.3/Mio. Token. (Offizielle Beschreibung: Devstral Small 1.1 is a 24B parameter open-weight language model for software engineering agents, developed by Mistral AI in collaboration with All Hands AI.) | Mistral AI | $0.10 | $0.30 | 131K | Ansehen → | |
Mistral: Ministral 3 3B 2512 ist ein KI-Modell für allgemeinem Dialog von Mistral AI, mit schneller Antwortzeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.1/Mio. Token, Ausgabe $0.1/Mio. Token. (Offizielle Beschreibung: The smallest model in the Ministral 3 family, Ministral 3 3B is a powerful, efficient tiny language model with vision capabilities.) | Mistral AI | $0.10 | $0.10 | 131K | Ansehen → | |
Mistral: Voxtral Small 24B 2507 ist ein KI-Modell für allgemeinem Dialog von Mistral AI, mit schneller Antwortzeit. Kontextfenster bis zu 32K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.1/Mio. Token, Ausgabe $0.3/Mio. Token. (Offizielle Beschreibung: Voxtral Small is an enhancement of Mistral Small 3, incorporating state-of-the-art audio input capabilities while retaining best-in-class text performance.) | Mistral AI | $0.10 | $0.30 | 32K | Ansehen → | |
NVIDIA: Llama 3.3 Nemotron Super 49B V1.5 ist ein KI-Modell für allgemeinem Dialog von NVIDIA, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.1/Mio. Token, Ausgabe $0.4/Mio. Token. (Offizielle Beschreibung: Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context.) | NVIDIA | $0.10 | $0.40 | 131K | Ansehen → | |
OpenAI: GPT-4.1 Nano ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit schneller Antwortzeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.1/Mio. Token, Ausgabe $0.4/Mio. Token. (Offizielle Beschreibung: For tasks that demand low latency, GPT‑4.1 nano is the fastest and cheapest model in the GPT-4.1 series.) | OpenAI | $0.10 | $0.40 | 1.0M | Ansehen → | |
Reka Edge ist ein KI-Modell für allgemeinem Dialog von Rekaai, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 16K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.1/Mio. Token, Ausgabe $0.1/Mio. Token. (Offizielle Beschreibung: Reka Edge is an extremely efficient 7B multimodal vision-language model that accepts image/video+text inputs and generates text outputs.) | Rekaai | $0.10 | $0.10 | 16K | Ansehen → | |
Reka Flash 3 ist ein KI-Modell für allgemeinem Dialog von Rekaai, mit schneller Antwortzeit. Kontextfenster bis zu 66K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.1/Mio. Token, Ausgabe $0.2/Mio. Token. (Offizielle Beschreibung: Reka Flash 3 is a general-purpose, instruction-tuned large language model with 21 billion parameters, developed by Reka.) | Rekaai | $0.10 | $0.20 | 66K | Ansehen → | |
StepFun: Step 3.5 Flash ist ein KI-Modell für allgemeinem Dialog von Stepfun, mit schneller Antwortzeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.1/Mio. Token, Ausgabe $0.3/Mio. Token. (Offizielle Beschreibung: Step 3.5 Flash is StepFun's most capable open-source foundation model.) | Stepfun | $0.10 | $0.30 | 262K | Ansehen → | |
Xiaomi: MiMo-V2-Flash ist ein KI-Modell für allgemeinem Dialog von Xiaomi, mit schneller Antwortzeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.1/Mio. Token, Ausgabe $0.3/Mio. Token. (Offizielle Beschreibung: MiMo-V2-Flash is an open-source foundation language model developed by Xiaomi.) | Xiaomi | $0.10 | $0.30 | 262K | Ansehen → | |
Z.ai: GLM 4 32B ist ein KI-Modell für allgemeinem Dialog von Z-ai, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.1/Mio. Token, Ausgabe $0.1/Mio. Token. (Offizielle Beschreibung: GLM 4 32B is a cost-effective foundation language model.) | Z-ai | $0.10 | $0.10 | 128K | Ansehen → | |
Qwen: Qwen3 VL 32B Instruct ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.104/Mio. Token, Ausgabe $0.416/Mio. Token. (Offizielle Beschreibung: Qwen3-VL-32B-Instruct is a large-scale multimodal vision-language model designed for high-precision understanding and reasoning across text, images, and video.) | Alibaba | $0.104 | $0.416 | 131K | Ansehen → | |
Mistral: Mistral 7B Instruct v0.1 ist ein KI-Modell für allgemeinem Dialog von Mistral AI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 3K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.11/Mio. Token, Ausgabe $0.19/Mio. Token. (Offizielle Beschreibung: A 7.3B parameter model that outperforms Llama 2 13B on all benchmarks, with optimizations for speed and context length.) | Mistral AI | $0.11 | $0.19 | 3K | Ansehen → | |
Google: Gemma 4 31B ist ein KI-Modell für allgemeinem Dialog von Google, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.12/Mio. Token, Ausgabe $0.37/Mio. Token. (Offizielle Beschreibung: Gemma 4 31B Instruct is Google DeepMind's 30.7B dense multimodal model supporting text and image input with text output.) | $0.12 | $0.37 | 262K | Ansehen → | ||
Qwen: Qwen3 VL 30B A3B Instruct ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.13/Mio. Token, Ausgabe $0.52/Mio. Token. (Offizielle Beschreibung: Qwen3-VL-30B-A3B-Instruct is a multimodal model that unifies strong text generation with visual understanding for images and videos.) | Alibaba | $0.13 | $0.52 | 131K | Ansehen → | |
Nous: Hermes 4 70B ist ein KI-Modell für allgemeinem Dialog von Nous Research, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.13/Mio. Token, Ausgabe $0.4/Mio. Token. (Offizielle Beschreibung: Hermes 4 70B is a hybrid reasoning model from Nous Research, built on Meta-Llama-3.1-70B.) | Nous Research | $0.13 | $0.40 | 131K | Ansehen → | |
Z.ai: GLM 4.5 Air ist ein KI-Modell für allgemeinem Dialog von Z-ai, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.13/Mio. Token, Ausgabe $0.85/Mio. Token. (Offizielle Beschreibung: GLM-4.5-Air is the lightweight variant of our latest flagship model family, also purpose-built for agent-centric applications.) | Z-ai | $0.13 | $0.85 | 131K | Ansehen → | |
Nex AGI: DeepSeek V3.1 Nex N1 ist ein KI-Modell für allgemeinem Dialog von Nex-agi, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.135/Mio. Token, Ausgabe $0.5/Mio. Token. (Offizielle Beschreibung: DeepSeek V3.1 Nex-N1 is the flagship release of the Nex-N1 series — a post-trained model designed to highlight agent autonomy, tool use, and real-world productivity.) | Nex-agi | $0.135 | $0.50 | 131K | Ansehen → | |
Qwen: Qwen VL Plus ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit langsamer, aber leistungsstarker Verarbeitung. Kontextfenster bis zu 131K Token. Fähigkeiten: Bildanalyse, API-Zugang. Preis: Eingabe $0.1365/Mio. Token, Ausgabe $0.4095/Mio. Token. (Offizielle Beschreibung: Qwen's Enhanced Large Visual Language Model.) | Alibaba | $0.1365 | $0.4095 | 131K | Ansehen → | |
Qwen: Qwen3.5-35B-A3B ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.14/Mio. Token, Ausgabe $1/Mio. Token. (Offizielle Beschreibung: The Qwen3.5 Series 35B-A3B is a native vision-language model designed with a hybrid architecture that integrates linear attention mechanisms and a sparse mixture-of-experts model, achieving higher inference efficiency.) | Alibaba | $0.14 | $1.00 | 262K | Ansehen → | |
Baidu: ERNIE 4.5 VL 28B A3B ist ein KI-Modell für allgemeinem Dialog von Baidu, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 30K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.14/Mio. Token, Ausgabe $0.56/Mio. Token. (Offizielle Beschreibung: A powerful multimodal Mixture-of-Experts chat model featuring 28B total parameters with 3B activated per token, delivering exceptional text and vision understanding through its innovative heterogeneous MoE structure with modality-isolated routing) | Baidu | $0.14 | $0.56 | 30K | Ansehen → | |
DeepSeek: DeepSeek V4 Flash ist ein KI-Modell für allgemeinem Dialog von DeepSeek, mit schneller Antwortzeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.14/Mio. Token, Ausgabe $0.28/Mio. Token. (Offizielle Beschreibung: DeepSeek V4 Flash is an efficiency-optimized Mixture-of-Experts model from DeepSeek with 284B total parameters and 13B activated parameters, supporting a 1M-token context window.) | DeepSeek | $0.14 | $0.28 | 1.0M | Ansehen → | |
NousResearch: Hermes 2 Pro - Llama-3 8B ist ein KI-Modell für allgemeinem Dialog von Nous Research, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 8K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.14/Mio. Token, Ausgabe $0.14/Mio. Token. (Offizielle Beschreibung: Hermes 2 Pro is an upgraded, retrained version of Nous Hermes 2, consisting of an updated and cleaned version of the OpenHermes 2.5 Dataset, as well as a newly introduced) | Nous Research | $0.14 | $0.14 | 8K | Ansehen → | |
Tencent: Hunyuan A13B Instruct ist ein KI-Modell für allgemeinem Dialog von Tencent, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.14/Mio. Token, Ausgabe $0.57/Mio. Token. (Offizielle Beschreibung: Hunyuan-A13B is a 13B active parameter Mixture-of-Experts (MoE) language model developed by Tencent, with a total parameter count of 80B and support for reasoning via Chain-of-Thought.) | Tencent | $0.14 | $0.57 | 131K | Ansehen → | |
Qwen: Qwen3.6 35B A3B ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.15/Mio. Token, Ausgabe $1/Mio. Token. (Offizielle Beschreibung: Qwen3.6-35B-A3B is an open-weight multimodal model from Alibaba Cloud with 35 billion total parameters and 3 billion active parameters per token.) | Alibaba | $0.15 | $1.00 | 262K | Ansehen → | |
AllenAI: Olmo 3 32B Think ist ein KI-Modell für allgemeinem Dialog von Allen AI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 66K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.15/Mio. Token, Ausgabe $0.5/Mio. Token. (Offizielle Beschreibung: Olmo 3 32B Think is a large-scale, 32-billion-parameter model purpose-built for deep reasoning, complex logic chains and advanced instruction-following scenarios.) | Allen AI | $0.15 | $0.50 | 66K | Ansehen → | |
Arcee AI: Trinity Large Preview ist ein KI-Modell für allgemeinem Dialog von Arcee-ai, mit langsamer, aber leistungsstarker Verarbeitung. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.15/Mio. Token, Ausgabe $0.45/Mio. Token. (Offizielle Beschreibung: Trinity-Large-Preview is a frontier-scale open-weight language model from Arcee, built as a 400B-parameter sparse Mixture-of-Experts with 13B active parameters per token using 4-of-256 expert routing.) | Arcee-ai | $0.15 | $0.45 | 131K | Ansehen → | |
Cohere: Command R (08-2024) ist ein KI-Modell für allgemeinem Dialog von Cohere, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.15/Mio. Token, Ausgabe $0.6/Mio. Token. (Offizielle Beschreibung: command-r-08-2024 is an update of the Command R with improved performance for multilingual retrieval-augmented generation (RAG) and tool use.) | Cohere | $0.15 | $0.60 | 128K | Ansehen → | |
EssentialAI: Rnj 1 Instruct ist ein KI-Modell für allgemeinem Dialog von Essentialai, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 33K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.15/Mio. Token, Ausgabe $0.15/Mio. Token. (Offizielle Beschreibung: Rnj-1 is an 8B-parameter, dense, open-weight model family developed by Essential AI and trained from scratch with a focus on programming, math, and scientific reasoning.) | Essentialai | $0.15 | $0.15 | 33K | Ansehen → | |
Meta: Llama 4 Maverick ist ein KI-Modell für allgemeinem Dialog von Meta, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, API-Zugang. Preis: Eingabe $0.15/Mio. Token, Ausgabe $0.6/Mio. Token. (Offizielle Beschreibung: Llama 4 Maverick 17B Instruct (128E) is a high-capacity multimodal language model from Meta, built on a mixture-of-experts (MoE) architecture with 128 experts and 17 billion active parameters per forward) | Meta | $0.15 | $0.60 | 1.0M | Ansehen → | |
MiniMax: MiniMax M2.5 ist ein KI-Modell für allgemeinem Dialog von MiniMax, mit schneller Antwortzeit. Kontextfenster bis zu 197K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.15/Mio. Token, Ausgabe $1.15/Mio. Token. (Offizielle Beschreibung: MiniMax-M2.5 is a SOTA large language model designed for real-world productivity.) | MiniMax | $0.15 | $1.15 | 197K | Ansehen → | |
Mistral: Ministral 3 8B 2512 ist ein KI-Modell für allgemeinem Dialog von Mistral AI, mit schneller Antwortzeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.15/Mio. Token, Ausgabe $0.15/Mio. Token. (Offizielle Beschreibung: A balanced model in the Ministral 3 family, Ministral 3 8B is a powerful, efficient tiny language model with vision capabilities.) | Mistral AI | $0.15 | $0.15 | 262K | Ansehen → | |
Mistral: Mistral Small 4 ist ein KI-Modell für allgemeinem Dialog von Mistral AI, mit schneller Antwortzeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.15/Mio. Token, Ausgabe $0.6/Mio. Token. (Offizielle Beschreibung: Mistral Small 4 is the next major release in the Mistral Small family, unifying the capabilities of several flagship Mistral models into a single system.) | Mistral AI | $0.15 | $0.60 | 262K | Ansehen → | |
OpenAI: GPT-4o-mini ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit schneller Antwortzeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.15/Mio. Token, Ausgabe $0.6/Mio. Token. (Offizielle Beschreibung: GPT-4o mini is OpenAI's newest model after GPT-4 Omni, supporting both text and image inputs with text outputs.) | OpenAI | $0.15 | $0.60 | 128K | Ansehen → | |
OpenAI: GPT-4o-mini (2024-07-18) ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit schneller Antwortzeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.15/Mio. Token, Ausgabe $0.6/Mio. Token. (Offizielle Beschreibung: GPT-4o mini is OpenAI's newest model after GPT-4 Omni, supporting both text and image inputs with text outputs.) | OpenAI | $0.15 | $0.60 | 128K | Ansehen → | |
OpenAI: GPT-4o-mini Search Preview ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit schneller Antwortzeit. Kontextfenster bis zu 128K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.15/Mio. Token, Ausgabe $0.6/Mio. Token. (Offizielle Beschreibung: GPT-4o mini Search Preview is a specialized model for web search in Chat Completions.) | OpenAI | $0.15 | $0.60 | 128K | Ansehen → | |
Upstage: Solar Pro 3 ist ein KI-Modell für allgemeinem Dialog von Upstage, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.15/Mio. Token, Ausgabe $0.6/Mio. Token. (Offizielle Beschreibung: Solar Pro 3 is Upstage's powerful Mixture-of-Experts (MoE) language model.) | Upstage | $0.15 | $0.60 | 128K | Ansehen → | |
TheDrummer: Rocinante 12B ist ein KI-Modell für allgemeinem Dialog von TheDrummer, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 33K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.17/Mio. Token, Ausgabe $0.43/Mio. Token. (Offizielle Beschreibung: Rocinante 12B is designed for engaging storytelling and rich prose.) | TheDrummer | $0.17 | $0.43 | 33K | Ansehen → | |
Arcee AI: Spotlight ist ein KI-Modell für allgemeinem Dialog von Arcee-ai, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Bildanalyse, API-Zugang. Preis: Eingabe $0.18/Mio. Token, Ausgabe $0.18/Mio. Token. (Offizielle Beschreibung: Spotlight is a 7‑billion‑parameter vision‑language model derived from Qwen 2.5‑VL and fine‑tuned by Arcee AI for tight image‑text grounding tasks.) | Arcee-ai | $0.18 | $0.18 | 131K | Ansehen → | |
Meta: Llama Guard 4 12B ist ein KI-Modell für allgemeinem Dialog von Meta, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 164K Token. Fähigkeiten: Bildanalyse, API-Zugang. Preis: Eingabe $0.18/Mio. Token, Ausgabe $0.18/Mio. Token. (Offizielle Beschreibung: Llama Guard 4 is a Llama 4 Scout-derived multimodal pretrained model, fine-tuned for content safety classification.) | Meta | $0.18 | $0.18 | 164K | Ansehen → | |
Qwen: Qwen3.5-27B ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.195/Mio. Token, Ausgabe $1.56/Mio. Token. (Offizielle Beschreibung: The Qwen3.5 27B native vision-language Dense model incorporates a linear attention mechanism, delivering fast response times while balancing inference speed and performance.) | Alibaba | $0.195 | $1.56 | 262K | Ansehen → | |
Qwen: Qwen3 VL 235B A22B Instruct ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.2/Mio. Token, Ausgabe $0.88/Mio. Token. (Offizielle Beschreibung: Qwen3-VL-235B-A22B Instruct is an open-weight multimodal model that unifies strong text generation with visual understanding across images and video.) | Alibaba | $0.20 | $0.88 | 262K | Ansehen → | |
DeepSeek: DeepSeek V3 0324 ist ein KI-Modell für allgemeinem Dialog von DeepSeek, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 164K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.2/Mio. Token, Ausgabe $0.77/Mio. Token. (Offizielle Beschreibung: DeepSeek V3, a 685B-parameter, mixture-of-experts model, is the latest iteration of the flagship chat model family from the DeepSeek team.) | DeepSeek | $0.20 | $0.77 | 164K | Ansehen → | |
MiniMax: MiniMax-01 ist ein KI-Modell für allgemeinem Dialog von MiniMax, mit schneller Antwortzeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, API-Zugang. Preis: Eingabe $0.2/Mio. Token, Ausgabe $1.1/Mio. Token. (Offizielle Beschreibung: MiniMax-01 is a combines MiniMax-Text-01 for text generation and MiniMax-VL-01 for image understanding.) | MiniMax | $0.20 | $1.10 | 1.0M | Ansehen → | |
Mistral: Ministral 3 14B 2512 ist ein KI-Modell für allgemeinem Dialog von Mistral AI, mit schneller Antwortzeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.2/Mio. Token, Ausgabe $0.2/Mio. Token. (Offizielle Beschreibung: The largest model in the Ministral 3 family, Ministral 3 14B offers frontier capabilities and performance comparable to its larger Mistral Small 3.2 24B counterpart.) | Mistral AI | $0.20 | $0.20 | 262K | Ansehen → | |
Mistral: Saba ist ein KI-Modell für allgemeinem Dialog von Mistral AI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 33K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.2/Mio. Token, Ausgabe $0.6/Mio. Token. (Offizielle Beschreibung: Mistral Saba is a 24B-parameter language model specifically designed for the Middle East and South Asia, delivering accurate and contextually relevant responses while maintaining efficient performance.) | Mistral AI | $0.20 | $0.60 | 33K | Ansehen → | |
OpenAI: GPT-5.4 Nano ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit schneller Antwortzeit. Kontextfenster bis zu 400K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.2/Mio. Token, Ausgabe $1.25/Mio. Token. (Offizielle Beschreibung: GPT-5.4 nano is the most lightweight and cost-efficient variant of the GPT-5.4 family, optimized for speed-critical and high-volume tasks.) | OpenAI | $0.20 | $1.25 | 400K | Ansehen → | |
Prime Intellect: INTELLECT-3 ist ein KI-Modell für allgemeinem Dialog von Prime-intellect, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.2/Mio. Token, Ausgabe $1.1/Mio. Token. (Offizielle Beschreibung: INTELLECT-3 is a 106B-parameter Mixture-of-Experts model (12B active) post-trained from GLM-4.5-Air-Base using supervised fine-tuning (SFT) followed by large-scale reinforcement learning (RL).) | Prime-intellect | $0.20 | $1.10 | 131K | Ansehen → | |
xAI: Grok 4 Fast ist ein KI-Modell für allgemeinem Dialog von xAI, mit schneller Antwortzeit. Kontextfenster bis zu 2 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.2/Mio. Token, Ausgabe $0.5/Mio. Token. (Offizielle Beschreibung: Grok 4 Fast is xAI's latest multimodal model with SOTA cost-efficiency and a 2M token context window.) | xAI | $0.20 | $0.50 | 2.0M | Ansehen → | |
xAI: Grok 4.1 Fast ist ein KI-Modell für allgemeinem Dialog von xAI, mit schneller Antwortzeit. Kontextfenster bis zu 2 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.2/Mio. Token, Ausgabe $0.5/Mio. Token. (Offizielle Beschreibung: Grok 4.1 Fast is xAI's best agentic tool calling model that shines in real-world use cases like customer support and deep research.) | xAI | $0.20 | $0.50 | 2.0M | Ansehen → | |
DeepSeek: DeepSeek V3.1 ist ein KI-Modell für allgemeinem Dialog von DeepSeek, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 164K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.21/Mio. Token, Ausgabe $0.79/Mio. Token. (Offizielle Beschreibung: DeepSeek-V3.1 is a large hybrid reasoning model (671B parameters, 37B active) that supports both thinking and non-thinking modes via prompt templates.) | DeepSeek | $0.21 | $0.79 | 164K | Ansehen → | |
Meta: Llama 3.2 11B Vision Instruct ist ein KI-Modell für allgemeinem Dialog von Meta, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Bildanalyse, API-Zugang. Preis: Eingabe $0.245/Mio. Token, Ausgabe $0.245/Mio. Token. (Offizielle Beschreibung: Llama 3.2 11B Vision is a multimodal model with 11 billion parameters, designed to handle tasks combining visual and textual data.) | Meta | $0.245 | $0.245 | 131K | Ansehen → | |
Qwen: Qwen2.5 VL 72B Instruct ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 32K Token. Fähigkeiten: Bildanalyse, API-Zugang. Preis: Eingabe $0.25/Mio. Token, Ausgabe $0.75/Mio. Token. (Offizielle Beschreibung: Qwen2.5-VL is proficient in recognizing common objects such as flowers, birds, fish, and insects.) | Alibaba | $0.25 | $0.75 | 32K | Ansehen → | |
Qwen: Qwen3.6 Flash ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit schneller Antwortzeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.25/Mio. Token, Ausgabe $1.5/Mio. Token. (Offizielle Beschreibung: Qwen3.6 Flash is a fast, efficient language model from Alibaba's Qwen 3.6 series.) | Alibaba | $0.25 | $1.50 | 1.0M | Ansehen → | |
Anthropic: Claude 3 Haiku ist ein KI-Modell für allgemeinem Dialog von Anthropic, mit schneller Antwortzeit. Kontextfenster bis zu 200K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.25/Mio. Token, Ausgabe $1.25/Mio. Token. (Offizielle Beschreibung: Claude 3 Haiku is Anthropic's fastest and most compact model for near-instant responsiveness.) | Anthropic | $0.25 | $1.25 | 200K | Ansehen → | |
ByteDance Seed: Seed 1.6 ist ein KI-Modell für allgemeinem Dialog von Bytedance-seed, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.25/Mio. Token, Ausgabe $2/Mio. Token. (Offizielle Beschreibung: Seed 1.6 is a general-purpose model released by the ByteDance Seed team.) | Bytedance-seed | $0.25 | $2.00 | 262K | Ansehen → | |
ByteDance Seed: Seed-2.0-Lite ist ein KI-Modell für allgemeinem Dialog von Bytedance-seed, mit schneller Antwortzeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.25/Mio. Token, Ausgabe $2/Mio. Token. (Offizielle Beschreibung: Seed-2.0-Lite is a versatile, cost‑efficient enterprise workhorse that delivers strong multimodal and agent capabilities while offering noticeably lower latency, making it a practical default choice for most production workloads across) | Bytedance-seed | $0.25 | $2.00 | 262K | Ansehen → | |
Google: Gemini 3.1 Flash Lite ist ein KI-Modell für allgemeinem Dialog von Google, mit schneller Antwortzeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.25/Mio. Token, Ausgabe $1.5/Mio. Token. (Offizielle Beschreibung: Gemini 3.1 Flash Lite is Google’s GA high-efficiency multimodal model optimized for low-latency, high-volume workloads.) | $0.25 | $1.50 | 1.0M | Ansehen → | ||
Google: Gemini 3.1 Flash Lite Preview ist ein KI-Modell für allgemeinem Dialog von Google, mit schneller Antwortzeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.25/Mio. Token, Ausgabe $1.5/Mio. Token. (Offizielle Beschreibung: Gemini 3.1 Flash Lite Preview is Google's high-efficiency model optimized for high-volume use cases.) | $0.25 | $1.50 | 1.0M | Ansehen → | ||
Inception: Mercury 2 ist ein KI-Modell für allgemeinem Dialog von Inception, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.25/Mio. Token, Ausgabe $0.75/Mio. Token. (Offizielle Beschreibung: Mercury 2 is an extremely fast reasoning LLM, and the first reasoning diffusion LLM (dLLM).) | Inception | $0.25 | $0.75 | 128K | Ansehen → | |
OpenAI: GPT-5 Mini ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit schneller Antwortzeit. Kontextfenster bis zu 400K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.25/Mio. Token, Ausgabe $2/Mio. Token. (Offizielle Beschreibung: GPT-5 Mini is a compact version of GPT-5, designed to handle lighter-weight reasoning tasks.) | OpenAI | $0.25 | $2.00 | 400K | Ansehen → | |
OpenAI: GPT-5.1-Codex-Mini ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit schneller Antwortzeit. Kontextfenster bis zu 400K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.25/Mio. Token, Ausgabe $2/Mio. Token. (Offizielle Beschreibung: GPT-5.1-Codex-Mini is a smaller and faster version of GPT-5.1-Codex) | OpenAI | $0.25 | $2.00 | 400K | Ansehen → | |
DeepSeek: DeepSeek V3.2 ist ein KI-Modell für allgemeinem Dialog von DeepSeek, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.252/Mio. Token, Ausgabe $0.378/Mio. Token. (Offizielle Beschreibung: DeepSeek-V3.2 is a large language model designed to harmonize high computational efficiency with strong reasoning and agentic tool-use performance.) | DeepSeek | $0.252 | $0.378 | 131K | Ansehen → | |
MiniMax: MiniMax M2 ist ein KI-Modell für allgemeinem Dialog von MiniMax, mit schneller Antwortzeit. Kontextfenster bis zu 197K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.255/Mio. Token, Ausgabe $1/Mio. Token. (Offizielle Beschreibung: MiniMax-M2 is a compact, high-efficiency large language model optimized for end-to-end coding and agentic workflows.) | MiniMax | $0.255 | $1.00 | 197K | Ansehen → | |
Qwen: Qwen Plus 0728 ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit langsamer, aber leistungsstarker Verarbeitung. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.26/Mio. Token, Ausgabe $0.78/Mio. Token. (Offizielle Beschreibung: Qwen Plus 0728, based on the Qwen3 foundation model, is a 1 million context hybrid reasoning model with a balanced performance, speed, and cost combination.) | Alibaba | $0.26 | $0.78 | 1.0M | Ansehen → | |
Qwen: Qwen-Plus ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit langsamer, aber leistungsstarker Verarbeitung. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.26/Mio. Token, Ausgabe $0.78/Mio. Token. (Offizielle Beschreibung: Qwen-Plus, based on the Qwen2.5 foundation model, is a 131K context model with a balanced performance, speed, and cost combination.) | Alibaba | $0.26 | $0.78 | 1.0M | Ansehen → | |
Qwen: Qwen3.5 Plus 2026-02-15 ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit langsamer, aber leistungsstarker Verarbeitung. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.26/Mio. Token, Ausgabe $1.56/Mio. Token. (Offizielle Beschreibung: The Qwen3.5 native vision-language series Plus models are built on a hybrid architecture that integrates linear attention mechanisms with sparse mixture-of-experts models, achieving higher inference efficiency.) | Alibaba | $0.26 | $1.56 | 1.0M | Ansehen → | |
Qwen: Qwen3.5-122B-A10B ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.26/Mio. Token, Ausgabe $2.08/Mio. Token. (Offizielle Beschreibung: The Qwen3.5 122B-A10B native vision-language model is built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency.) | Alibaba | $0.26 | $2.08 | 262K | Ansehen → | |
DeepSeek: DeepSeek V3.1 Terminus ist ein KI-Modell für allgemeinem Dialog von DeepSeek, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 164K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.27/Mio. Token, Ausgabe $0.95/Mio. Token. (Offizielle Beschreibung: DeepSeek-V3.1 Terminus is an update to DeepSeek V3.1 that maintains the model's original capabilities while addressing issues reported by users, including language consistency and agent capabilities, further optimizing the model's) | DeepSeek | $0.27 | $0.95 | 164K | Ansehen → | |
DeepSeek: DeepSeek V3.2 Exp ist ein KI-Modell für allgemeinem Dialog von DeepSeek, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 164K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.27/Mio. Token, Ausgabe $0.41/Mio. Token. (Offizielle Beschreibung: DeepSeek-V3.2-Exp is an experimental large language model released by DeepSeek as an intermediate step between V3.1 and future architectures.) | DeepSeek | $0.27 | $0.41 | 164K | Ansehen → | |
Baidu: ERNIE 4.5 300B A47B ist ein KI-Modell für allgemeinem Dialog von Baidu, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 123K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.28/Mio. Token, Ausgabe $1.1/Mio. Token. (Offizielle Beschreibung: ERNIE-4.5-300B-A47B is a 300B parameter Mixture-of-Experts (MoE) language model developed by Baidu as part of the ERNIE 4.5 series.) | Baidu | $0.28 | $1.10 | 123K | Ansehen → | |
DeepSeek: DeepSeek V3.2 Speciale ist ein KI-Modell für allgemeinem Dialog von DeepSeek, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 164K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.287/Mio. Token, Ausgabe $0.431/Mio. Token. (Offizielle Beschreibung: DeepSeek-V3.2-Speciale is a high-compute variant of DeepSeek-V3.2 optimized for maximum reasoning and agentic performance.) | DeepSeek | $0.287 | $0.431 | 164K | Ansehen → | |
MiniMax: MiniMax M2.1 ist ein KI-Modell für allgemeinem Dialog von MiniMax, mit schneller Antwortzeit. Kontextfenster bis zu 197K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.29/Mio. Token, Ausgabe $0.95/Mio. Token. (Offizielle Beschreibung: MiniMax-M2.1 is a lightweight, state-of-the-art large language model optimized for coding, agentic workflows, and modern application development.) | MiniMax | $0.29 | $0.95 | 197K | Ansehen → | |
MiniMax: MiniMax M2.7 ist ein KI-Modell für allgemeinem Dialog von MiniMax, mit schneller Antwortzeit. Kontextfenster bis zu 197K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.299/Mio. Token, Ausgabe $1.2/Mio. Token. (Offizielle Beschreibung: MiniMax-M2.7 is a next-generation large language model designed for autonomous, real-world productivity and continuous improvement.) | MiniMax | $0.299 | $1.20 | 197K | Ansehen → | |
Amazon: Nova 2 Lite ist ein KI-Modell für allgemeinem Dialog von Amazon, mit schneller Antwortzeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.3/Mio. Token, Ausgabe $2.5/Mio. Token. (Offizielle Beschreibung: Nova 2 Lite is a fast, cost-effective reasoning model for everyday workloads that can process text, images, and videos to generate text.) | Amazon | $0.30 | $2.50 | 1.0M | Ansehen → | |
Google: Gemini 2.5 Flash ist ein KI-Modell für allgemeinem Dialog von Google, mit schneller Antwortzeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.3/Mio. Token, Ausgabe $2.5/Mio. Token. (Offizielle Beschreibung: Gemini 2.5 Flash is Google's state-of-the-art workhorse model, specifically designed for advanced reasoning, coding, mathematics, and scientific tasks.) | $0.30 | $2.50 | 1.0M | Ansehen → | ||
inclusionAI: Ling-2.6-1T ist ein KI-Modell für allgemeinem Dialog von Inclusionai, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.3/Mio. Token, Ausgabe $2.5/Mio. Token. (Offizielle Beschreibung: Ling-2.6-1T is an instant (instruct) model from inclusionAI and the company’s trillion-parameter flagship, designed for real-world agents that require fast execution and high efficiency at scale.) | Inclusionai | $0.30 | $2.50 | 262K | Ansehen → | |
MiniMax: MiniMax M2-her ist ein KI-Modell für allgemeinem Dialog von MiniMax, mit schneller Antwortzeit. Kontextfenster bis zu 66K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.3/Mio. Token, Ausgabe $1.2/Mio. Token. (Offizielle Beschreibung: MiniMax M2-her is a dialogue-first large language model built for immersive roleplay, character-driven chat, and expressive multi-turn conversations.) | MiniMax | $0.30 | $1.20 | 66K | Ansehen → | |
Nous: Hermes 3 70B Instruct ist ein KI-Modell für allgemeinem Dialog von Nous Research, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.3/Mio. Token, Ausgabe $0.3/Mio. Token. (Offizielle Beschreibung: Hermes 3 is a generalist language model with many improvements over Hermes 2, including advanced agentic capabilities, much better roleplaying, reasoning, multi-turn conversation, long context coherence, and improvements across the) | Nous Research | $0.30 | $0.30 | 131K | Ansehen → | |
TheDrummer: Cydonia 24B V4.1 ist ein KI-Modell für allgemeinem Dialog von TheDrummer, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.3/Mio. Token, Ausgabe $0.5/Mio. Token. (Offizielle Beschreibung: Uncensored and creative writing model based on Mistral Small 3.2 24B with good recall, prompt adherence, and intelligence.) | TheDrummer | $0.30 | $0.50 | 131K | Ansehen → | |
Z.ai: GLM 4.6V ist ein KI-Modell für allgemeinem Dialog von Z-ai, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.3/Mio. Token, Ausgabe $0.9/Mio. Token. (Offizielle Beschreibung: GLM-4.6V is a large multimodal model designed for high-fidelity visual understanding and long-context reasoning across images, documents, and mixed media.) | Z-ai | $0.30 | $0.90 | 131K | Ansehen → | |
xAI: Grok 3 Mini ist ein KI-Modell für allgemeinem Dialog von xAI, mit schneller Antwortzeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.3/Mio. Token, Ausgabe $0.5/Mio. Token. (Offizielle Beschreibung: A lightweight model that thinks before responding.) | xAI | $0.30 | $0.50 | 131K | Ansehen → | |
xAI: Grok 3 Mini Beta ist ein KI-Modell für allgemeinem Dialog von xAI, mit schneller Antwortzeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.3/Mio. Token, Ausgabe $0.5/Mio. Token. (Offizielle Beschreibung: Grok 3 Mini is a lightweight, smaller thinking model.) | xAI | $0.30 | $0.50 | 131K | Ansehen → | |
Qwen: Qwen3.6 27B ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.32/Mio. Token, Ausgabe $3.2/Mio. Token. (Offizielle Beschreibung: Qwen3.6 27B is a dense 27-billion-parameter language model from the Qwen Team at Alibaba, released in April 2026.) | Alibaba | $0.32 | $3.20 | 262K | Ansehen → | |
DeepSeek: DeepSeek V3 ist ein KI-Modell für allgemeinem Dialog von DeepSeek, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 164K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.32/Mio. Token, Ausgabe $0.89/Mio. Token. (Offizielle Beschreibung: DeepSeek-V3 is the latest model from the DeepSeek team, building upon the instruction following and coding abilities of the previous versions.) | DeepSeek | $0.32 | $0.89 | 164K | Ansehen → | |
Qwen: Qwen3.6 Plus ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit langsamer, aber leistungsstarker Verarbeitung. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.325/Mio. Token, Ausgabe $1.95/Mio. Token. (Offizielle Beschreibung: Qwen 3.6 Plus builds on a hybrid architecture that combines efficient linear attention with sparse mixture-of-experts routing, enabling strong scalability and high-performance inference.) | Alibaba | $0.325 | $1.95 | 1.0M | Ansehen → | |
Mistral: Mistral Small 3.1 24B ist ein KI-Modell für allgemeinem Dialog von Mistral AI, mit schneller Antwortzeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Bildanalyse, API-Zugang. Preis: Eingabe $0.35/Mio. Token, Ausgabe $0.56/Mio. Token. (Offizielle Beschreibung: Mistral Small 3.1 24B Instruct is an upgraded variant of Mistral Small 3 (2501), featuring 24 billion parameters with advanced multimodal capabilities.) | Mistral AI | $0.35 | $0.56 | 128K | Ansehen → | |
Qwen2.5 72B Instruct ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 33K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.36/Mio. Token, Ausgabe $0.4/Mio. Token. (Offizielle Beschreibung: Qwen2.5 72B is the latest series of Qwen large language models.) | Alibaba | $0.36 | $0.40 | 33K | Ansehen → | |
Qwen: Qwen3.5 397B A17B ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.39/Mio. Token, Ausgabe $2.34/Mio. Token. (Offizielle Beschreibung: The Qwen3.5 series 397B-A17B native vision-language model is built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency.) | Alibaba | $0.39 | $2.34 | 262K | Ansehen → | |
Z.ai: GLM 4.6 ist ein KI-Modell für allgemeinem Dialog von Z-ai, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 205K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.39/Mio. Token, Ausgabe $1.9/Mio. Token. (Offizielle Beschreibung: Compared with GLM-4.5, this generation brings several key improvements: Longer context window: The context window has been expanded from 128K to 200K tokens, enabling the model to handle more complex) | Z-ai | $0.39 | $1.90 | 205K | Ansehen → | |
Qwen: Qwen3.5 Plus 2026-04-20 ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit langsamer, aber leistungsstarker Verarbeitung. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.4/Mio. Token, Ausgabe $2.4/Mio. Token. (Offizielle Beschreibung: Qwen3.5 Plus (April 2026) is a large-scale multimodal language model from Alibaba.) | Alibaba | $0.40 | $2.40 | 1.0M | Ansehen → | |
Meta: Llama 3.1 70B Instruct ist ein KI-Modell für allgemeinem Dialog von Meta, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.4/Mio. Token, Ausgabe $0.4/Mio. Token. (Offizielle Beschreibung: Meta's latest class of model (Llama 3.1) launched with a variety of sizes & flavors.) | Meta | $0.40 | $0.40 | 131K | Ansehen → | |
MiniMax: MiniMax M1 ist ein KI-Modell für allgemeinem Dialog von MiniMax, mit schneller Antwortzeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.4/Mio. Token, Ausgabe $2.2/Mio. Token. (Offizielle Beschreibung: MiniMax-M1 is a large-scale, open-weight reasoning model designed for extended context and high-efficiency inference.) | MiniMax | $0.40 | $2.20 | 1.0M | Ansehen → | |
Mistral: Devstral 2 2512 ist ein KI-Modell für allgemeinem Dialog von Mistral AI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.4/Mio. Token, Ausgabe $2/Mio. Token. (Offizielle Beschreibung: Devstral 2 is a state-of-the-art open-source model by Mistral AI specializing in agentic coding.) | Mistral AI | $0.40 | $2.00 | 262K | Ansehen → | |
Mistral: Devstral Medium ist ein KI-Modell für allgemeinem Dialog von Mistral AI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.4/Mio. Token, Ausgabe $2/Mio. Token. (Offizielle Beschreibung: Devstral Medium is a high-performance code generation and agentic reasoning model developed jointly by Mistral AI and All Hands AI.) | Mistral AI | $0.40 | $2.00 | 131K | Ansehen → | |
Mistral: Mistral Medium 3 ist ein KI-Modell für allgemeinem Dialog von Mistral AI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.4/Mio. Token, Ausgabe $2/Mio. Token. (Offizielle Beschreibung: Mistral Medium 3 is a high-performance enterprise-grade language model designed to deliver frontier-level capabilities at significantly reduced operational cost.) | Mistral AI | $0.40 | $2.00 | 131K | Ansehen → | |
Mistral: Mistral Medium 3.1 ist ein KI-Modell für allgemeinem Dialog von Mistral AI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.4/Mio. Token, Ausgabe $2/Mio. Token. (Offizielle Beschreibung: Mistral Medium 3.1 is an updated version of Mistral Medium 3, which is a high-performance enterprise-grade language model designed to deliver frontier-level capabilities at significantly reduced operational cost.) | Mistral AI | $0.40 | $2.00 | 131K | Ansehen → | |
MoonshotAI: Kimi K2 0905 ist ein KI-Modell für allgemeinem Dialog von Moonshotai, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.4/Mio. Token, Ausgabe $2/Mio. Token. (Offizielle Beschreibung: Kimi K2 0905 is the September update of Kimi K2 0711.) | Moonshotai | $0.40 | $2.00 | 262K | Ansehen → | |
MoonshotAI: Kimi K2.5 ist ein KI-Modell für allgemeinem Dialog von Moonshotai, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.4/Mio. Token, Ausgabe $1.98/Mio. Token. (Offizielle Beschreibung: Kimi K2.5 is Moonshot AI's native multimodal model, delivering state-of-the-art visual coding capability and a self-directed agent swarm paradigm.) | Moonshotai | $0.40 | $1.98 | 262K | Ansehen → | |
OpenAI: GPT-4.1 Mini ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit schneller Antwortzeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.4/Mio. Token, Ausgabe $1.6/Mio. Token. (Offizielle Beschreibung: GPT-4.1 Mini is a mid-sized model delivering performance competitive with GPT-4o at substantially lower latency and cost.) | OpenAI | $0.40 | $1.60 | 1.0M | Ansehen → | |
TheDrummer: UnslopNemo 12B ist ein KI-Modell für allgemeinem Dialog von TheDrummer, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 33K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.4/Mio. Token, Ausgabe $0.4/Mio. Token. (Offizielle Beschreibung: UnslopNemo v4.1 is the latest addition from the creator of Rocinante, designed for adventure writing and role-play scenarios.) | TheDrummer | $0.40 | $0.40 | 33K | Ansehen → | |
Xiaomi: MiMo-V2-Omni ist ein KI-Modell für allgemeinem Dialog von Xiaomi, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.4/Mio. Token, Ausgabe $2/Mio. Token. (Offizielle Beschreibung: MiMo-V2-Omni is a frontier omni-modal model that natively processes image, video, and audio inputs within a unified architecture.) | Xiaomi | $0.40 | $2.00 | 262K | Ansehen → | |
Xiaomi: MiMo-V2.5 ist ein KI-Modell für allgemeinem Dialog von Xiaomi, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.4/Mio. Token, Ausgabe $2/Mio. Token. (Offizielle Beschreibung: MiMo-V2.5 is a native omnimodal model by Xiaomi.) | Xiaomi | $0.40 | $2.00 | 1.0M | Ansehen → | |
Z.ai: GLM 4.7 ist ein KI-Modell für allgemeinem Dialog von Z-ai, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 203K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.4/Mio. Token, Ausgabe $1.75/Mio. Token. (Offizielle Beschreibung: GLM-4.7 is Z.ai’s latest flagship model, featuring upgrades in two key areas: enhanced programming capabilities and more stable multi-step reasoning/execution.) | Z-ai | $0.40 | $1.75 | 203K | Ansehen → | |
Baidu: ERNIE 4.5 VL 424B A47B ist ein KI-Modell für allgemeinem Dialog von Baidu, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 123K Token. Fähigkeiten: Bildanalyse, API-Zugang. Preis: Eingabe $0.42/Mio. Token, Ausgabe $1.25/Mio. Token. (Offizielle Beschreibung: ERNIE-4.5-VL-424B-A47B is a multimodal Mixture-of-Experts (MoE) model from Baidu’s ERNIE 4.5 series, featuring 424B total parameters with 47B active per token.) | Baidu | $0.42 | $1.25 | 123K | Ansehen → | |
DeepSeek: DeepSeek V4 Pro ist ein KI-Modell für allgemeinem Dialog von DeepSeek, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.435/Mio. Token, Ausgabe $0.87/Mio. Token. (Offizielle Beschreibung: DeepSeek V4 Pro is a large-scale Mixture-of-Experts model from DeepSeek with 1.6T total parameters and 49B activated parameters, supporting a 1M-token context window.) | DeepSeek | $0.435 | $0.87 | 1.0M | Ansehen → | |
ReMM SLERP 13B ist ein KI-Modell für allgemeinem Dialog von Undi95, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 6K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.45/Mio. Token, Ausgabe $0.65/Mio. Token. (Offizielle Beschreibung: A recreation trial of the original MythoMax-L2-B13 but with updated models.) | Undi95 | $0.45 | $0.65 | 6K | Ansehen → | |
Qwen: Qwen3 235B A22B ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.455/Mio. Token, Ausgabe $1.82/Mio. Token. (Offizielle Beschreibung: Qwen3-235B-A22B is a 235B parameter mixture-of-experts (MoE) model developed by Qwen, activating 22B parameters per forward pass.) | Alibaba | $0.455 | $1.82 | 131K | Ansehen → | |
Llama Guard 3 8B ist ein KI-Modell für allgemeinem Dialog von Meta, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.48/Mio. Token, Ausgabe $0.03/Mio. Token. (Offizielle Beschreibung: Llama Guard 3 is a Llama-3.1-8B pretrained model, fine-tuned for content safety classification.) | Meta | $0.48 | $0.03 | 131K | Ansehen → | |
Google: Gemini 3 Flash Preview ist ein KI-Modell für allgemeinem Dialog von Google, mit schneller Antwortzeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.5/Mio. Token, Ausgabe $3/Mio. Token. (Offizielle Beschreibung: Gemini 3 Flash Preview is a high speed, high value thinking model designed for agentic workflows, multi turn chat, and coding assistance.) | $0.50 | $3.00 | 1.0M | Ansehen → | ||
Mistral: Mistral Large 3 2512 ist ein KI-Modell für allgemeinem Dialog von Mistral AI, mit langsamer, aber leistungsstarker Verarbeitung. Kontextfenster bis zu 262K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.5/Mio. Token, Ausgabe $1.5/Mio. Token. (Offizielle Beschreibung: Mistral Large 3 2512 is Mistral’s most capable model to date, featuring a sparse mixture-of-experts architecture with 41B active parameters (675B total), and released under the Apache 2.0 license.) | Mistral AI | $0.50 | $1.50 | 262K | Ansehen → | |
OpenAI: GPT-3.5 Turbo ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit schneller Antwortzeit. Kontextfenster bis zu 16K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.5/Mio. Token, Ausgabe $1.5/Mio. Token. (Offizielle Beschreibung: GPT-3.5 Turbo is OpenAI's fastest model.) | OpenAI | $0.50 | $1.50 | 16K | Ansehen → | |
Google Gemini Flash Latest ist ein KI-Modell für allgemeinem Dialog von ~google, mit schneller Antwortzeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.5/Mio. Token, Ausgabe $3/Mio. Token. (Offizielle Beschreibung: This model always redirects to the latest model in the Google Gemini Flash family.) | $0.50 | $3.00 | 1.0M | Ansehen → | ||
Meta: Llama 3 70B Instruct ist ein KI-Modell für allgemeinem Dialog von Meta, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 8K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.51/Mio. Token, Ausgabe $0.74/Mio. Token. (Offizielle Beschreibung: Meta's latest class of model (Llama 3) launched with a variety of sizes & flavors.) | Meta | $0.51 | $0.74 | 8K | Ansehen → | |
Qwen: Qwen VL Max ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.52/Mio. Token, Ausgabe $2.08/Mio. Token. (Offizielle Beschreibung: Qwen VL Max is a visual understanding model with 7500 tokens context length.) | Alibaba | $0.52 | $2.08 | 131K | Ansehen → | |
TheDrummer: Skyfall 36B V2 ist ein KI-Modell für allgemeinem Dialog von TheDrummer, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 33K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.55/Mio. Token, Ausgabe $0.8/Mio. Token. (Offizielle Beschreibung: Skyfall 36B v2 is an enhanced iteration of Mistral Small 2501, specifically fine-tuned for improved creativity, nuanced writing, role-playing, and coherent storytelling.) | TheDrummer | $0.55 | $0.80 | 33K | Ansehen → | |
MoonshotAI: Kimi K2 0711 ist ein KI-Modell für allgemeinem Dialog von Moonshotai, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.57/Mio. Token, Ausgabe $2.3/Mio. Token. (Offizielle Beschreibung: Kimi K2 Instruct is a large-scale Mixture-of-Experts (MoE) language model developed by Moonshot AI, featuring 1 trillion total parameters with 32 billion active per forward pass.) | Moonshotai | $0.57 | $2.30 | 131K | Ansehen → | |
OpenAI: GPT Audio Mini ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit schneller Antwortzeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.6/Mio. Token, Ausgabe $2.4/Mio. Token. (Offizielle Beschreibung: A cost-efficient version of GPT Audio.) | OpenAI | $0.60 | $2.40 | 128K | Ansehen → | |
Writer: Palmyra X5 ist ein KI-Modell für allgemeinem Dialog von Writer, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.6/Mio. Token, Ausgabe $6/Mio. Token. (Offizielle Beschreibung: Palmyra X5 is Writer's most advanced model, purpose-built for building and scaling AI agents across the enterprise.) | Writer | $0.60 | $6.00 | 1.0M | Ansehen → | |
Z.ai: GLM 4.5 ist ein KI-Modell für allgemeinem Dialog von Z-ai, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.6/Mio. Token, Ausgabe $2.2/Mio. Token. (Offizielle Beschreibung: GLM-4.5 is our latest flagship foundation model, purpose-built for agent-based applications.) | Z-ai | $0.60 | $2.20 | 131K | Ansehen → | |
Z.ai: GLM 4.5V ist ein KI-Modell für allgemeinem Dialog von Z-ai, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 66K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.6/Mio. Token, Ausgabe $1.8/Mio. Token. (Offizielle Beschreibung: GLM-4.5V is a vision-language foundation model for multimodal agent applications.) | Z-ai | $0.60 | $1.80 | 66K | Ansehen → | |
Z.ai: GLM 5 ist ein KI-Modell für allgemeinem Dialog von Z-ai, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 203K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.6/Mio. Token, Ausgabe $1.92/Mio. Token. (Offizielle Beschreibung: GLM-5 is Z.ai’s flagship open-source foundation model engineered for complex systems design and long-horizon agent workflows.) | Z-ai | $0.60 | $1.92 | 203K | Ansehen → | |
WizardLM-2 8x22B ist ein KI-Modell für allgemeinem Dialog von Microsoft, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 66K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.62/Mio. Token, Ausgabe $0.62/Mio. Token. (Offizielle Beschreibung: WizardLM-2 8x22B is Microsoft AI's most advanced Wizard model.) | Microsoft | $0.62 | $0.62 | 66K | Ansehen → | |
Google: Gemma 2 27B ist ein KI-Modell für allgemeinem Dialog von Google, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 8K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.65/Mio. Token, Ausgabe $0.65/Mio. Token. (Offizielle Beschreibung: Gemma 2 27B by Google is an open model built from the same research and technology used to create the Gemini models.) | $0.65 | $0.65 | 8K | Ansehen → | ||
Sao10K: Llama 3.3 Euryale 70B ist ein KI-Modell für allgemeinem Dialog von Sao10K, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.65/Mio. Token, Ausgabe $0.75/Mio. Token. (Offizielle Beschreibung: Euryale L3.3 70B is a model focused on creative roleplay from Sao10k.) | Sao10K | $0.65 | $0.75 | 131K | Ansehen → | |
AionLabs: Aion-1.0-Mini ist ein KI-Modell für allgemeinem Dialog von Aion-labs, mit schneller Antwortzeit. Kontextfenster bis zu 131K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.7/Mio. Token, Ausgabe $1.4/Mio. Token. (Offizielle Beschreibung: Aion-1.0-Mini 32B parameter model is a distilled version of the DeepSeek-R1 model, designed for strong performance in reasoning domains such as mathematics, coding, and logic.) | Aion-labs | $0.70 | $1.40 | 131K | Ansehen → | |
MoonshotAI: Kimi K2.6 ist ein KI-Modell für allgemeinem Dialog von Moonshotai, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 33K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.74/Mio. Token, Ausgabe $3.5/Mio. Token. (Offizielle Beschreibung: Kimi K2.6 is Moonshot AI's next-generation multimodal model, designed for long-horizon coding, coding-driven UI/UX generation, and multi-agent orchestration.) | Moonshotai | $0.74 | $3.50 | 33K | Ansehen → | |
MoonshotAI Kimi Latest ist ein KI-Modell für allgemeinem Dialog von ~moonshotai, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 33K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.74/Mio. Token, Ausgabe $3.5/Mio. Token. (Offizielle Beschreibung: This model always redirects to the latest model in the MoonshotAI Kimi family.) | ~moonshotai | $0.74 | $3.50 | 33K | Ansehen → | |
Arcee AI: Virtuoso Large ist ein KI-Modell für allgemeinem Dialog von Arcee-ai, mit langsamer, aber leistungsstarker Verarbeitung. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.75/Mio. Token, Ausgabe $1.2/Mio. Token. (Offizielle Beschreibung: Virtuoso‑Large is Arcee's top‑tier general‑purpose LLM at 72 B parameters, tuned to tackle cross‑domain reasoning, creative writing and enterprise QA.) | Arcee-ai | $0.75 | $1.20 | 131K | Ansehen → | |
Mancer: Weaver (alpha) ist ein KI-Modell für allgemeinem Dialog von Mancer, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 8K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.75/Mio. Token, Ausgabe $1/Mio. Token. (Offizielle Beschreibung: An attempt to recreate Claude-style verbosity, but don't expect the same level of coherence or memory.) | Mancer | $0.75 | $1.00 | 8K | Ansehen → | |
OpenAI: GPT-5.4 Mini ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit schneller Antwortzeit. Kontextfenster bis zu 400K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.75/Mio. Token, Ausgabe $4.5/Mio. Token. (Offizielle Beschreibung: GPT-5.4 mini brings the core capabilities of GPT-5.4 to a faster, more efficient model optimized for high-throughput workloads.) | OpenAI | $0.75 | $4.50 | 400K | Ansehen → | |
OpenAI GPT Mini Latest ist ein KI-Modell für allgemeinem Dialog von ~openai, mit schneller Antwortzeit. Kontextfenster bis zu 400K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.75/Mio. Token, Ausgabe $4.5/Mio. Token. (Offizielle Beschreibung: This model always redirects to the latest model in the OpenAI GPT Mini family.) | ~openai | $0.75 | $4.50 | 400K | Ansehen → | |
Qwen: Qwen3 Max ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.78/Mio. Token, Ausgabe $3.9/Mio. Token. (Offizielle Beschreibung: Qwen3-Max is an updated release built on the Qwen3 series, offering major improvements in reasoning, instruction following, multilingual support, and long-tail knowledge coverage compared to the January 2025 version.) | Alibaba | $0.78 | $3.90 | 262K | Ansehen → | |
Claude Haiku ist Anthropics schnellstes und kompaktestes Modell für nahezu sofortige Reaktionen. | Anthropic | $0.80 | $4.00 | 200K | Ansehen → | |
AionLabs: Aion-2.0 ist ein KI-Modell für allgemeinem Dialog von Aion-labs, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.8/Mio. Token, Ausgabe $1.6/Mio. Token. (Offizielle Beschreibung: Aion-2.0 is a variant of DeepSeek V3.2 optimized for immersive roleplaying and storytelling.) | Aion-labs | $0.80 | $1.60 | 131K | Ansehen → | |
AionLabs: Aion-RP 1.0 (8B) ist ein KI-Modell für allgemeinem Dialog von Aion-labs, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 33K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.8/Mio. Token, Ausgabe $1.6/Mio. Token. (Offizielle Beschreibung: Aion-RP-Llama-3.1-8B ranks the highest in the character evaluation portion of the RPBench-Auto benchmark, a roleplaying-specific variant of Arena-Hard-Auto, where LLMs evaluate each other’s responses.) | Aion-labs | $0.80 | $1.60 | 33K | Ansehen → | |
AlfredPros: CodeLLaMa 7B Instruct Solidity ist ein KI-Modell für allgemeinem Dialog von Alfredpros, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 4K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.8/Mio. Token, Ausgabe $1.2/Mio. Token. (Offizielle Beschreibung: A finetuned 7 billion parameters Code LLaMA - Instruct model to generate Solidity smart contract using 4-bit QLoRA finetuning provided by PEFT library.) | Alfredpros | $0.80 | $1.20 | 4K | Ansehen → | |
Amazon: Nova Pro 1.0 ist ein KI-Modell für allgemeinem Dialog von Amazon, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 300K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.8/Mio. Token, Ausgabe $3.2/Mio. Token. (Offizielle Beschreibung: Amazon Nova Pro 1.0 is a capable multimodal model from Amazon focused on providing a combination of accuracy, speed, and cost for a wide range of tasks.) | Amazon | $0.80 | $3.20 | 300K | Ansehen → | |
Anthropic: Claude 3.5 Haiku ist ein KI-Modell für allgemeinem Dialog von Anthropic, mit schneller Antwortzeit. Kontextfenster bis zu 200K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.8/Mio. Token, Ausgabe $4/Mio. Token. (Offizielle Beschreibung: Claude 3.5 Haiku features offers enhanced capabilities in speed, coding accuracy, and tool use.) | Anthropic | $0.80 | $4.00 | 200K | Ansehen → | |
Morph: Morph V3 Fast ist ein KI-Modell für allgemeinem Dialog von Morph, mit schneller Antwortzeit. Kontextfenster bis zu 82K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.8/Mio. Token, Ausgabe $1.2/Mio. Token. (Offizielle Beschreibung: Morph's fastest apply model for code edits.) | Morph | $0.80 | $1.20 | 82K | Ansehen → | |
Relace: Relace Apply 3 ist ein KI-Modell für allgemeinem Dialog von Relace, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 256K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.85/Mio. Token, Ausgabe $1.25/Mio. Token. (Offizielle Beschreibung: Relace Apply 3 is a specialized code-patching LLM that merges AI-suggested edits straight into your source files.) | Relace | $0.85 | $1.25 | 256K | Ansehen → | |
Sao10K: Llama 3.1 Euryale 70B v2.2 ist ein KI-Modell für allgemeinem Dialog von Sao10K, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.85/Mio. Token, Ausgabe $0.85/Mio. Token. (Offizielle Beschreibung: Euryale L3.1 70B v2.2 is a model focused on creative roleplay from Sao10k.) | Sao10K | $0.85 | $0.85 | 131K | Ansehen → | |
Switchpoint Router ist ein KI-Modell für allgemeinem Dialog von Switchpoint, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.85/Mio. Token, Ausgabe $3.4/Mio. Token. (Offizielle Beschreibung: Switchpoint AI's router instantly analyzes your request and directs it to the optimal AI from an ever-evolving library.) | Switchpoint | $0.85 | $3.40 | 131K | Ansehen → | |
Arcee AI: Maestro Reasoning ist ein KI-Modell für allgemeinem Dialog von Arcee-ai, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.9/Mio. Token, Ausgabe $3.3/Mio. Token. (Offizielle Beschreibung: Maestro Reasoning is Arcee's flagship analysis model: a 32 B‑parameter derivative of Qwen 2.5‑32 B tuned with DPO and chain‑of‑thought RL for step‑by‑step logic.) | Arcee-ai | $0.90 | $3.30 | 131K | Ansehen → | |
Morph: Morph V3 Large ist ein KI-Modell für allgemeinem Dialog von Morph, mit langsamer, aber leistungsstarker Verarbeitung. Kontextfenster bis zu 262K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $0.9/Mio. Token, Ausgabe $1.9/Mio. Token. (Offizielle Beschreibung: Morph's high-accuracy apply model for complex code edits.) | Morph | $0.90 | $1.90 | 262K | Ansehen → | |
Z.ai: GLM 5.1 ist ein KI-Modell für allgemeinem Dialog von Z-ai, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 203K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $0.98/Mio. Token, Ausgabe $3.08/Mio. Token. (Offizielle Beschreibung: GLM-5.1 delivers a major leap in coding capability, with particularly significant gains in handling long-horizon tasks.) | Z-ai | $0.98 | $3.08 | 203K | Ansehen → | |
Nous: Hermes 3 405B Instruct ist ein KI-Modell für allgemeinem Dialog von Nous Research, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $1/Mio. Token, Ausgabe $1/Mio. Token. (Offizielle Beschreibung: Hermes 3 is a generalist language model with many improvements over Hermes 2, including advanced agentic capabilities, much better roleplaying, reasoning, multi-turn conversation, long context coherence, and improvements across the) | Nous Research | $1.00 | $1.00 | 131K | Ansehen → | |
Nous: Hermes 4 405B ist ein KI-Modell für allgemeinem Dialog von Nous Research, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $1/Mio. Token, Ausgabe $3/Mio. Token. (Offizielle Beschreibung: Hermes 4 is a large-scale reasoning model built on Meta-Llama-3.1-405B and released by Nous Research.) | Nous Research | $1.00 | $3.00 | 131K | Ansehen → | |
OpenAI: GPT-3.5 Turbo (older v0613) ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit schneller Antwortzeit. Kontextfenster bis zu 4K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $1/Mio. Token, Ausgabe $2/Mio. Token. (Offizielle Beschreibung: GPT-3.5 Turbo is OpenAI's fastest model.) | OpenAI | $1.00 | $2.00 | 4K | Ansehen → | |
Perplexity: Sonar ist ein KI-Modell für allgemeinem Dialog von Perplexity, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 127K Token. Fähigkeiten: Bildanalyse, API-Zugang. Preis: Eingabe $1/Mio. Token, Ausgabe $1/Mio. Token. (Offizielle Beschreibung: Sonar is lightweight, affordable, fast, and simple to use — now featuring citations and the ability to customize sources.) | Perplexity | $1.00 | $1.00 | 127K | Ansehen → | |
Relace: Relace Search ist ein KI-Modell für allgemeinem Dialog von Relace, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 256K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $1/Mio. Token, Ausgabe $3/Mio. Token. (Offizielle Beschreibung: The relace-search model uses 4-12 `view_file` and `grep` tools in parallel to explore a codebase and return relevant files to the user request.) | Relace | $1.00 | $3.00 | 256K | Ansehen → | |
Xiaomi: MiMo-V2-Pro ist ein KI-Modell für allgemeinem Dialog von Xiaomi, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $1/Mio. Token, Ausgabe $3/Mio. Token. (Offizielle Beschreibung: MiMo-V2-Pro is Xiaomi's flagship foundation model, featuring over 1T total parameters and a 1M context length, deeply optimized for agentic scenarios.) | Xiaomi | $1.00 | $3.00 | 1.0M | Ansehen → | |
Xiaomi: MiMo-V2.5-Pro ist ein KI-Modell für allgemeinem Dialog von Xiaomi, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $1/Mio. Token, Ausgabe $3/Mio. Token. (Offizielle Beschreibung: MiMo-V2.5-Pro is Xiaomi’s flagship model, delivering strong performance in general agentic capabilities, complex software engineering, and long-horizon tasks, with top rankings on benchmarks such as ClawEval, GDPVal, and SWE-bench Pro) | Xiaomi | $1.00 | $3.00 | 1.0M | Ansehen → | |
Anthropic Claude Haiku Latest ist ein KI-Modell für allgemeinem Dialog von ~anthropic, mit schneller Antwortzeit. Kontextfenster bis zu 200K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $1/Mio. Token, Ausgabe $5/Mio. Token. (Offizielle Beschreibung: This model always redirects to the latest model in the Anthropic Claude Haiku family.) | ~anthropic | $1.00 | $5.00 | 200K | Ansehen → | |
Qwen: Qwen-Max ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 33K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $1.04/Mio. Token, Ausgabe $4.16/Mio. Token. (Offizielle Beschreibung: Qwen-Max, based on Qwen2.5, provides the best inference performance among Qwen models, especially for complex multi-step tasks.) | Alibaba | $1.04 | $4.16 | 33K | Ansehen → | |
Qwen: Qwen3.6 Max Preview ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $1.04/Mio. Token, Ausgabe $6.24/Mio. Token. (Offizielle Beschreibung: Qwen3.6-Max-Preview is a proprietary frontier model from Alibaba Cloud built on a sparse mixture-of-experts architecture with approximately 1 trillion total parameters.) | Alibaba | $1.04 | $6.24 | 262K | Ansehen → | |
Z.ai: GLM 5 Turbo ist ein KI-Modell für allgemeinem Dialog von Z-ai, mit schneller Antwortzeit. Kontextfenster bis zu 203K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $1.2/Mio. Token, Ausgabe $4/Mio. Token. (Offizielle Beschreibung: GLM-5 Turbo is a new model from Z.ai designed for fast inference and strong performance in agent-driven environments such as OpenClaw scenarios.) | Z-ai | $1.20 | $4.00 | 203K | Ansehen → | |
Z.ai: GLM 5V Turbo ist ein KI-Modell für allgemeinem Dialog von Z-ai, mit schneller Antwortzeit. Kontextfenster bis zu 203K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $1.2/Mio. Token, Ausgabe $4/Mio. Token. (Offizielle Beschreibung: GLM-5V-Turbo is Z.ai’s first native multimodal agent foundation model, built for vision-based coding and agent-driven tasks.) | Z-ai | $1.20 | $4.00 | 203K | Ansehen → | |
Deep Cogito: Cogito v2.1 671B ist ein KI-Modell für allgemeinem Dialog von Deepcogito, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 128K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $1.25/Mio. Token, Ausgabe $1.25/Mio. Token. (Offizielle Beschreibung: Cogito v2.1 671B MoE represents one of the strongest open models globally, matching performance of frontier closed and open models.) | Deepcogito | $1.25 | $1.25 | 128K | Ansehen → | |
Google: Gemini 2.5 Pro ist ein KI-Modell für allgemeinem Dialog von Google, mit schneller Antwortzeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $1.25/Mio. Token, Ausgabe $10/Mio. Token. (Offizielle Beschreibung: Gemini 2.5 Pro is Google’s state-of-the-art AI model designed for advanced reasoning, coding, mathematics, and scientific tasks.) | $1.25 | $10.00 | 1.0M | Ansehen → | ||
Google: Gemini 2.5 Pro Preview 05-06 ist ein KI-Modell für allgemeinem Dialog von Google, mit schneller Antwortzeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $1.25/Mio. Token, Ausgabe $10/Mio. Token. (Offizielle Beschreibung: Gemini 2.5 Pro is Google’s state-of-the-art AI model designed for advanced reasoning, coding, mathematics, and scientific tasks.) | $1.25 | $10.00 | 1.0M | Ansehen → | ||
Google: Gemini 2.5 Pro Preview 06-05 ist ein KI-Modell für allgemeinem Dialog von Google, mit schneller Antwortzeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $1.25/Mio. Token, Ausgabe $10/Mio. Token. (Offizielle Beschreibung: Gemini 2.5 Pro is Google’s state-of-the-art AI model designed for advanced reasoning, coding, mathematics, and scientific tasks.) | $1.25 | $10.00 | 1.0M | Ansehen → | ||
OpenAI: GPT-5 Chat ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Bildanalyse, API-Zugang. Preis: Eingabe $1.25/Mio. Token, Ausgabe $10/Mio. Token. (Offizielle Beschreibung: GPT-5 Chat is designed for advanced, natural, multimodal, and context-aware conversations for enterprise applications.) | OpenAI | $1.25 | $10.00 | 128K | Ansehen → | |
OpenAI: GPT-5 Codex ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 400K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $1.25/Mio. Token, Ausgabe $10/Mio. Token. (Offizielle Beschreibung: GPT-5-Codex is a specialized version of GPT-5 optimized for software engineering and coding workflows.) | OpenAI | $1.25 | $10.00 | 400K | Ansehen → | |
OpenAI: GPT-5.1 ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 400K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $1.25/Mio. Token, Ausgabe $10/Mio. Token. (Offizielle Beschreibung: GPT-5.1 is the latest frontier-grade model in the GPT-5 series, offering stronger general-purpose reasoning, improved instruction adherence, and a more natural conversational style compared to GPT-5.) | OpenAI | $1.25 | $10.00 | 400K | Ansehen → | |
OpenAI: GPT-5.1 Chat ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $1.25/Mio. Token, Ausgabe $10/Mio. Token. (Offizielle Beschreibung: GPT-5.1 Chat (AKA Instant is the fast, lightweight member of the 5.1 family, optimized for low-latency chat while retaining strong general intelligence.) | OpenAI | $1.25 | $10.00 | 128K | Ansehen → | |
OpenAI: GPT-5.1-Codex ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 400K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $1.25/Mio. Token, Ausgabe $10/Mio. Token. (Offizielle Beschreibung: GPT-5.1-Codex is a specialized version of GPT-5.1 optimized for software engineering and coding workflows.) | OpenAI | $1.25 | $10.00 | 400K | Ansehen → | |
OpenAI: GPT-5.1-Codex-Max ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 400K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $1.25/Mio. Token, Ausgabe $10/Mio. Token. (Offizielle Beschreibung: GPT-5.1-Codex-Max is OpenAI’s latest agentic coding model, designed for long-running, high-context software development tasks.) | OpenAI | $1.25 | $10.00 | 400K | Ansehen → | |
xAI: Grok 4.20 ist ein KI-Modell für allgemeinem Dialog von xAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 2 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $1.25/Mio. Token, Ausgabe $2.5/Mio. Token. (Offizielle Beschreibung: Grok 4.20 is a reasoning model from xAI with industry-leading speed and agentic tool calling capabilities.) | xAI | $1.25 | $2.50 | 2.0M | Ansehen → | |
xAI: Grok 4.3 ist ein KI-Modell für allgemeinem Dialog von xAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $1.25/Mio. Token, Ausgabe $2.5/Mio. Token. (Offizielle Beschreibung: Grok 4.3 is a reasoning model from xAI.) | xAI | $1.25 | $2.50 | 1.0M | Ansehen → | |
Sao10k: Llama 3 Euryale 70B v2.1 ist ein KI-Modell für allgemeinem Dialog von Sao10K, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 8K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $1.48/Mio. Token, Ausgabe $1.48/Mio. Token. (Offizielle Beschreibung: Euryale 70B v2.1 is a model focused on creative roleplay from Sao10k.) | Sao10K | $1.48 | $1.48 | 8K | Ansehen → | |
Mistral: Mistral Medium 3.5 ist ein KI-Modell für allgemeinem Dialog von Mistral AI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $1.5/Mio. Token, Ausgabe $7.5/Mio. Token. (Offizielle Beschreibung: Mistral Medium 3.5 is a dense 128B instruction-following model from Mistral AI.) | Mistral AI | $1.50 | $7.50 | 262K | Ansehen → | |
OpenAI: GPT-3.5 Turbo Instruct ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit schneller Antwortzeit. Kontextfenster bis zu 4K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $1.5/Mio. Token, Ausgabe $2/Mio. Token. (Offizielle Beschreibung: This model is a variant of GPT-3.5 Turbo tuned for instructional prompts and omitting chat-related optimizations.) | OpenAI | $1.50 | $2.00 | 4K | Ansehen → | |
OpenAI: GPT-5.2 ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 400K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $1.75/Mio. Token, Ausgabe $14/Mio. Token. (Offizielle Beschreibung: GPT-5.2 is the latest frontier-grade model in the GPT-5 series, offering stronger agentic and long context perfomance compared to GPT-5.1.) | OpenAI | $1.75 | $14.00 | 400K | Ansehen → | |
OpenAI: GPT-5.2 Chat ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $1.75/Mio. Token, Ausgabe $14/Mio. Token. (Offizielle Beschreibung: GPT-5.2 Chat (AKA Instant) is the fast, lightweight member of the 5.2 family, optimized for low-latency chat while retaining strong general intelligence.) | OpenAI | $1.75 | $14.00 | 128K | Ansehen → | |
OpenAI: GPT-5.2-Codex ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 400K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $1.75/Mio. Token, Ausgabe $14/Mio. Token. (Offizielle Beschreibung: GPT-5.2-Codex is an upgraded version of GPT-5.1-Codex optimized for software engineering and coding workflows.) | OpenAI | $1.75 | $14.00 | 400K | Ansehen → | |
OpenAI: GPT-5.3 Chat ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $1.75/Mio. Token, Ausgabe $14/Mio. Token. (Offizielle Beschreibung: GPT-5.3 Chat is an update to ChatGPT's most-used model that makes everyday conversations smoother, more useful, and more directly helpful.) | OpenAI | $1.75 | $14.00 | 128K | Ansehen → | |
OpenAI: GPT-5.3-Codex ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 400K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $1.75/Mio. Token, Ausgabe $14/Mio. Token. (Offizielle Beschreibung: GPT-5.3-Codex is OpenAI’s most advanced agentic coding model, combining the frontier software engineering performance of GPT-5.2-Codex with the broader reasoning and professional knowledge capabilities of GPT-5.2.) | OpenAI | $1.75 | $14.00 | 400K | Ansehen → | |
GPT-4.1最新 GPT-4.1 ist OpenAIs neueste Generation mit einer Million Token Kontext und verbesserter Anweisungsfolge. | OpenAI | $2.00 | $8.00 | 1.0M | Ansehen → | |
AI21: Jamba Large 1.7 ist ein KI-Modell für allgemeinem Dialog von AI21 Labs, mit langsamer, aber leistungsstarker Verarbeitung. Kontextfenster bis zu 256K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $2/Mio. Token, Ausgabe $8/Mio. Token. (Offizielle Beschreibung: Jamba Large 1.7 is the latest model in the Jamba open family, offering improvements in grounding, instruction-following, and overall efficiency.) | AI21 Labs | $2.00 | $8.00 | 256K | Ansehen → | |
Google: Gemini 3.1 Pro Preview ist ein KI-Modell für allgemeinem Dialog von Google, mit schneller Antwortzeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $2/Mio. Token, Ausgabe $12/Mio. Token. (Offizielle Beschreibung: Gemini 3.1 Pro Preview is Google’s frontier reasoning model, delivering enhanced software engineering performance, improved agentic reliability, and more efficient token usage across complex workflows.) | $2.00 | $12.00 | 1.0M | Ansehen → | ||
Google: Gemini 3.1 Pro Preview Custom Tools ist ein KI-Modell für allgemeinem Dialog von Google, mit schneller Antwortzeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $2/Mio. Token, Ausgabe $12/Mio. Token. (Offizielle Beschreibung: Gemini 3.1 Pro Preview Custom Tools is a variant of Gemini 3.1 Pro that improves tool selection behavior by preventing overuse of a general bash tool when more efficient third-party) | $2.00 | $12.00 | 1.0M | Ansehen → | ||
Mistral Large ist ein KI-Modell für allgemeinem Dialog von Mistral AI, mit langsamer, aber leistungsstarker Verarbeitung. Kontextfenster bis zu 128K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $2/Mio. Token, Ausgabe $6/Mio. Token. (Offizielle Beschreibung: This is Mistral AI's flagship model, Mistral Large 2 (version `mistral-large-2407`).) | Mistral AI | $2.00 | $6.00 | 128K | Ansehen → | |
Mistral Large 2407 ist ein KI-Modell für allgemeinem Dialog von Mistral AI, mit langsamer, aber leistungsstarker Verarbeitung. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $2/Mio. Token, Ausgabe $6/Mio. Token. (Offizielle Beschreibung: This is Mistral AI's flagship model, Mistral Large 2 (version mistral-large-2407).) | Mistral AI | $2.00 | $6.00 | 131K | Ansehen → | |
Mistral Large 2411 ist ein KI-Modell für allgemeinem Dialog von Mistral AI, mit langsamer, aber leistungsstarker Verarbeitung. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $2/Mio. Token, Ausgabe $6/Mio. Token. (Offizielle Beschreibung: Mistral Large 2 2411 is an update of Mistral Large 2 released together with Pixtral Large 2411 It provides a significant upgrade on the previous Mistral Large 24.07, with notable) | Mistral AI | $2.00 | $6.00 | 131K | Ansehen → | |
Mistral: Mixtral 8x22B Instruct ist ein KI-Modell für allgemeinem Dialog von Mistral AI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 66K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $2/Mio. Token, Ausgabe $6/Mio. Token. (Offizielle Beschreibung: Mistral's official instruct fine-tuned version of Mixtral 8x22B.) | Mistral AI | $2.00 | $6.00 | 66K | Ansehen → | |
Mistral: Pixtral Large 2411 ist ein KI-Modell für allgemeinem Dialog von Mistral AI, mit langsamer, aber leistungsstarker Verarbeitung. Kontextfenster bis zu 131K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $2/Mio. Token, Ausgabe $6/Mio. Token. (Offizielle Beschreibung: Pixtral Large is a 124B parameter, open-weight, multimodal model built on top of Mistral Large 2.) | Mistral AI | $2.00 | $6.00 | 131K | Ansehen → | |
OpenAI: GPT-4.1 ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $2/Mio. Token, Ausgabe $8/Mio. Token. (Offizielle Beschreibung: GPT-4.1 is a flagship large language model optimized for advanced instruction following, real-world software engineering, and long-context reasoning.) | OpenAI | $2.00 | $8.00 | 1.0M | Ansehen → | |
Perplexity: Sonar Deep Research ist ein KI-Modell für allgemeinem Dialog von Perplexity, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 128K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $2/Mio. Token, Ausgabe $8/Mio. Token. (Offizielle Beschreibung: Sonar Deep Research is a research-focused model designed for multi-step retrieval, synthesis, and reasoning across complex topics.) | Perplexity | $2.00 | $8.00 | 128K | Ansehen → | |
Perplexity: Sonar Reasoning Pro ist ein KI-Modell für allgemeinem Dialog von Perplexity, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Bildanalyse, API-Zugang. Preis: Eingabe $2/Mio. Token, Ausgabe $8/Mio. Token. (Offizielle Beschreibung: Note: Sonar Pro pricing includes Perplexity search pricing.) | Perplexity | $2.00 | $8.00 | 128K | Ansehen → | |
xAI: Grok 4.20 Multi-Agent ist ein KI-Modell für allgemeinem Dialog von xAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 2 Mio. Token. Fähigkeiten: Bildanalyse, API-Zugang. Preis: Eingabe $2/Mio. Token, Ausgabe $6/Mio. Token. (Offizielle Beschreibung: Grok 4.20 Multi-Agent is a variant of xAI’s Grok 4.20 designed for collaborative, agent-based workflows.) | xAI | $2.00 | $6.00 | 2.0M | Ansehen → | |
Google Gemini Pro Latest ist ein KI-Modell für allgemeinem Dialog von ~google, mit schneller Antwortzeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $2/Mio. Token, Ausgabe $12/Mio. Token. (Offizielle Beschreibung: This model always redirects to the latest model in the Google Gemini Pro family.) | $2.00 | $12.00 | 1.0M | Ansehen → | ||
Amazon: Nova Premier 1.0 ist ein KI-Modell für allgemeinem Dialog von Amazon, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $2.5/Mio. Token, Ausgabe $12.5/Mio. Token. (Offizielle Beschreibung: Amazon Nova Premier is the most capable of Amazon’s multimodal models for complex reasoning tasks and for use as the best teacher for distilling custom models.) | Amazon | $2.50 | $12.50 | 1.0M | Ansehen → | |
Cohere: Command A ist ein KI-Modell für allgemeinem Dialog von Cohere, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 256K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $2.5/Mio. Token, Ausgabe $10/Mio. Token. (Offizielle Beschreibung: Command A is an open-weights 111B parameter model with a 256k context window focused on delivering great performance across agentic, multilingual, and coding use cases.) | Cohere | $2.50 | $10.00 | 256K | Ansehen → | |
Cohere: Command R+ (08-2024) ist ein KI-Modell für allgemeinem Dialog von Cohere, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $2.5/Mio. Token, Ausgabe $10/Mio. Token. (Offizielle Beschreibung: command-r-plus-08-2024 is an update of the Command R+ with roughly 50% higher throughput and 25% lower latencies as compared to the previous Command R+ version, while keeping the hardware footprint) | Cohere | $2.50 | $10.00 | 128K | Ansehen → | |
Inflection: Inflection 3 Pi ist ein KI-Modell für allgemeinem Dialog von Inflection, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 8K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $2.5/Mio. Token, Ausgabe $10/Mio. Token. (Offizielle Beschreibung: Inflection 3 Pi powers Inflection's Pi chatbot, including backstory, emotional intelligence, productivity, and safety.) | Inflection | $2.50 | $10.00 | 8K | Ansehen → | |
Inflection: Inflection 3 Productivity ist ein KI-Modell für allgemeinem Dialog von Inflection, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 8K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $2.5/Mio. Token, Ausgabe $10/Mio. Token. (Offizielle Beschreibung: Inflection 3 Productivity is optimized for following instructions.) | Inflection | $2.50 | $10.00 | 8K | Ansehen → | |
OpenAI: GPT Audio ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $2.5/Mio. Token, Ausgabe $10/Mio. Token. (Offizielle Beschreibung: The gpt-audio model is OpenAI's first generally available audio model.) | OpenAI | $2.50 | $10.00 | 128K | Ansehen → | |
OpenAI: GPT-4o (2024-08-06) ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $2.5/Mio. Token, Ausgabe $10/Mio. Token. (Offizielle Beschreibung: The 2024-08-06 version of GPT-4o offers improved performance in structured outputs, with the ability to supply a JSON schema in the respone_format.) | OpenAI | $2.50 | $10.00 | 128K | Ansehen → | |
OpenAI: GPT-4o (2024-11-20) ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $2.5/Mio. Token, Ausgabe $10/Mio. Token. (Offizielle Beschreibung: The 2024-11-20 version of GPT-4o offers a leveled-up creative writing ability with more natural, engaging, and tailored writing to improve relevance & readability.) | OpenAI | $2.50 | $10.00 | 128K | Ansehen → | |
OpenAI: GPT-4o Audio ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $2.5/Mio. Token, Ausgabe $10/Mio. Token. (Offizielle Beschreibung: The gpt-4o-audio-preview model adds support for audio inputs as prompts.) | OpenAI | $2.50 | $10.00 | 128K | Ansehen → | |
OpenAI: GPT-4o Search Preview ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 128K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $2.5/Mio. Token, Ausgabe $10/Mio. Token. (Offizielle Beschreibung: GPT-4o Search Previewis a specialized model for web search in Chat Completions.) | OpenAI | $2.50 | $10.00 | 128K | Ansehen → | |
OpenAI: GPT-5.4 ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $2.5/Mio. Token, Ausgabe $15/Mio. Token. (Offizielle Beschreibung: GPT-5.4 is OpenAI’s latest frontier model, unifying the Codex and GPT lines into a single system.) | OpenAI | $2.50 | $15.00 | 1.1M | Ansehen → | |
Claude Sonnet bietet das beste Gleichgewicht zwischen Intelligenz und Geschwindigkeit für Hochdurchsatz-Aufgaben. | Anthropic | $3.00 | $15.00 | 200K | Ansehen → | |
Magnum v4 72B ist ein KI-Modell für allgemeinem Dialog von Anthracite-org, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 16K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $3/Mio. Token, Ausgabe $5/Mio. Token. (Offizielle Beschreibung: This is a series of models designed to replicate the prose quality of the Claude 3 models, specifically Sonnet(https://openrouter.ai/anthropic/claude-3.5-sonnet) and Opus(https://openrouter.ai/anthropic/claude-3-opus).) | Anthracite-org | $3.00 | $5.00 | 16K | Ansehen → | |
Anthropic: Claude Sonnet 4 ist ein KI-Modell für allgemeinem Dialog von Anthropic, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $3/Mio. Token, Ausgabe $15/Mio. Token. (Offizielle Beschreibung: Claude Sonnet 4 significantly enhances the capabilities of its predecessor, Sonnet 3.7, excelling in both coding and reasoning tasks with improved precision and controllability.) | Anthropic | $3.00 | $15.00 | 1.0M | Ansehen → | |
Anthropic: Claude Sonnet 4.5 ist ein KI-Modell für allgemeinem Dialog von Anthropic, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $3/Mio. Token, Ausgabe $15/Mio. Token. (Offizielle Beschreibung: Claude Sonnet 4.5 is Anthropic’s most advanced Sonnet model to date, optimized for real-world agents and coding workflows.) | Anthropic | $3.00 | $15.00 | 1.0M | Ansehen → | |
OpenAI: GPT-3.5 Turbo 16k ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit schneller Antwortzeit. Kontextfenster bis zu 16K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $3/Mio. Token, Ausgabe $4/Mio. Token. (Offizielle Beschreibung: This model offers four times the context length of gpt-3.5-turbo, allowing it to support approximately 20 pages of text in a single request at a higher cost.) | OpenAI | $3.00 | $4.00 | 16K | Ansehen → | |
Perplexity: Sonar Pro ist ein KI-Modell für allgemeinem Dialog von Perplexity, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 200K Token. Fähigkeiten: Bildanalyse, API-Zugang. Preis: Eingabe $3/Mio. Token, Ausgabe $15/Mio. Token. (Offizielle Beschreibung: Note: Sonar Pro pricing includes Perplexity search pricing.) | Perplexity | $3.00 | $15.00 | 200K | Ansehen → | |
Perplexity: Sonar Pro Search ist ein KI-Modell für allgemeinem Dialog von Perplexity, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 200K Token. Fähigkeiten: Bildanalyse, API-Zugang. Preis: Eingabe $3/Mio. Token, Ausgabe $15/Mio. Token. (Offizielle Beschreibung: Exclusively available on the OpenRouter API, Sonar Pro's new Pro Search mode is Perplexity's most advanced agentic search system.) | Perplexity | $3.00 | $15.00 | 200K | Ansehen → | |
Sao10K: Llama 3.1 70B Hanami x1 ist ein KI-Modell für allgemeinem Dialog von Sao10K, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 16K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $3/Mio. Token, Ausgabe $3/Mio. Token. (Offizielle Beschreibung: This is Sao10K's experiment over Euryale v2.2.) | Sao10K | $3.00 | $3.00 | 16K | Ansehen → | |
xAI: Grok 3 ist ein KI-Modell für allgemeinem Dialog von xAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $3/Mio. Token, Ausgabe $15/Mio. Token. (Offizielle Beschreibung: Grok 3 is the latest model from xAI.) | xAI | $3.00 | $15.00 | 131K | Ansehen → | |
xAI: Grok 3 Beta ist ein KI-Modell für allgemeinem Dialog von xAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $3/Mio. Token, Ausgabe $15/Mio. Token. (Offizielle Beschreibung: Grok 3 is the latest model from xAI.) | xAI | $3.00 | $15.00 | 131K | Ansehen → | |
xAI: Grok 4 ist ein KI-Modell für allgemeinem Dialog von xAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 256K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $3/Mio. Token, Ausgabe $15/Mio. Token. (Offizielle Beschreibung: Grok 4 is xAI's latest reasoning model with a 256k context window.) | xAI | $3.00 | $15.00 | 256K | Ansehen → | |
Anthropic Claude Sonnet Latest ist ein KI-Modell für allgemeinem Dialog von ~anthropic, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $3/Mio. Token, Ausgabe $15/Mio. Token. (Offizielle Beschreibung: This model always redirects to the latest model in the Anthropic Claude Sonnet family.) | ~anthropic | $3.00 | $15.00 | 1.0M | Ansehen → | |
AionLabs: Aion-1.0 ist ein KI-Modell für allgemeinem Dialog von Aion-labs, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: API-Zugang. Preis: Eingabe $4/Mio. Token, Ausgabe $8/Mio. Token. (Offizielle Beschreibung: Aion-1.0 is a multi-model system designed for high performance across various tasks, including reasoning and coding.) | Aion-labs | $4.00 | $8.00 | 131K | Ansehen → | |
Anthropic: Claude Opus 4.5 ist ein KI-Modell für allgemeinem Dialog von Anthropic, mit langsamer, aber leistungsstarker Verarbeitung. Kontextfenster bis zu 200K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $5/Mio. Token, Ausgabe $25/Mio. Token. (Offizielle Beschreibung: Claude Opus 4.5 is Anthropic’s frontier reasoning model optimized for complex software engineering, agentic workflows, and long-horizon computer use.) | Anthropic | $5.00 | $25.00 | 200K | Ansehen → | |
Anthropic: Claude Opus 4.6 ist ein KI-Modell für allgemeinem Dialog von Anthropic, mit langsamer, aber leistungsstarker Verarbeitung. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $5/Mio. Token, Ausgabe $25/Mio. Token. (Offizielle Beschreibung: Opus 4.6 is Anthropic’s strongest model for coding and long-running professional tasks.) | Anthropic | $5.00 | $25.00 | 1.0M | Ansehen → | |
OpenAI: GPT Chat Latest ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 400K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $5/Mio. Token, Ausgabe $30/Mio. Token. (Offizielle Beschreibung: GPT Chat Latest points to OpenAI's stable API alias `chat-latest` that always resolves to the latest Instant chat model used in ChatGPT.) | OpenAI | $5.00 | $30.00 | 400K | Ansehen → | |
OpenAI: GPT-4o (2024-05-13) ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $5/Mio. Token, Ausgabe $15/Mio. Token. (Offizielle Beschreibung: GPT-4o ("o" for "omni") is OpenAI's latest AI model, supporting both text and image inputs with text outputs.) | OpenAI | $5.00 | $15.00 | 128K | Ansehen → | |
OpenAI: GPT-5.5 ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $5/Mio. Token, Ausgabe $30/Mio. Token. (Offizielle Beschreibung: GPT-5.5 is OpenAI’s frontier model designed for complex professional workloads, building on GPT-5.4 with stronger reasoning, higher reliability, and improved token efficiency on hard tasks.) | OpenAI | $5.00 | $30.00 | 1.1M | Ansehen → | |
Anthropic: Claude Opus Latest ist ein KI-Modell für allgemeinem Dialog von ~anthropic, mit langsamer, aber leistungsstarker Verarbeitung. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $5/Mio. Token, Ausgabe $25/Mio. Token. (Offizielle Beschreibung: This model always redirects to the latest model in the Claude Opus family.) | ~anthropic | $5.00 | $25.00 | 1.0M | Ansehen → | |
OpenAI GPT Latest ist ein KI-Modell für allgemeinem Dialog von ~openai, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $5/Mio. Token, Ausgabe $30/Mio. Token. (Offizielle Beschreibung: This model always redirects to the latest model in the OpenAI GPT family.) | ~openai | $5.00 | $30.00 | 1.1M | Ansehen → | |
OpenAI: GPT-4 Turbo ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit schneller Antwortzeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $10/Mio. Token, Ausgabe $30/Mio. Token. (Offizielle Beschreibung: The latest GPT-4 Turbo model with vision capabilities.) | OpenAI | $10.00 | $30.00 | 128K | Ansehen → | |
OpenAI: GPT-4 Turbo (older v1106) ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit schneller Antwortzeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $10/Mio. Token, Ausgabe $30/Mio. Token. (Offizielle Beschreibung: The latest GPT-4 Turbo model with vision capabilities.) | OpenAI | $10.00 | $30.00 | 128K | Ansehen → | |
OpenAI: GPT-4 Turbo Preview ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit schneller Antwortzeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $10/Mio. Token, Ausgabe $30/Mio. Token. (Offizielle Beschreibung: The preview GPT-4 model with improved instruction following, JSON mode, reproducible outputs, parallel function calling, and more.) | OpenAI | $10.00 | $30.00 | 128K | Ansehen → | |
Anthropic: Claude Opus 4 ist ein KI-Modell für allgemeinem Dialog von Anthropic, mit langsamer, aber leistungsstarker Verarbeitung. Kontextfenster bis zu 200K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $15/Mio. Token, Ausgabe $75/Mio. Token. (Offizielle Beschreibung: Claude Opus 4 is benchmarked as the world’s best coding model, at time of release, bringing sustained performance on complex, long-running tasks and agent workflows.) | Anthropic | $15.00 | $75.00 | 200K | Ansehen → | |
Anthropic: Claude Opus 4.1 ist ein KI-Modell für allgemeinem Dialog von Anthropic, mit langsamer, aber leistungsstarker Verarbeitung. Kontextfenster bis zu 200K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $15/Mio. Token, Ausgabe $75/Mio. Token. (Offizielle Beschreibung: Claude Opus 4.1 is an updated version of Anthropic’s flagship model, offering improved performance in coding, reasoning, and agentic tasks.) | Anthropic | $15.00 | $75.00 | 200K | Ansehen → | |
OpenAI: GPT-5 Pro ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 400K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $15/Mio. Token, Ausgabe $120/Mio. Token. (Offizielle Beschreibung: GPT-5 Pro is OpenAI’s most advanced model, offering major improvements in reasoning, code quality, and user experience.) | OpenAI | $15.00 | $120.00 | 400K | Ansehen → | |
OpenAI: GPT-5.2 Pro ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 400K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $21/Mio. Token, Ausgabe $168/Mio. Token. (Offizielle Beschreibung: GPT-5.2 Pro is OpenAI’s most advanced model, offering major improvements in agentic coding and long context performance over GPT-5 Pro.) | OpenAI | $21.00 | $168.00 | 400K | Ansehen → | |
Anthropic: Claude Opus 4.6 (Fast) ist ein KI-Modell für allgemeinem Dialog von Anthropic, mit schneller Antwortzeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $30/Mio. Token, Ausgabe $150/Mio. Token. (Offizielle Beschreibung: Fast-mode variant of Opus 4.6 - identical capabilities with higher output speed at premium 6x pricing.) | Anthropic | $30.00 | $150.00 | 1.0M | Ansehen → | |
OpenAI: GPT-4 ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 8K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $30/Mio. Token, Ausgabe $60/Mio. Token. (Offizielle Beschreibung: OpenAI's flagship model, GPT-4 is a large-scale multimodal language model capable of solving difficult problems with greater accuracy than previous models due to its broader general knowledge and advanced reasoning) | OpenAI | $30.00 | $60.00 | 8K | Ansehen → | |
OpenAI: GPT-4 (older v0314) ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 8K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: Eingabe $30/Mio. Token, Ausgabe $60/Mio. Token. (Offizielle Beschreibung: GPT-4-0314 is the first version of GPT-4 released, with a context length of 8,192 tokens, and was supported until June 14.) | OpenAI | $30.00 | $60.00 | 8K | Ansehen → | |
OpenAI: GPT-5.4 Pro ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $30/Mio. Token, Ausgabe $180/Mio. Token. (Offizielle Beschreibung: GPT-5.4 Pro is OpenAI's most advanced model, building on GPT-5.4's unified architecture with enhanced reasoning capabilities for complex, high-stakes tasks.) | OpenAI | $30.00 | $180.00 | 1.1M | Ansehen → | |
OpenAI: GPT-5.5 Pro ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: Eingabe $30/Mio. Token, Ausgabe $180/Mio. Token. (Offizielle Beschreibung: GPT-5.5 Pro is OpenAI’s high-capability model optimized for deep reasoning and accuracy on complex, high-stakes workloads.) | OpenAI | $30.00 | $180.00 | 1.1M | Ansehen → | |
Qwen: Qwen3 Next 80B A3B Instruct (free) ist ein KI-Modell für allgemeinem Dialog von Alibaba, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: Qwen3-Next-80B-A3B-Instruct is an instruction-tuned chat model in the Qwen3-Next series optimized for fast, stable responses without “thinking” traces.) | Alibaba | Nicht tokenbasiert | — | 262K | Ansehen → | |
Baidu Qianfan: CoBuddy (free) ist ein KI-Modell für allgemeinem Dialog von Baidu, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: CoBuddy is a code generation model from Baidu, optimized for coding tasks and AI Agent workflows.) | Baidu | Nicht tokenbasiert | — | 131K | Ansehen → | |
Baidu: Qianfan-OCR-Fast (free) ist ein KI-Modell für allgemeinem Dialog von Baidu, mit schneller Antwortzeit. Kontextfenster bis zu 66K Token. Fähigkeiten: Bildanalyse, API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: Qianfan-OCR-Fast is a domain-specific multimodal large model purpose-built for OCR.) | Baidu | Nicht tokenbasiert | — | 66K | Ansehen → | |
Venice: Uncensored (free) ist ein KI-Modell für allgemeinem Dialog von Cognitive Computations, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 33K Token. Fähigkeiten: API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: Venice Uncensored Dolphin Mistral 24B Venice Edition is a fine-tuned variant of Mistral-Small-24B-Instruct-2501, developed by dphn.ai in collaboration with Venice.ai.) | Cognitive Computations | Nicht tokenbasiert | — | 33K | Ansehen → | |
Google: Gemma 4 26B A4B (free) ist ein KI-Modell für allgemeinem Dialog von Google, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: Gemma 4 26B A4B IT is an instruction-tuned Mixture-of-Experts (MoE) model from Google DeepMind.) | Nicht tokenbasiert | — | 262K | Ansehen → | ||
Google: Gemma 4 31B (free) ist ein KI-Modell für allgemeinem Dialog von Google, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: Gemma 4 31B Instruct is Google DeepMind's 30.7B dense multimodal model supporting text and image input with text output.) | Nicht tokenbasiert | — | 262K | Ansehen → | ||
Google: Lyria 3 Clip Preview ist ein KI-Modell für allgemeinem Dialog von Google, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: 30 second duration clips are priced at $0.04 per clip.) | Nicht tokenbasiert | — | 1.0M | Ansehen → | ||
Google: Lyria 3 Pro Preview ist ein KI-Modell für allgemeinem Dialog von Google, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Bildanalyse, API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: Full-length songs are priced at $0.08 per song.) | Nicht tokenbasiert | — | 1.0M | Ansehen → | ||
inclusionAI: Ring-2.6-1T (free) ist ein KI-Modell für allgemeinem Dialog von Inclusionai, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: Ring-2.6-1T is a 1T-parameter-scale thinking model with 63B active parameters, built for real-world agent workflows that require both strong capability and operational efficiency.) | Inclusionai | Nicht tokenbasiert | — | 262K | Ansehen → | |
LiquidAI: LFM2.5-1.2B-Instruct (free) ist ein KI-Modell für allgemeinem Dialog von Liquid AI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 33K Token. Fähigkeiten: API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: LFM2.5-1.2B-Instruct is a compact, high-performance instruction-tuned model built for fast on-device AI.) | Liquid AI | Nicht tokenbasiert | — | 33K | Ansehen → | |
Meta: Llama 3.2 3B Instruct (free) ist ein KI-Modell für allgemeinem Dialog von Meta, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: Llama 3.2 3B is a 3-billion-parameter multilingual large language model, optimized for advanced natural language processing tasks like dialogue generation, reasoning, and summarization.) | Meta | Nicht tokenbasiert | — | 131K | Ansehen → | |
Meta: Llama 3.3 70B Instruct (free) ist ein KI-Modell für allgemeinem Dialog von Meta, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 66K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: The Meta Llama 3.3 multilingual large language model (LLM) is a pretrained and instruction tuned generative model in 70B (text in/text out).) | Meta | Nicht tokenbasiert | — | 66K | Ansehen → | |
MiniMax: MiniMax M2.5 (free) ist ein KI-Modell für allgemeinem Dialog von MiniMax, mit schneller Antwortzeit. Kontextfenster bis zu 197K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: MiniMax-M2.5 is a SOTA large language model designed for real-world productivity.) | MiniMax | Nicht tokenbasiert | — | 197K | Ansehen → | |
NVIDIA: Nemotron 3 Nano 30B A3B (free) ist ein KI-Modell für allgemeinem Dialog von NVIDIA, mit schneller Antwortzeit. Kontextfenster bis zu 256K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: NVIDIA Nemotron 3 Nano 30B A3B is a small language MoE model with highest compute efficiency and accuracy for developers to build specialized agentic AI systems.) | NVIDIA | Nicht tokenbasiert | — | 256K | Ansehen → | |
NVIDIA: Nemotron 3 Nano Omni (free) ist ein KI-Modell für allgemeinem Dialog von NVIDIA, mit schneller Antwortzeit. Kontextfenster bis zu 256K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: NVIDIA Nemotron™ 3 Nano Omni is a 30B-A3B open multimodal model designed to function as a perception and context sub-agent in enterprise agent systems.) | NVIDIA | Nicht tokenbasiert | — | 256K | Ansehen → | |
NVIDIA: Nemotron 3 Super (free) ist ein KI-Modell für allgemeinem Dialog von NVIDIA, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 262K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: NVIDIA Nemotron 3 Super is a 120B-parameter open hybrid MoE model, activating just 12B parameters for maximum compute efficiency and accuracy in complex multi-agent applications.) | NVIDIA | Nicht tokenbasiert | — | 262K | Ansehen → | |
NVIDIA: Nemotron Nano 12B 2 VL (free) ist ein KI-Modell für allgemeinem Dialog von NVIDIA, mit schneller Antwortzeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: NVIDIA Nemotron Nano 2 VL is a 12-billion-parameter open multimodal reasoning model designed for video understanding and document intelligence.) | NVIDIA | Nicht tokenbasiert | — | 128K | Ansehen → | |
NVIDIA: Nemotron Nano 9B V2 (free) ist ein KI-Modell für allgemeinem Dialog von NVIDIA, mit schneller Antwortzeit. Kontextfenster bis zu 128K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: NVIDIA-Nemotron-Nano-9B-v2 is a large language model (LLM) trained from scratch by NVIDIA, and designed as a unified model for both reasoning and non-reasoning tasks.) | NVIDIA | Nicht tokenbasiert | — | 128K | Ansehen → | |
Nous: Hermes 3 405B Instruct (free) ist ein KI-Modell für allgemeinem Dialog von Nous Research, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: Hermes 3 is a generalist language model with many improvements over Hermes 2, including advanced agentic capabilities, much better roleplaying, reasoning, multi-turn conversation, long context coherence, and improvements across the) | Nous Research | Nicht tokenbasiert | — | 131K | Ansehen → | |
OpenAI: gpt-oss-120b (free) ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: gpt-oss-120b is an open-weight, 117B-parameter Mixture-of-Experts (MoE) language model from OpenAI designed for high-reasoning, agentic, and general-purpose production use cases.) | OpenAI | Nicht tokenbasiert | — | 131K | Ansehen → | |
OpenAI: gpt-oss-20b (free) ist ein KI-Modell für allgemeinem Dialog von OpenAI, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: gpt-oss-20b is an open-weight 21B parameter model released by OpenAI under the Apache 2.0 license.) | OpenAI | Nicht tokenbasiert | — | 131K | Ansehen → | |
Free Models Router ist ein KI-Modell für allgemeinem Dialog von Openrouter, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 200K Token. Fähigkeiten: Bildanalyse, Werkzeugnutzung, API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: The simplest way to get free inference.) | Openrouter | Nicht tokenbasiert | — | 200K | Ansehen → | |
Owl Alpha ist ein KI-Modell für allgemeinem Dialog von Openrouter, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 1 Mio. Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: Owl Alpha is a high-performance foundation model designed for agentic workloads.) | Openrouter | Nicht tokenbasiert | — | 1.0M | Ansehen → | |
Poolside: Laguna M.1 (free) ist ein KI-Modell für allgemeinem Dialog von Poolside, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: Laguna M.1 is the flagship coding agent model from Poolside, optimized for complex software engineering tasks.) | Poolside | Nicht tokenbasiert | — | 131K | Ansehen → | |
Poolside: Laguna XS.2 (free) ist ein KI-Modell für allgemeinem Dialog von Poolside, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: Laguna XS.2 is the second-generation model in the XS size class from Poolside, their efficient coding agent series.) | Poolside | Nicht tokenbasiert | — | 131K | Ansehen → | |
Z.ai: GLM 4.5 Air (free) ist ein KI-Modell für allgemeinem Dialog von Z-ai, mit mittlerer Geschwindigkeit. Kontextfenster bis zu 131K Token. Fähigkeiten: Werkzeugnutzung, API-Zugang. Preis: kostenlos über OpenRouter. (Offizielle Beschreibung: GLM-4.5-Air is the lightweight variant of our latest flagship model family, also purpose-built for agent-centric applications.) | Z-ai | Nicht tokenbasiert | — | 131K | Ansehen → |