TokenCenter
Mis à jour mai 2026 · Plus de 20 modèles suivis

Comparez les modèles IA,
Prix & Performance

Explorez les meilleurs modèles IA pour le code, l'écriture, la génération d'images, la vidéo, le raisonnement et les API.

Tableau des tarifs API

Par million de tokens — USD. Cliquez sur un modèle pour les détails.

ModèleFournisseurCatégorieEntrée /1MSortie /1MContexteAPIDétails
GoogleModèles de dialogue$0.10$0.401.0MVoir →
DeepSeekModèles de code$0.27$1.10128KVoir →
AlibabaModèles de code$0.40$1.20128KVoir →
MoonshotModèles de raisonnement$0.50$2.00128KVoir →
DeepSeekModèles de raisonnement$0.55$2.19128KVoir →
AnthropicModèles de dialogue$0.80$4.00200KVoir →
GoogleModèles de raisonnement$1.25$10.001.0MVoir →
OpenAIModèles de dialogue$2.00$8.001.0MVoir →
GPT-4o🔥
OpenAIModèles de dialogue$2.50$10.00128KVoir →
AnthropicModèles de dialogue$3.00$15.00200KVoir →
GPT-5🔥NEW
OpenAIModèles de raisonnement$15.00$60.001.0MVoir →
AnthropicModèles de raisonnement$15.00$75.00200KVoir →
💬

Modèles de dialogue

Idéal pour le service client, la conversation quotidienne, l'assistance bureautique et la création de contenu — la capacité IA la plus polyvalente.

ModèleFournisseurEntrée /1MSortie /1MContexteAPIDétails

GPT-4o est un modèle multimodal rapide d'OpenAI, optimisé pour le dialogue, le code et l'analyse d'images.

OpenAI$2.50$10.00128KVoir →

Body Builder (beta) est un modèle IA de dialogue généraliste proposé par Openrouter, vitesse intermédiaire. Fenêtre de contexte jusqu'à 128K tokens. Capacités : accès API. Tarification : entrée $-1000000/million de tokens, sortie $-1000000/million de tokens. (Description officielle : Transform your natural language requests into structured OpenRouter API request objects.)

OpenrouterNon basé sur les tokens128KVoir →

IBM: Granite 4.0 Micro est un modèle IA de dialogue généraliste proposé par Ibm-granite, vitesse intermédiaire. Fenêtre de contexte jusqu'à 131K tokens. Capacités : accès API. Tarification : entrée $0.017/million de tokens, sortie $0.11/million de tokens. (Description officielle : Granite-4.0-H-Micro is a 3B parameter from the Granite 4 family of models.)

Ibm-granite$0.017$0.11131KVoir →

Meta: Llama 3.1 8B Instruct est un modèle IA de dialogue généraliste proposé par Meta, vitesse intermédiaire. Fenêtre de contexte jusqu'à 16K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.02/million de tokens, sortie $0.05/million de tokens. (Description officielle : Meta's latest class of model (Llama 3.1) launched with a variety of sizes & flavors.)

Meta$0.02$0.0516KVoir →

Mistral: Mistral Nemo est un modèle IA de dialogue généraliste proposé par Mistral AI, vitesse intermédiaire. Fenêtre de contexte jusqu'à 131K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.02/million de tokens, sortie $0.03/million de tokens. (Description officielle : A 12B parameter model with a 128k token context length built by Mistral in collaboration with NVIDIA.)

Mistral AI$0.02$0.03131KVoir →

Meta: Llama 3.2 1B Instruct est un modèle IA de dialogue généraliste proposé par Meta, vitesse intermédiaire. Fenêtre de contexte jusqu'à 60K tokens. Capacités : accès API. Tarification : entrée $0.027/million de tokens, sortie $0.2/million de tokens. (Description officielle : Llama 3.2 1B is a 1-billion-parameter language model focused on efficiently performing natural language tasks, such as summarization, dialogue, and multilingual text analysis.)

Meta$0.027$0.2060KVoir →

LiquidAI: LFM2-24B-A2B est un modèle IA de dialogue généraliste proposé par Liquid AI, vitesse intermédiaire. Fenêtre de contexte jusqu'à 33K tokens. Capacités : accès API. Tarification : entrée $0.03/million de tokens, sortie $0.12/million de tokens. (Description officielle : LFM2-24B-A2B is the largest model in the LFM2 family of hybrid architectures designed for efficient on-device deployment.)

Liquid AI$0.03$0.1233KVoir →

OpenAI: gpt-oss-20b est un modèle IA de dialogue généraliste proposé par OpenAI, vitesse intermédiaire. Fenêtre de contexte jusqu'à 131K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.03/million de tokens, sortie $0.14/million de tokens. (Description officielle : gpt-oss-20b is an open-weight 21B parameter model released by OpenAI under the Apache 2.0 license.)

OpenAI$0.03$0.14131KVoir →

Qwen: Qwen-Turbo est un modèle IA de dialogue généraliste proposé par Alibaba, rapide. Fenêtre de contexte jusqu'à 131K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.0325/million de tokens, sortie $0.13/million de tokens. (Description officielle : Qwen-Turbo, based on Qwen2.5, is a 1M context model that provides fast speed and low cost, suitable for simple tasks.)

Alibaba$0.0325$0.13131KVoir →

Amazon: Nova Micro 1.0 est un modèle IA de dialogue généraliste proposé par Amazon, vitesse intermédiaire. Fenêtre de contexte jusqu'à 128K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.035/million de tokens, sortie $0.14/million de tokens. (Description officielle : Amazon Nova Micro 1.0 is a text-only model that delivers the lowest latency responses in the Amazon Nova family of models at a very low cost.)

Amazon$0.035$0.14128KVoir →

Cohere: Command R7B (12-2024) est un modèle IA de dialogue généraliste proposé par Cohere, vitesse intermédiaire. Fenêtre de contexte jusqu'à 128K tokens. Capacités : accès API. Tarification : entrée $0.0375/million de tokens, sortie $0.15/million de tokens. (Description officielle : Command R7B (12-2024) is a small, fast update of the Command R+ model, delivered in December 2024.)

Cohere$0.0375$0.15128KVoir →

OpenAI: gpt-oss-120b est un modèle IA de dialogue généraliste proposé par OpenAI, vitesse intermédiaire. Fenêtre de contexte jusqu'à 131K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.039/million de tokens, sortie $0.18/million de tokens. (Description officielle : gpt-oss-120b is an open-weight, 117B-parameter Mixture-of-Experts (MoE) language model from OpenAI designed for high-reasoning, agentic, and general-purpose production use cases.)

OpenAI$0.039$0.18131KVoir →
💻

Modèles de code

Optimisé pour le développement logiciel : génération de code, débogage, revue de code et documentation technique.

ModèleFournisseurEntrée /1MSortie /1MContexteAPIDétails

DeepSeek V3 est un modèle MoE très compétitif pour le code et le raisonnement général, à faible coût.

DeepSeek$0.27$1.10128KVoir →

Pareto Code Router est un modèle IA de génération de code proposé par Openrouter, vitesse intermédiaire. Fenêtre de contexte jusqu'à 2M tokens. Capacités : accès API. Tarification : entrée $-1000000/million de tokens, sortie $-1000000/million de tokens. (Description officielle : The Pareto Router maintains a tiered shortlist of strong coding models, ranked by Artificial Analysis coding percentiles.)

OpenrouterNon basé sur les tokens2.0MVoir →

Qwen: Qwen3 Coder 30B A3B Instruct est un modèle IA de génération de code proposé par Alibaba, vitesse intermédiaire. Fenêtre de contexte jusqu'à 160K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.07/million de tokens, sortie $0.27/million de tokens. (Description officielle : Qwen3-Coder-30B-A3B-Instruct is a 30.5B parameter Mixture-of-Experts (MoE) model with 128 experts (8 active per forward pass), designed for advanced code generation, repository-scale understanding, and agentic tool use.)

Alibaba$0.07$0.27160KVoir →

Qwen: Qwen3 Coder Next est un modèle IA de génération de code proposé par Alibaba, vitesse intermédiaire. Fenêtre de contexte jusqu'à 262K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.11/million de tokens, sortie $0.8/million de tokens. (Description officielle : Qwen3-Coder-Next is an open-weight causal language model optimized for coding agents and local development workflows.)

Alibaba$0.11$0.80262KVoir →

Qwen: Qwen3 Coder Flash est un modèle IA de génération de code proposé par Alibaba, rapide. Fenêtre de contexte jusqu'à 1M tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.195/million de tokens, sortie $0.975/million de tokens. (Description officielle : Qwen3 Coder Flash is Alibaba's fast and cost efficient version of their proprietary Qwen3 Coder Plus.)

Alibaba$0.195$0.9751.0MVoir →

xAI: Grok Code Fast 1 est un modèle IA de génération de code proposé par xAI, rapide. Fenêtre de contexte jusqu'à 256K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.2/million de tokens, sortie $1.5/million de tokens. (Description officielle : Grok Code Fast 1 is a speedy and economical reasoning model that excels at agentic coding.)

xAI$0.20$1.50256KVoir →

Qwen: Qwen3 Coder 480B A35B est un modèle IA de génération de code proposé par Alibaba, vitesse intermédiaire. Fenêtre de contexte jusqu'à 262K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.22/million de tokens, sortie $1.8/million de tokens. (Description officielle : Qwen3-Coder-480B-A35B-Instruct is a Mixture-of-Experts (MoE) code generation model developed by the Qwen team.)

Alibaba$0.22$1.80262KVoir →

Kwaipilot: KAT-Coder-Pro V2 est un modèle IA de génération de code proposé par Kwaipilot, vitesse intermédiaire. Fenêtre de contexte jusqu'à 256K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.3/million de tokens, sortie $1.2/million de tokens. (Description officielle : KAT-Coder-Pro V2 is the latest high-performance model in KwaiKAT’s KAT-Coder series, designed for complex enterprise-grade software engineering and SaaS integration.)

Kwaipilot$0.30$1.20256KVoir →

Mistral: Codestral 2508 est un modèle IA de génération de code proposé par Mistral AI, vitesse intermédiaire. Fenêtre de contexte jusqu'à 256K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.3/million de tokens, sortie $0.9/million de tokens. (Description officielle : Mistral's cutting-edge language model for coding released end of July 2025.)

Mistral AI$0.30$0.90256KVoir →

Qwen 2.5 72B est le modèle open-source phare d'Alibaba, avec d'excellentes capacités multilingues et de code.

Alibaba$0.40$1.20128KVoir →

Arcee AI: Coder Large est un modèle IA de génération de code proposé par Arcee-ai, plus lent mais plus puissant. Fenêtre de contexte jusqu'à 33K tokens. Capacités : accès API. Tarification : entrée $0.5/million de tokens, sortie $0.8/million de tokens. (Description officielle : Coder‑Large is a 32 B‑parameter offspring of Qwen 2.5‑Instruct that has been further trained on permissively‑licensed GitHub, CodeSearchNet and synthetic bug‑fix corpora.)

Arcee-ai$0.50$0.8033KVoir →

Qwen: Qwen3 Coder Plus est un modèle IA de génération de code proposé par Alibaba, plus lent mais plus puissant. Fenêtre de contexte jusqu'à 1M tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.65/million de tokens, sortie $3.25/million de tokens. (Description officielle : Qwen3 Coder Plus is Alibaba's proprietary version of the Open Source Qwen3 Coder 480B A35B.)

Alibaba$0.65$3.251.0MVoir →
🧠

Modèles de raisonnement

Raisonnement logique avancé pour les mathématiques, les sciences, l'analyse complexe et la planification stratégique.

ModèleFournisseurEntrée /1MSortie /1MContexteAPIDétails

DeepSeek R1 est un modèle de raisonnement par chaîne de pensée rivalisant avec o1 pour une fraction du prix.

DeepSeek$0.55$2.19128KVoir →

Gemini 2.5 Pro est le modèle phare de Google avec un contexte natif d'un million de tokens et un raisonnement de pointe.

Google$1.25$10.001.0MVoir →
GPT-5HotNew

GPT-5 est le modèle le plus puissant d'OpenAI, alliant raisonnement avancé et compréhension multimodale.

OpenAI$15.00$60.001.0MVoir →

Claude Opus est le modèle le plus intelligent d'Anthropic, conçu pour le raisonnement complexe et les tâches agentiques.

Anthropic$15.00$75.00200KVoir →

Baidu: ERNIE 4.5 21B A3B Thinking est un modèle IA de raisonnement avancé proposé par Baidu, vitesse intermédiaire. Fenêtre de contexte jusqu'à 131K tokens. Capacités : accès API. Tarification : entrée $0.07/million de tokens, sortie $0.28/million de tokens. (Description officielle : ERNIE-4.5-21B-A3B-Thinking is Baidu's upgraded lightweight MoE model, refined to boost reasoning depth and quality for top-tier performance in logical puzzles, math, science, coding, text generation, and expert-level academic benchmarks.)

Baidu$0.07$0.28131KVoir →

Qwen: Qwen3 30B A3B Thinking 2507 est un modèle IA de raisonnement avancé proposé par Alibaba, vitesse intermédiaire. Fenêtre de contexte jusqu'à 131K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.08/million de tokens, sortie $0.4/million de tokens. (Description officielle : Qwen3-30B-A3B-Thinking-2507 is a 30B parameter Mixture-of-Experts reasoning model optimized for complex tasks requiring extended multi-step thinking.)

Alibaba$0.08$0.40131KVoir →

Qwen: Qwen3 Next 80B A3B Thinking est un modèle IA de raisonnement avancé proposé par Alibaba, vitesse intermédiaire. Fenêtre de contexte jusqu'à 131K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.0975/million de tokens, sortie $0.78/million de tokens. (Description officielle : Qwen3-Next-80B-A3B-Thinking is a reasoning-first chat model in the Qwen3-Next line that outputs structured “thinking” traces by default.)

Alibaba$0.0975$0.78131KVoir →

Qwen: Qwen3 VL 8B Thinking est un modèle IA de raisonnement avancé proposé par Alibaba, vitesse intermédiaire. Fenêtre de contexte jusqu'à 131K tokens. Capacités : analyse d'images, utilisation d'outils, accès API. Tarification : entrée $0.117/million de tokens, sortie $1.365/million de tokens. (Description officielle : Qwen3-VL-8B-Thinking is the reasoning-optimized variant of the Qwen3-VL-8B multimodal model, designed for advanced visual and textual reasoning across complex scenes, documents, and temporal sequences.)

Alibaba$0.117$1.365131KVoir →

Qwen: Qwen3 VL 30B A3B Thinking est un modèle IA de raisonnement avancé proposé par Alibaba, vitesse intermédiaire. Fenêtre de contexte jusqu'à 131K tokens. Capacités : analyse d'images, utilisation d'outils, accès API. Tarification : entrée $0.13/million de tokens, sortie $1.56/million de tokens. (Description officielle : Qwen3-VL-30B-A3B-Thinking is a multimodal model that unifies strong text generation with visual understanding for images and videos.)

Alibaba$0.13$1.56131KVoir →

Qwen: Qwen3 235B A22B Thinking 2507 est un modèle IA de raisonnement avancé proposé par Alibaba, vitesse intermédiaire. Fenêtre de contexte jusqu'à 131K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.1495/million de tokens, sortie $1.495/million de tokens. (Description officielle : Qwen3-235B-A22B-Thinking-2507 is a high-performance, open-weight Mixture-of-Experts (MoE) language model optimized for complex reasoning tasks.)

Alibaba$0.1495$1.495131KVoir →

Arcee AI: Trinity Large Thinking est un modèle IA de raisonnement avancé proposé par Arcee-ai, plus lent mais plus puissant. Fenêtre de contexte jusqu'à 262K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.22/million de tokens, sortie $0.85/million de tokens. (Description officielle : Trinity Large Thinking is a powerful open source reasoning model from the team at Arcee AI.)

Arcee-ai$0.22$0.85262KVoir →

Qwen: Qwen Plus 0728 (thinking) est un modèle IA de raisonnement avancé proposé par Alibaba, plus lent mais plus puissant. Fenêtre de contexte jusqu'à 1M tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.26/million de tokens, sortie $0.78/million de tokens. (Description officielle : Qwen Plus 0728, based on the Qwen3 foundation model, is a 1 million context hybrid reasoning model with a balanced performance, speed, and cost combination.)

Alibaba$0.26$0.781.0MVoir →
🖼️

Génération d'images

Générez des images de haute qualité à partir de descriptions textuelles — idéal pour le design, la publicité, l'illustration et l'art.

ModèleFournisseurEntrée /1MSortie /1MContexteAPIDétails

FLUX.1 est un modèle de génération d'images de pointe, reconnu pour son photoréalisme et sa précision.

Black Forest LabsNon basé sur les tokensVoir →

Auto Router est un modèle IA de génération d'images proposé par Openrouter, vitesse intermédiaire. Fenêtre de contexte jusqu'à 2M tokens. Capacités : analyse d'images, utilisation d'outils, accès API. Tarification : entrée $-1000000/million de tokens, sortie $-1000000/million de tokens. (Description officielle : Your prompt will be processed by a meta-model and routed to one of dozens of models (see below), optimizing for the best possible output.)

OpenrouterNon basé sur les tokens2.0MVoir →

Google: Nano Banana (Gemini 2.5 Flash Image) est un modèle IA de génération d'images proposé par Google, rapide. Fenêtre de contexte jusqu'à 33K tokens. Capacités : analyse d'images, accès API. Tarification : entrée $0.3/million de tokens, sortie $2.5/million de tokens. (Description officielle : Gemini 2.5 Flash Image, a.k.a.)

Google$0.30$2.5033KVoir →

Google: Nano Banana 2 (Gemini 3.1 Flash Image Preview) est un modèle IA de génération d'images proposé par Google, rapide. Fenêtre de contexte jusqu'à 66K tokens. Capacités : analyse d'images, accès API. Tarification : entrée $0.5/million de tokens, sortie $3/million de tokens. (Description officielle : Gemini 3.1 Flash Image Preview, a.k.a.)

Google$0.50$3.0066KVoir →

Google: Nano Banana Pro (Gemini 3 Pro Image Preview) est un modèle IA de génération d'images proposé par Google, rapide. Fenêtre de contexte jusqu'à 66K tokens. Capacités : analyse d'images, accès API. Tarification : entrée $2/million de tokens, sortie $12/million de tokens. (Description officielle : Nano Banana Pro is Google’s most advanced image-generation and editing model, built on Gemini 3 Pro.)

Google$2.00$12.0066KVoir →

OpenAI: GPT-5 Image Mini est un modèle IA de génération d'images proposé par OpenAI, rapide. Fenêtre de contexte jusqu'à 400K tokens. Capacités : analyse d'images, accès API. Tarification : entrée $2.5/million de tokens, sortie $2/million de tokens. (Description officielle : GPT-5 Image Mini combines OpenAI's advanced language capabilities, powered by GPT-5 Mini, with GPT Image 1 Mini for efficient image generation.)

OpenAI$2.50$2.00400KVoir →

OpenAI: GPT-5.4 Image 2 est un modèle IA de génération d'images proposé par OpenAI, vitesse intermédiaire. Fenêtre de contexte jusqu'à 272K tokens. Capacités : analyse d'images, accès API. Tarification : entrée $8/million de tokens, sortie $15/million de tokens. (Description officielle : GPT-5.4 Image 2 combines OpenAI's GPT-5.4 model with state-of-the-art image generation capabilities from GPT Image 2.)

OpenAI$8.00$15.00272KVoir →

OpenAI: GPT-5 Image est un modèle IA de génération d'images proposé par OpenAI, vitesse intermédiaire. Fenêtre de contexte jusqu'à 400K tokens. Capacités : analyse d'images, accès API. Tarification : entrée $10/million de tokens, sortie $10/million de tokens. (Description officielle : GPT-5 Image combines OpenAI's GPT-5 model with state-of-the-art image generation capabilities.)

OpenAI$10.00$10.00400KVoir →

Midjourney v6 produit des images artistiques époustouflantes d'une qualité esthétique exceptionnelle.

MidjourneyNon basé sur les tokensVoir →

Stable Diffusion XL est le modèle open-source de référence pour la génération d'images en local.

Stability AINon basé sur les tokensVoir →
🎬

Génération de vidéos

Générez des vidéos à partir de texte ou d'images — parfait pour les publicités, le contenu court et l'assistance à la production cinématographique.

ModèleFournisseurEntrée /1MSortie /1MContexteAPIDétails
SoraHot

Sora génère des vidéos réalistes et créatives à partir de texte, jusqu'à 60 secondes.

OpenAINon basé sur les tokensVoir →

Kling AI génère des vidéos de haute qualité avec des mouvements réalistes et des transitions fluides.

Kling AINon basé sur les tokensVoir →

Veo 2 est le modèle vidéo avancé de Google, avec une qualité cinématographique et une compréhension physique.

GoogleNon basé sur les tokensVoir →

Runway Gen-3 Alpha est un puissant modèle de génération vidéo avec accès API pour les développeurs.

RunwayNon basé sur les tokensVoir →

Comparaisons populaires

Derniers modèles