Comparez les modèles IA,
Prix & Performance
Explorez les meilleurs modèles IA pour le code, l'écriture, la génération d'images, la vidéo, le raisonnement et les API.
Tableau des tarifs API
Par million de tokens — USD. Cliquez sur un modèle pour les détails.
| Modèle | Fournisseur | Catégorie | Entrée /1M | Sortie /1M | Contexte | API | Détails |
|---|---|---|---|---|---|---|---|
| Modèles de dialogue | $0.10 | $0.40 | 1.0M | Voir → | |||
| DeepSeek | Modèles de code | $0.27 | $1.10 | 128K | Voir → | ||
| Alibaba | Modèles de code | $0.40 | $1.20 | 128K | Voir → | ||
| Moonshot | Modèles de raisonnement | $0.50 | $2.00 | 128K | Voir → | ||
| DeepSeek | Modèles de raisonnement | $0.55 | $2.19 | 128K | Voir → | ||
| Anthropic | Modèles de dialogue | $0.80 | $4.00 | 200K | Voir → | ||
| Modèles de raisonnement | $1.25 | $10.00 | 1.0M | Voir → | |||
GPT-4.1NEW | OpenAI | Modèles de dialogue | $2.00 | $8.00 | 1.0M | Voir → | |
| OpenAI | Modèles de dialogue | $2.50 | $10.00 | 128K | Voir → | ||
| Anthropic | Modèles de dialogue | $3.00 | $15.00 | 200K | Voir → | ||
| OpenAI | Modèles de raisonnement | $15.00 | $60.00 | 1.0M | Voir → | ||
| Anthropic | Modèles de raisonnement | $15.00 | $75.00 | 200K | Voir → |
Modèles de dialogue
Idéal pour le service client, la conversation quotidienne, l'assistance bureautique et la création de contenu — la capacité IA la plus polyvalente.
| Modèle | Fournisseur | Entrée /1M | Sortie /1M | Contexte | API | Détails |
|---|---|---|---|---|---|---|
GPT-4oHot GPT-4o est un modèle multimodal rapide d'OpenAI, optimisé pour le dialogue, le code et l'analyse d'images. | OpenAI | $2.50 | $10.00 | 128K | Voir → | |
Body Builder (beta) est un modèle IA de dialogue généraliste proposé par Openrouter, vitesse intermédiaire. Fenêtre de contexte jusqu'à 128K tokens. Capacités : accès API. Tarification : entrée $-1000000/million de tokens, sortie $-1000000/million de tokens. (Description officielle : Transform your natural language requests into structured OpenRouter API request objects.) | Openrouter | Non basé sur les tokens | — | 128K | Voir → | |
IBM: Granite 4.0 Micro est un modèle IA de dialogue généraliste proposé par Ibm-granite, vitesse intermédiaire. Fenêtre de contexte jusqu'à 131K tokens. Capacités : accès API. Tarification : entrée $0.017/million de tokens, sortie $0.11/million de tokens. (Description officielle : Granite-4.0-H-Micro is a 3B parameter from the Granite 4 family of models.) | Ibm-granite | $0.017 | $0.11 | 131K | Voir → | |
Meta: Llama 3.1 8B Instruct est un modèle IA de dialogue généraliste proposé par Meta, vitesse intermédiaire. Fenêtre de contexte jusqu'à 16K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.02/million de tokens, sortie $0.05/million de tokens. (Description officielle : Meta's latest class of model (Llama 3.1) launched with a variety of sizes & flavors.) | Meta | $0.02 | $0.05 | 16K | Voir → | |
Mistral: Mistral Nemo est un modèle IA de dialogue généraliste proposé par Mistral AI, vitesse intermédiaire. Fenêtre de contexte jusqu'à 131K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.02/million de tokens, sortie $0.03/million de tokens. (Description officielle : A 12B parameter model with a 128k token context length built by Mistral in collaboration with NVIDIA.) | Mistral AI | $0.02 | $0.03 | 131K | Voir → | |
Meta: Llama 3.2 1B Instruct est un modèle IA de dialogue généraliste proposé par Meta, vitesse intermédiaire. Fenêtre de contexte jusqu'à 60K tokens. Capacités : accès API. Tarification : entrée $0.027/million de tokens, sortie $0.2/million de tokens. (Description officielle : Llama 3.2 1B is a 1-billion-parameter language model focused on efficiently performing natural language tasks, such as summarization, dialogue, and multilingual text analysis.) | Meta | $0.027 | $0.20 | 60K | Voir → | |
LiquidAI: LFM2-24B-A2B est un modèle IA de dialogue généraliste proposé par Liquid AI, vitesse intermédiaire. Fenêtre de contexte jusqu'à 33K tokens. Capacités : accès API. Tarification : entrée $0.03/million de tokens, sortie $0.12/million de tokens. (Description officielle : LFM2-24B-A2B is the largest model in the LFM2 family of hybrid architectures designed for efficient on-device deployment.) | Liquid AI | $0.03 | $0.12 | 33K | Voir → | |
OpenAI: gpt-oss-20b est un modèle IA de dialogue généraliste proposé par OpenAI, vitesse intermédiaire. Fenêtre de contexte jusqu'à 131K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.03/million de tokens, sortie $0.14/million de tokens. (Description officielle : gpt-oss-20b is an open-weight 21B parameter model released by OpenAI under the Apache 2.0 license.) | OpenAI | $0.03 | $0.14 | 131K | Voir → | |
Qwen: Qwen-Turbo est un modèle IA de dialogue généraliste proposé par Alibaba, rapide. Fenêtre de contexte jusqu'à 131K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.0325/million de tokens, sortie $0.13/million de tokens. (Description officielle : Qwen-Turbo, based on Qwen2.5, is a 1M context model that provides fast speed and low cost, suitable for simple tasks.) | Alibaba | $0.0325 | $0.13 | 131K | Voir → | |
Amazon: Nova Micro 1.0 est un modèle IA de dialogue généraliste proposé par Amazon, vitesse intermédiaire. Fenêtre de contexte jusqu'à 128K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.035/million de tokens, sortie $0.14/million de tokens. (Description officielle : Amazon Nova Micro 1.0 is a text-only model that delivers the lowest latency responses in the Amazon Nova family of models at a very low cost.) | Amazon | $0.035 | $0.14 | 128K | Voir → | |
Cohere: Command R7B (12-2024) est un modèle IA de dialogue généraliste proposé par Cohere, vitesse intermédiaire. Fenêtre de contexte jusqu'à 128K tokens. Capacités : accès API. Tarification : entrée $0.0375/million de tokens, sortie $0.15/million de tokens. (Description officielle : Command R7B (12-2024) is a small, fast update of the Command R+ model, delivered in December 2024.) | Cohere | $0.0375 | $0.15 | 128K | Voir → | |
OpenAI: gpt-oss-120b est un modèle IA de dialogue généraliste proposé par OpenAI, vitesse intermédiaire. Fenêtre de contexte jusqu'à 131K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.039/million de tokens, sortie $0.18/million de tokens. (Description officielle : gpt-oss-120b is an open-weight, 117B-parameter Mixture-of-Experts (MoE) language model from OpenAI designed for high-reasoning, agentic, and general-purpose production use cases.) | OpenAI | $0.039 | $0.18 | 131K | Voir → |
Modèles de code
Optimisé pour le développement logiciel : génération de code, débogage, revue de code et documentation technique.
| Modèle | Fournisseur | Entrée /1M | Sortie /1M | Contexte | API | Détails |
|---|---|---|---|---|---|---|
DeepSeek V3Hot DeepSeek V3 est un modèle MoE très compétitif pour le code et le raisonnement général, à faible coût. | DeepSeek | $0.27 | $1.10 | 128K | Voir → | |
Pareto Code Router est un modèle IA de génération de code proposé par Openrouter, vitesse intermédiaire. Fenêtre de contexte jusqu'à 2M tokens. Capacités : accès API. Tarification : entrée $-1000000/million de tokens, sortie $-1000000/million de tokens. (Description officielle : The Pareto Router maintains a tiered shortlist of strong coding models, ranked by Artificial Analysis coding percentiles.) | Openrouter | Non basé sur les tokens | — | 2.0M | Voir → | |
Qwen: Qwen3 Coder 30B A3B Instruct est un modèle IA de génération de code proposé par Alibaba, vitesse intermédiaire. Fenêtre de contexte jusqu'à 160K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.07/million de tokens, sortie $0.27/million de tokens. (Description officielle : Qwen3-Coder-30B-A3B-Instruct is a 30.5B parameter Mixture-of-Experts (MoE) model with 128 experts (8 active per forward pass), designed for advanced code generation, repository-scale understanding, and agentic tool use.) | Alibaba | $0.07 | $0.27 | 160K | Voir → | |
Qwen: Qwen3 Coder Next est un modèle IA de génération de code proposé par Alibaba, vitesse intermédiaire. Fenêtre de contexte jusqu'à 262K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.11/million de tokens, sortie $0.8/million de tokens. (Description officielle : Qwen3-Coder-Next is an open-weight causal language model optimized for coding agents and local development workflows.) | Alibaba | $0.11 | $0.80 | 262K | Voir → | |
Qwen: Qwen3 Coder Flash est un modèle IA de génération de code proposé par Alibaba, rapide. Fenêtre de contexte jusqu'à 1M tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.195/million de tokens, sortie $0.975/million de tokens. (Description officielle : Qwen3 Coder Flash is Alibaba's fast and cost efficient version of their proprietary Qwen3 Coder Plus.) | Alibaba | $0.195 | $0.975 | 1.0M | Voir → | |
xAI: Grok Code Fast 1 est un modèle IA de génération de code proposé par xAI, rapide. Fenêtre de contexte jusqu'à 256K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.2/million de tokens, sortie $1.5/million de tokens. (Description officielle : Grok Code Fast 1 is a speedy and economical reasoning model that excels at agentic coding.) | xAI | $0.20 | $1.50 | 256K | Voir → | |
Qwen: Qwen3 Coder 480B A35B est un modèle IA de génération de code proposé par Alibaba, vitesse intermédiaire. Fenêtre de contexte jusqu'à 262K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.22/million de tokens, sortie $1.8/million de tokens. (Description officielle : Qwen3-Coder-480B-A35B-Instruct is a Mixture-of-Experts (MoE) code generation model developed by the Qwen team.) | Alibaba | $0.22 | $1.80 | 262K | Voir → | |
Kwaipilot: KAT-Coder-Pro V2 est un modèle IA de génération de code proposé par Kwaipilot, vitesse intermédiaire. Fenêtre de contexte jusqu'à 256K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.3/million de tokens, sortie $1.2/million de tokens. (Description officielle : KAT-Coder-Pro V2 is the latest high-performance model in KwaiKAT’s KAT-Coder series, designed for complex enterprise-grade software engineering and SaaS integration.) | Kwaipilot | $0.30 | $1.20 | 256K | Voir → | |
Mistral: Codestral 2508 est un modèle IA de génération de code proposé par Mistral AI, vitesse intermédiaire. Fenêtre de contexte jusqu'à 256K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.3/million de tokens, sortie $0.9/million de tokens. (Description officielle : Mistral's cutting-edge language model for coding released end of July 2025.) | Mistral AI | $0.30 | $0.90 | 256K | Voir → | |
Qwen 2.5 72B est le modèle open-source phare d'Alibaba, avec d'excellentes capacités multilingues et de code. | Alibaba | $0.40 | $1.20 | 128K | Voir → | |
Arcee AI: Coder Large est un modèle IA de génération de code proposé par Arcee-ai, plus lent mais plus puissant. Fenêtre de contexte jusqu'à 33K tokens. Capacités : accès API. Tarification : entrée $0.5/million de tokens, sortie $0.8/million de tokens. (Description officielle : Coder‑Large is a 32 B‑parameter offspring of Qwen 2.5‑Instruct that has been further trained on permissively‑licensed GitHub, CodeSearchNet and synthetic bug‑fix corpora.) | Arcee-ai | $0.50 | $0.80 | 33K | Voir → | |
Qwen: Qwen3 Coder Plus est un modèle IA de génération de code proposé par Alibaba, plus lent mais plus puissant. Fenêtre de contexte jusqu'à 1M tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.65/million de tokens, sortie $3.25/million de tokens. (Description officielle : Qwen3 Coder Plus is Alibaba's proprietary version of the Open Source Qwen3 Coder 480B A35B.) | Alibaba | $0.65 | $3.25 | 1.0M | Voir → |
Modèles de raisonnement
Raisonnement logique avancé pour les mathématiques, les sciences, l'analyse complexe et la planification stratégique.
| Modèle | Fournisseur | Entrée /1M | Sortie /1M | Contexte | API | Détails |
|---|---|---|---|---|---|---|
DeepSeek R1Hot DeepSeek R1 est un modèle de raisonnement par chaîne de pensée rivalisant avec o1 pour une fraction du prix. | DeepSeek | $0.55 | $2.19 | 128K | Voir → | |
Gemini 2.5 Pro est le modèle phare de Google avec un contexte natif d'un million de tokens et un raisonnement de pointe. | $1.25 | $10.00 | 1.0M | Voir → | ||
GPT-5 est le modèle le plus puissant d'OpenAI, alliant raisonnement avancé et compréhension multimodale. | OpenAI | $15.00 | $60.00 | 1.0M | Voir → | |
Claude Opus est le modèle le plus intelligent d'Anthropic, conçu pour le raisonnement complexe et les tâches agentiques. | Anthropic | $15.00 | $75.00 | 200K | Voir → | |
Baidu: ERNIE 4.5 21B A3B Thinking est un modèle IA de raisonnement avancé proposé par Baidu, vitesse intermédiaire. Fenêtre de contexte jusqu'à 131K tokens. Capacités : accès API. Tarification : entrée $0.07/million de tokens, sortie $0.28/million de tokens. (Description officielle : ERNIE-4.5-21B-A3B-Thinking is Baidu's upgraded lightweight MoE model, refined to boost reasoning depth and quality for top-tier performance in logical puzzles, math, science, coding, text generation, and expert-level academic benchmarks.) | Baidu | $0.07 | $0.28 | 131K | Voir → | |
Qwen: Qwen3 30B A3B Thinking 2507 est un modèle IA de raisonnement avancé proposé par Alibaba, vitesse intermédiaire. Fenêtre de contexte jusqu'à 131K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.08/million de tokens, sortie $0.4/million de tokens. (Description officielle : Qwen3-30B-A3B-Thinking-2507 is a 30B parameter Mixture-of-Experts reasoning model optimized for complex tasks requiring extended multi-step thinking.) | Alibaba | $0.08 | $0.40 | 131K | Voir → | |
Qwen: Qwen3 Next 80B A3B Thinking est un modèle IA de raisonnement avancé proposé par Alibaba, vitesse intermédiaire. Fenêtre de contexte jusqu'à 131K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.0975/million de tokens, sortie $0.78/million de tokens. (Description officielle : Qwen3-Next-80B-A3B-Thinking is a reasoning-first chat model in the Qwen3-Next line that outputs structured “thinking” traces by default.) | Alibaba | $0.0975 | $0.78 | 131K | Voir → | |
Qwen: Qwen3 VL 8B Thinking est un modèle IA de raisonnement avancé proposé par Alibaba, vitesse intermédiaire. Fenêtre de contexte jusqu'à 131K tokens. Capacités : analyse d'images, utilisation d'outils, accès API. Tarification : entrée $0.117/million de tokens, sortie $1.365/million de tokens. (Description officielle : Qwen3-VL-8B-Thinking is the reasoning-optimized variant of the Qwen3-VL-8B multimodal model, designed for advanced visual and textual reasoning across complex scenes, documents, and temporal sequences.) | Alibaba | $0.117 | $1.365 | 131K | Voir → | |
Qwen: Qwen3 VL 30B A3B Thinking est un modèle IA de raisonnement avancé proposé par Alibaba, vitesse intermédiaire. Fenêtre de contexte jusqu'à 131K tokens. Capacités : analyse d'images, utilisation d'outils, accès API. Tarification : entrée $0.13/million de tokens, sortie $1.56/million de tokens. (Description officielle : Qwen3-VL-30B-A3B-Thinking is a multimodal model that unifies strong text generation with visual understanding for images and videos.) | Alibaba | $0.13 | $1.56 | 131K | Voir → | |
Qwen: Qwen3 235B A22B Thinking 2507 est un modèle IA de raisonnement avancé proposé par Alibaba, vitesse intermédiaire. Fenêtre de contexte jusqu'à 131K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.1495/million de tokens, sortie $1.495/million de tokens. (Description officielle : Qwen3-235B-A22B-Thinking-2507 is a high-performance, open-weight Mixture-of-Experts (MoE) language model optimized for complex reasoning tasks.) | Alibaba | $0.1495 | $1.495 | 131K | Voir → | |
Arcee AI: Trinity Large Thinking est un modèle IA de raisonnement avancé proposé par Arcee-ai, plus lent mais plus puissant. Fenêtre de contexte jusqu'à 262K tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.22/million de tokens, sortie $0.85/million de tokens. (Description officielle : Trinity Large Thinking is a powerful open source reasoning model from the team at Arcee AI.) | Arcee-ai | $0.22 | $0.85 | 262K | Voir → | |
Qwen: Qwen Plus 0728 (thinking) est un modèle IA de raisonnement avancé proposé par Alibaba, plus lent mais plus puissant. Fenêtre de contexte jusqu'à 1M tokens. Capacités : utilisation d'outils, accès API. Tarification : entrée $0.26/million de tokens, sortie $0.78/million de tokens. (Description officielle : Qwen Plus 0728, based on the Qwen3 foundation model, is a 1 million context hybrid reasoning model with a balanced performance, speed, and cost combination.) | Alibaba | $0.26 | $0.78 | 1.0M | Voir → |
Génération d'images
Générez des images de haute qualité à partir de descriptions textuelles — idéal pour le design, la publicité, l'illustration et l'art.
| Modèle | Fournisseur | Entrée /1M | Sortie /1M | Contexte | API | Détails |
|---|---|---|---|---|---|---|
FLUX.1Hot FLUX.1 est un modèle de génération d'images de pointe, reconnu pour son photoréalisme et sa précision. | Black Forest Labs | Non basé sur les tokens | — | — | Voir → | |
Auto Router est un modèle IA de génération d'images proposé par Openrouter, vitesse intermédiaire. Fenêtre de contexte jusqu'à 2M tokens. Capacités : analyse d'images, utilisation d'outils, accès API. Tarification : entrée $-1000000/million de tokens, sortie $-1000000/million de tokens. (Description officielle : Your prompt will be processed by a meta-model and routed to one of dozens of models (see below), optimizing for the best possible output.) | Openrouter | Non basé sur les tokens | — | 2.0M | Voir → | |
Google: Nano Banana (Gemini 2.5 Flash Image) est un modèle IA de génération d'images proposé par Google, rapide. Fenêtre de contexte jusqu'à 33K tokens. Capacités : analyse d'images, accès API. Tarification : entrée $0.3/million de tokens, sortie $2.5/million de tokens. (Description officielle : Gemini 2.5 Flash Image, a.k.a.) | $0.30 | $2.50 | 33K | Voir → | ||
Google: Nano Banana 2 (Gemini 3.1 Flash Image Preview) est un modèle IA de génération d'images proposé par Google, rapide. Fenêtre de contexte jusqu'à 66K tokens. Capacités : analyse d'images, accès API. Tarification : entrée $0.5/million de tokens, sortie $3/million de tokens. (Description officielle : Gemini 3.1 Flash Image Preview, a.k.a.) | $0.50 | $3.00 | 66K | Voir → | ||
Google: Nano Banana Pro (Gemini 3 Pro Image Preview) est un modèle IA de génération d'images proposé par Google, rapide. Fenêtre de contexte jusqu'à 66K tokens. Capacités : analyse d'images, accès API. Tarification : entrée $2/million de tokens, sortie $12/million de tokens. (Description officielle : Nano Banana Pro is Google’s most advanced image-generation and editing model, built on Gemini 3 Pro.) | $2.00 | $12.00 | 66K | Voir → | ||
OpenAI: GPT-5 Image Mini est un modèle IA de génération d'images proposé par OpenAI, rapide. Fenêtre de contexte jusqu'à 400K tokens. Capacités : analyse d'images, accès API. Tarification : entrée $2.5/million de tokens, sortie $2/million de tokens. (Description officielle : GPT-5 Image Mini combines OpenAI's advanced language capabilities, powered by GPT-5 Mini, with GPT Image 1 Mini for efficient image generation.) | OpenAI | $2.50 | $2.00 | 400K | Voir → | |
OpenAI: GPT-5.4 Image 2 est un modèle IA de génération d'images proposé par OpenAI, vitesse intermédiaire. Fenêtre de contexte jusqu'à 272K tokens. Capacités : analyse d'images, accès API. Tarification : entrée $8/million de tokens, sortie $15/million de tokens. (Description officielle : GPT-5.4 Image 2 combines OpenAI's GPT-5.4 model with state-of-the-art image generation capabilities from GPT Image 2.) | OpenAI | $8.00 | $15.00 | 272K | Voir → | |
OpenAI: GPT-5 Image est un modèle IA de génération d'images proposé par OpenAI, vitesse intermédiaire. Fenêtre de contexte jusqu'à 400K tokens. Capacités : analyse d'images, accès API. Tarification : entrée $10/million de tokens, sortie $10/million de tokens. (Description officielle : GPT-5 Image combines OpenAI's GPT-5 model with state-of-the-art image generation capabilities.) | OpenAI | $10.00 | $10.00 | 400K | Voir → | |
Midjourney v6 produit des images artistiques époustouflantes d'une qualité esthétique exceptionnelle. | Midjourney | Non basé sur les tokens | — | — | — | Voir → |
Stable Diffusion XL est le modèle open-source de référence pour la génération d'images en local. | Stability AI | Non basé sur les tokens | — | — | Voir → |
Génération de vidéos
Générez des vidéos à partir de texte ou d'images — parfait pour les publicités, le contenu court et l'assistance à la production cinématographique.
| Modèle | Fournisseur | Entrée /1M | Sortie /1M | Contexte | API | Détails |
|---|---|---|---|---|---|---|
SoraHot Sora génère des vidéos réalistes et créatives à partir de texte, jusqu'à 60 secondes. | OpenAI | Non basé sur les tokens | — | — | — | Voir → |
Kling AIHot Kling AI génère des vidéos de haute qualité avec des mouvements réalistes et des transitions fluides. | Kling AI | Non basé sur les tokens | — | — | Voir → | |
Veo 2 est le modèle vidéo avancé de Google, avec une qualité cinématographique et une compréhension physique. | Non basé sur les tokens | — | — | — | Voir → | |
Runway Gen-3 Alpha est un puissant modèle de génération vidéo avec accès API pour les développeurs. | Runway | Non basé sur les tokens | — | — | Voir → |