Compara modelos de IA,
Precios y rendimiento
Explora los mejores modelos de IA para código, escritura, generación de imágenes, vídeo, razonamiento y APIs.
Tabla de precios API
Por millón de tokens — USD. Haz clic en un modelo para ver detalles.
| Modelo | Proveedor | Categoría | Entrada /1M | Salida /1M | Contexto | API | Detalles |
|---|---|---|---|---|---|---|---|
| Modelos de diálogo | $0.10 | $0.40 | 1.0M | Ver → | |||
| DeepSeek | Modelos de código | $0.27 | $1.10 | 128K | Ver → | ||
| Alibaba | Modelos de código | $0.40 | $1.20 | 128K | Ver → | ||
| Moonshot | Modelos de razonamiento | $0.50 | $2.00 | 128K | Ver → | ||
| DeepSeek | Modelos de razonamiento | $0.55 | $2.19 | 128K | Ver → | ||
| Anthropic | Modelos de diálogo | $0.80 | $4.00 | 200K | Ver → | ||
| Modelos de razonamiento | $1.25 | $10.00 | 1.0M | Ver → | |||
GPT-4.1NEW | OpenAI | Modelos de diálogo | $2.00 | $8.00 | 1.0M | Ver → | |
| OpenAI | Modelos de diálogo | $2.50 | $10.00 | 128K | Ver → | ||
| Anthropic | Modelos de diálogo | $3.00 | $15.00 | 200K | Ver → | ||
| OpenAI | Modelos de razonamiento | $15.00 | $60.00 | 1.0M | Ver → | ||
| Anthropic | Modelos de razonamiento | $15.00 | $75.00 | 200K | Ver → |
Modelos de diálogo
Ideal para atención al cliente, conversación diaria, asistencia de oficina y creación de contenido — la capacidad de IA más versátil.
| Modelo | Proveedor | Entrada /1M | Salida /1M | Contexto | API | Detalles |
|---|---|---|---|---|---|---|
GPT-4oHot GPT-4o es un modelo multimodal rápido de OpenAI, optimizado para diálogo, código y análisis de imágenes. | OpenAI | $2.50 | $10.00 | 128K | Ver → | |
Body Builder (beta) es un modelo de IA de diálogo generalista desarrollado por Openrouter, con velocidad intermedia. Ventana de contexto de hasta 128K tokens. Capacidades: acceso API. Precio: entrada $-1000000/millón de tokens, salida $-1000000/millón de tokens. (Descripción oficial: Transform your natural language requests into structured OpenRouter API request objects.) | Openrouter | No basado en tokens | — | 128K | Ver → | |
IBM: Granite 4.0 Micro es un modelo de IA de diálogo generalista desarrollado por Ibm-granite, con velocidad intermedia. Ventana de contexto de hasta 131K tokens. Capacidades: acceso API. Precio: entrada $0.017/millón de tokens, salida $0.11/millón de tokens. (Descripción oficial: Granite-4.0-H-Micro is a 3B parameter from the Granite 4 family of models.) | Ibm-granite | $0.017 | $0.11 | 131K | Ver → | |
Meta: Llama 3.1 8B Instruct es un modelo de IA de diálogo generalista desarrollado por Meta, con velocidad intermedia. Ventana de contexto de hasta 16K tokens. Capacidades: uso de herramientas, acceso API. Precio: entrada $0.02/millón de tokens, salida $0.05/millón de tokens. (Descripción oficial: Meta's latest class of model (Llama 3.1) launched with a variety of sizes & flavors.) | Meta | $0.02 | $0.05 | 16K | Ver → | |
Mistral: Mistral Nemo es un modelo de IA de diálogo generalista desarrollado por Mistral AI, con velocidad intermedia. Ventana de contexto de hasta 131K tokens. Capacidades: uso de herramientas, acceso API. Precio: entrada $0.02/millón de tokens, salida $0.03/millón de tokens. (Descripción oficial: A 12B parameter model with a 128k token context length built by Mistral in collaboration with NVIDIA.) | Mistral AI | $0.02 | $0.03 | 131K | Ver → | |
Meta: Llama 3.2 1B Instruct es un modelo de IA de diálogo generalista desarrollado por Meta, con velocidad intermedia. Ventana de contexto de hasta 60K tokens. Capacidades: acceso API. Precio: entrada $0.027/millón de tokens, salida $0.2/millón de tokens. (Descripción oficial: Llama 3.2 1B is a 1-billion-parameter language model focused on efficiently performing natural language tasks, such as summarization, dialogue, and multilingual text analysis.) | Meta | $0.027 | $0.20 | 60K | Ver → | |
LiquidAI: LFM2-24B-A2B es un modelo de IA de diálogo generalista desarrollado por Liquid AI, con velocidad intermedia. Ventana de contexto de hasta 33K tokens. Capacidades: acceso API. Precio: entrada $0.03/millón de tokens, salida $0.12/millón de tokens. (Descripción oficial: LFM2-24B-A2B is the largest model in the LFM2 family of hybrid architectures designed for efficient on-device deployment.) | Liquid AI | $0.03 | $0.12 | 33K | Ver → | |
OpenAI: gpt-oss-20b es un modelo de IA de diálogo generalista desarrollado por OpenAI, con velocidad intermedia. Ventana de contexto de hasta 131K tokens. Capacidades: uso de herramientas, acceso API. Precio: entrada $0.03/millón de tokens, salida $0.14/millón de tokens. (Descripción oficial: gpt-oss-20b is an open-weight 21B parameter model released by OpenAI under the Apache 2.0 license.) | OpenAI | $0.03 | $0.14 | 131K | Ver → | |
Qwen: Qwen-Turbo es un modelo de IA de diálogo generalista desarrollado por Alibaba, con respuesta rápida. Ventana de contexto de hasta 131K tokens. Capacidades: uso de herramientas, acceso API. Precio: entrada $0.0325/millón de tokens, salida $0.13/millón de tokens. (Descripción oficial: Qwen-Turbo, based on Qwen2.5, is a 1M context model that provides fast speed and low cost, suitable for simple tasks.) | Alibaba | $0.0325 | $0.13 | 131K | Ver → | |
Amazon: Nova Micro 1.0 es un modelo de IA de diálogo generalista desarrollado por Amazon, con velocidad intermedia. Ventana de contexto de hasta 128K tokens. Capacidades: uso de herramientas, acceso API. Precio: entrada $0.035/millón de tokens, salida $0.14/millón de tokens. (Descripción oficial: Amazon Nova Micro 1.0 is a text-only model that delivers the lowest latency responses in the Amazon Nova family of models at a very low cost.) | Amazon | $0.035 | $0.14 | 128K | Ver → | |
Cohere: Command R7B (12-2024) es un modelo de IA de diálogo generalista desarrollado por Cohere, con velocidad intermedia. Ventana de contexto de hasta 128K tokens. Capacidades: acceso API. Precio: entrada $0.0375/millón de tokens, salida $0.15/millón de tokens. (Descripción oficial: Command R7B (12-2024) is a small, fast update of the Command R+ model, delivered in December 2024.) | Cohere | $0.0375 | $0.15 | 128K | Ver → | |
OpenAI: gpt-oss-120b es un modelo de IA de diálogo generalista desarrollado por OpenAI, con velocidad intermedia. Ventana de contexto de hasta 131K tokens. Capacidades: uso de herramientas, acceso API. Precio: entrada $0.039/millón de tokens, salida $0.18/millón de tokens. (Descripción oficial: gpt-oss-120b is an open-weight, 117B-parameter Mixture-of-Experts (MoE) language model from OpenAI designed for high-reasoning, agentic, and general-purpose production use cases.) | OpenAI | $0.039 | $0.18 | 131K | Ver → |
Modelos de código
Optimizado para desarrollo de software: generación de código, depuración, revisión de código y documentación técnica.
| Modelo | Proveedor | Entrada /1M | Salida /1M | Contexto | API | Detalles |
|---|---|---|---|---|---|---|
DeepSeek V3Hot DeepSeek V3 es un modelo MoE muy competitivo para código y razonamiento general a bajo coste. | DeepSeek | $0.27 | $1.10 | 128K | Ver → | |
Pareto Code Router es un modelo de IA de generación de código desarrollado por Openrouter, con velocidad intermedia. Ventana de contexto de hasta 2M tokens. Capacidades: acceso API. Precio: entrada $-1000000/millón de tokens, salida $-1000000/millón de tokens. (Descripción oficial: The Pareto Router maintains a tiered shortlist of strong coding models, ranked by Artificial Analysis coding percentiles.) | Openrouter | No basado en tokens | — | 2.0M | Ver → | |
Qwen: Qwen3 Coder 30B A3B Instruct es un modelo de IA de generación de código desarrollado por Alibaba, con velocidad intermedia. Ventana de contexto de hasta 160K tokens. Capacidades: uso de herramientas, acceso API. Precio: entrada $0.07/millón de tokens, salida $0.27/millón de tokens. (Descripción oficial: Qwen3-Coder-30B-A3B-Instruct is a 30.5B parameter Mixture-of-Experts (MoE) model with 128 experts (8 active per forward pass), designed for advanced code generation, repository-scale understanding, and agentic tool use.) | Alibaba | $0.07 | $0.27 | 160K | Ver → | |
Qwen: Qwen3 Coder Next es un modelo de IA de generación de código desarrollado por Alibaba, con velocidad intermedia. Ventana de contexto de hasta 262K tokens. Capacidades: uso de herramientas, acceso API. Precio: entrada $0.11/millón de tokens, salida $0.8/millón de tokens. (Descripción oficial: Qwen3-Coder-Next is an open-weight causal language model optimized for coding agents and local development workflows.) | Alibaba | $0.11 | $0.80 | 262K | Ver → | |
Qwen: Qwen3 Coder Flash es un modelo de IA de generación de código desarrollado por Alibaba, con respuesta rápida. Ventana de contexto de hasta 1M tokens. Capacidades: uso de herramientas, acceso API. Precio: entrada $0.195/millón de tokens, salida $0.975/millón de tokens. (Descripción oficial: Qwen3 Coder Flash is Alibaba's fast and cost efficient version of their proprietary Qwen3 Coder Plus.) | Alibaba | $0.195 | $0.975 | 1.0M | Ver → | |
xAI: Grok Code Fast 1 es un modelo de IA de generación de código desarrollado por xAI, con respuesta rápida. Ventana de contexto de hasta 256K tokens. Capacidades: uso de herramientas, acceso API. Precio: entrada $0.2/millón de tokens, salida $1.5/millón de tokens. (Descripción oficial: Grok Code Fast 1 is a speedy and economical reasoning model that excels at agentic coding.) | xAI | $0.20 | $1.50 | 256K | Ver → | |
Qwen: Qwen3 Coder 480B A35B es un modelo de IA de generación de código desarrollado por Alibaba, con velocidad intermedia. Ventana de contexto de hasta 262K tokens. Capacidades: uso de herramientas, acceso API. Precio: entrada $0.22/millón de tokens, salida $1.8/millón de tokens. (Descripción oficial: Qwen3-Coder-480B-A35B-Instruct is a Mixture-of-Experts (MoE) code generation model developed by the Qwen team.) | Alibaba | $0.22 | $1.80 | 262K | Ver → | |
Kwaipilot: KAT-Coder-Pro V2 es un modelo de IA de generación de código desarrollado por Kwaipilot, con velocidad intermedia. Ventana de contexto de hasta 256K tokens. Capacidades: uso de herramientas, acceso API. Precio: entrada $0.3/millón de tokens, salida $1.2/millón de tokens. (Descripción oficial: KAT-Coder-Pro V2 is the latest high-performance model in KwaiKAT’s KAT-Coder series, designed for complex enterprise-grade software engineering and SaaS integration.) | Kwaipilot | $0.30 | $1.20 | 256K | Ver → | |
Mistral: Codestral 2508 es un modelo de IA de generación de código desarrollado por Mistral AI, con velocidad intermedia. Ventana de contexto de hasta 256K tokens. Capacidades: uso de herramientas, acceso API. Precio: entrada $0.3/millón de tokens, salida $0.9/millón de tokens. (Descripción oficial: Mistral's cutting-edge language model for coding released end of July 2025.) | Mistral AI | $0.30 | $0.90 | 256K | Ver → | |
Qwen 2.5 72B es el modelo open-source insignia de Alibaba, con excelentes capacidades multilingüe y de código. | Alibaba | $0.40 | $1.20 | 128K | Ver → | |
Arcee AI: Coder Large es un modelo de IA de generación de código desarrollado por Arcee-ai, con más lento pero más potente. Ventana de contexto de hasta 33K tokens. Capacidades: acceso API. Precio: entrada $0.5/millón de tokens, salida $0.8/millón de tokens. (Descripción oficial: Coder‑Large is a 32 B‑parameter offspring of Qwen 2.5‑Instruct that has been further trained on permissively‑licensed GitHub, CodeSearchNet and synthetic bug‑fix corpora.) | Arcee-ai | $0.50 | $0.80 | 33K | Ver → | |
Qwen: Qwen3 Coder Plus es un modelo de IA de generación de código desarrollado por Alibaba, con más lento pero más potente. Ventana de contexto de hasta 1M tokens. Capacidades: uso de herramientas, acceso API. Precio: entrada $0.65/millón de tokens, salida $3.25/millón de tokens. (Descripción oficial: Qwen3 Coder Plus is Alibaba's proprietary version of the Open Source Qwen3 Coder 480B A35B.) | Alibaba | $0.65 | $3.25 | 1.0M | Ver → |
Modelos de razonamiento
Razonamiento lógico avanzado para matemáticas, ciencias, análisis complejos y planificación estratégica.
| Modelo | Proveedor | Entrada /1M | Salida /1M | Contexto | API | Detalles |
|---|---|---|---|---|---|---|
DeepSeek R1Hot DeepSeek R1 es un modelo de razonamiento por cadena de pensamiento que rivaliza con o1 a una fracción del precio. | DeepSeek | $0.55 | $2.19 | 128K | Ver → | |
Gemini 2.5 Pro es el modelo estrella de Google con un millón de tokens de contexto nativo y razonamiento de vanguardia. | $1.25 | $10.00 | 1.0M | Ver → | ||
GPT-5 es el modelo más potente de OpenAI, combinando razonamiento avanzado y comprensión multimodal. | OpenAI | $15.00 | $60.00 | 1.0M | Ver → | |
Claude Opus es el modelo más inteligente de Anthropic, diseñado para razonamiento complejo y tareas agénticas. | Anthropic | $15.00 | $75.00 | 200K | Ver → | |
Baidu: ERNIE 4.5 21B A3B Thinking es un modelo de IA de razonamiento avanzado desarrollado por Baidu, con velocidad intermedia. Ventana de contexto de hasta 131K tokens. Capacidades: acceso API. Precio: entrada $0.07/millón de tokens, salida $0.28/millón de tokens. (Descripción oficial: ERNIE-4.5-21B-A3B-Thinking is Baidu's upgraded lightweight MoE model, refined to boost reasoning depth and quality for top-tier performance in logical puzzles, math, science, coding, text generation, and expert-level academic benchmarks.) | Baidu | $0.07 | $0.28 | 131K | Ver → | |
Qwen: Qwen3 30B A3B Thinking 2507 es un modelo de IA de razonamiento avanzado desarrollado por Alibaba, con velocidad intermedia. Ventana de contexto de hasta 131K tokens. Capacidades: uso de herramientas, acceso API. Precio: entrada $0.08/millón de tokens, salida $0.4/millón de tokens. (Descripción oficial: Qwen3-30B-A3B-Thinking-2507 is a 30B parameter Mixture-of-Experts reasoning model optimized for complex tasks requiring extended multi-step thinking.) | Alibaba | $0.08 | $0.40 | 131K | Ver → | |
Qwen: Qwen3 Next 80B A3B Thinking es un modelo de IA de razonamiento avanzado desarrollado por Alibaba, con velocidad intermedia. Ventana de contexto de hasta 131K tokens. Capacidades: uso de herramientas, acceso API. Precio: entrada $0.0975/millón de tokens, salida $0.78/millón de tokens. (Descripción oficial: Qwen3-Next-80B-A3B-Thinking is a reasoning-first chat model in the Qwen3-Next line that outputs structured “thinking” traces by default.) | Alibaba | $0.0975 | $0.78 | 131K | Ver → | |
Qwen: Qwen3 VL 8B Thinking es un modelo de IA de razonamiento avanzado desarrollado por Alibaba, con velocidad intermedia. Ventana de contexto de hasta 131K tokens. Capacidades: análisis de imágenes, uso de herramientas, acceso API. Precio: entrada $0.117/millón de tokens, salida $1.365/millón de tokens. (Descripción oficial: Qwen3-VL-8B-Thinking is the reasoning-optimized variant of the Qwen3-VL-8B multimodal model, designed for advanced visual and textual reasoning across complex scenes, documents, and temporal sequences.) | Alibaba | $0.117 | $1.365 | 131K | Ver → | |
Qwen: Qwen3 VL 30B A3B Thinking es un modelo de IA de razonamiento avanzado desarrollado por Alibaba, con velocidad intermedia. Ventana de contexto de hasta 131K tokens. Capacidades: análisis de imágenes, uso de herramientas, acceso API. Precio: entrada $0.13/millón de tokens, salida $1.56/millón de tokens. (Descripción oficial: Qwen3-VL-30B-A3B-Thinking is a multimodal model that unifies strong text generation with visual understanding for images and videos.) | Alibaba | $0.13 | $1.56 | 131K | Ver → | |
Qwen: Qwen3 235B A22B Thinking 2507 es un modelo de IA de razonamiento avanzado desarrollado por Alibaba, con velocidad intermedia. Ventana de contexto de hasta 131K tokens. Capacidades: uso de herramientas, acceso API. Precio: entrada $0.1495/millón de tokens, salida $1.495/millón de tokens. (Descripción oficial: Qwen3-235B-A22B-Thinking-2507 is a high-performance, open-weight Mixture-of-Experts (MoE) language model optimized for complex reasoning tasks.) | Alibaba | $0.1495 | $1.495 | 131K | Ver → | |
Arcee AI: Trinity Large Thinking es un modelo de IA de razonamiento avanzado desarrollado por Arcee-ai, con más lento pero más potente. Ventana de contexto de hasta 262K tokens. Capacidades: uso de herramientas, acceso API. Precio: entrada $0.22/millón de tokens, salida $0.85/millón de tokens. (Descripción oficial: Trinity Large Thinking is a powerful open source reasoning model from the team at Arcee AI.) | Arcee-ai | $0.22 | $0.85 | 262K | Ver → | |
Qwen: Qwen Plus 0728 (thinking) es un modelo de IA de razonamiento avanzado desarrollado por Alibaba, con más lento pero más potente. Ventana de contexto de hasta 1M tokens. Capacidades: uso de herramientas, acceso API. Precio: entrada $0.26/millón de tokens, salida $0.78/millón de tokens. (Descripción oficial: Qwen Plus 0728, based on the Qwen3 foundation model, is a 1 million context hybrid reasoning model with a balanced performance, speed, and cost combination.) | Alibaba | $0.26 | $0.78 | 1.0M | Ver → |
Generación de imágenes
Genera imágenes de alta calidad a partir de descripciones de texto — ideal para diseño, publicidad, ilustración y arte.
| Modelo | Proveedor | Entrada /1M | Salida /1M | Contexto | API | Detalles |
|---|---|---|---|---|---|---|
FLUX.1Hot FLUX.1 es un modelo de generación de imágenes de vanguardia, reconocido por su fotorrealismo y precisión. | Black Forest Labs | No basado en tokens | — | — | Ver → | |
Auto Router es un modelo de IA de generación de imágenes desarrollado por Openrouter, con velocidad intermedia. Ventana de contexto de hasta 2M tokens. Capacidades: análisis de imágenes, uso de herramientas, acceso API. Precio: entrada $-1000000/millón de tokens, salida $-1000000/millón de tokens. (Descripción oficial: Your prompt will be processed by a meta-model and routed to one of dozens of models (see below), optimizing for the best possible output.) | Openrouter | No basado en tokens | — | 2.0M | Ver → | |
Google: Nano Banana (Gemini 2.5 Flash Image) es un modelo de IA de generación de imágenes desarrollado por Google, con respuesta rápida. Ventana de contexto de hasta 33K tokens. Capacidades: análisis de imágenes, acceso API. Precio: entrada $0.3/millón de tokens, salida $2.5/millón de tokens. (Descripción oficial: Gemini 2.5 Flash Image, a.k.a.) | $0.30 | $2.50 | 33K | Ver → | ||
Google: Nano Banana 2 (Gemini 3.1 Flash Image Preview) es un modelo de IA de generación de imágenes desarrollado por Google, con respuesta rápida. Ventana de contexto de hasta 66K tokens. Capacidades: análisis de imágenes, acceso API. Precio: entrada $0.5/millón de tokens, salida $3/millón de tokens. (Descripción oficial: Gemini 3.1 Flash Image Preview, a.k.a.) | $0.50 | $3.00 | 66K | Ver → | ||
Google: Nano Banana Pro (Gemini 3 Pro Image Preview) es un modelo de IA de generación de imágenes desarrollado por Google, con respuesta rápida. Ventana de contexto de hasta 66K tokens. Capacidades: análisis de imágenes, acceso API. Precio: entrada $2/millón de tokens, salida $12/millón de tokens. (Descripción oficial: Nano Banana Pro is Google’s most advanced image-generation and editing model, built on Gemini 3 Pro.) | $2.00 | $12.00 | 66K | Ver → | ||
OpenAI: GPT-5 Image Mini es un modelo de IA de generación de imágenes desarrollado por OpenAI, con respuesta rápida. Ventana de contexto de hasta 400K tokens. Capacidades: análisis de imágenes, acceso API. Precio: entrada $2.5/millón de tokens, salida $2/millón de tokens. (Descripción oficial: GPT-5 Image Mini combines OpenAI's advanced language capabilities, powered by GPT-5 Mini, with GPT Image 1 Mini for efficient image generation.) | OpenAI | $2.50 | $2.00 | 400K | Ver → | |
OpenAI: GPT-5.4 Image 2 es un modelo de IA de generación de imágenes desarrollado por OpenAI, con velocidad intermedia. Ventana de contexto de hasta 272K tokens. Capacidades: análisis de imágenes, acceso API. Precio: entrada $8/millón de tokens, salida $15/millón de tokens. (Descripción oficial: GPT-5.4 Image 2 combines OpenAI's GPT-5.4 model with state-of-the-art image generation capabilities from GPT Image 2.) | OpenAI | $8.00 | $15.00 | 272K | Ver → | |
OpenAI: GPT-5 Image es un modelo de IA de generación de imágenes desarrollado por OpenAI, con velocidad intermedia. Ventana de contexto de hasta 400K tokens. Capacidades: análisis de imágenes, acceso API. Precio: entrada $10/millón de tokens, salida $10/millón de tokens. (Descripción oficial: GPT-5 Image combines OpenAI's GPT-5 model with state-of-the-art image generation capabilities.) | OpenAI | $10.00 | $10.00 | 400K | Ver → | |
Midjourney v6 produce imágenes artísticas impresionantes con una calidad estética excepcional. | Midjourney | No basado en tokens | — | — | — | Ver → |
Stable Diffusion XL es el modelo open-source de referencia para generación de imágenes en local. | Stability AI | No basado en tokens | — | — | Ver → |
Generación de vídeo
Genera vídeos a partir de texto o imágenes — perfecto para anuncios, contenido corto y asistencia en producción cinematográfica.
| Modelo | Proveedor | Entrada /1M | Salida /1M | Contexto | API | Detalles |
|---|---|---|---|---|---|---|
SoraHot Sora genera vídeos realistas y creativos a partir de texto, de hasta 60 segundos. | OpenAI | No basado en tokens | — | — | — | Ver → |
Kling AIHot Kling AI genera vídeos de alta calidad con movimientos realistas y transiciones fluidas. | Kling AI | No basado en tokens | — | — | Ver → | |
Veo 2 es el modelo de vídeo avanzado de Google, con calidad cinematográfica y comprensión física. | No basado en tokens | — | — | — | Ver → | |
Runway Gen-3 Alpha es un potente modelo de generación de vídeo con acceso API para desarrolladores. | Runway | No basado en tokens | — | — | Ver → |