Compare modelos de IA,
Preços e desempenho
Explore os melhores modelos de IA para código, escrita, geração de imagens, vídeo, raciocínio e APIs.
Tabela de preços API
Por milhão de tokens — USD. Clique num modelo para ver detalhes.
| Modelo | Fornecedor | Categoria | Entrada /1M | Saída /1M | Contexto | API | Detalhes |
|---|---|---|---|---|---|---|---|
| Modelos de diálogo | $0.10 | $0.40 | 1.0M | Ver → | |||
| DeepSeek | Modelos de código | $0.27 | $1.10 | 128K | Ver → | ||
| Alibaba | Modelos de código | $0.40 | $1.20 | 128K | Ver → | ||
| Moonshot | Modelos de raciocínio | $0.50 | $2.00 | 128K | Ver → | ||
| DeepSeek | Modelos de raciocínio | $0.55 | $2.19 | 128K | Ver → | ||
| Anthropic | Modelos de diálogo | $0.80 | $4.00 | 200K | Ver → | ||
| Modelos de raciocínio | $1.25 | $10.00 | 1.0M | Ver → | |||
GPT-4.1NEW | OpenAI | Modelos de diálogo | $2.00 | $8.00 | 1.0M | Ver → | |
| OpenAI | Modelos de diálogo | $2.50 | $10.00 | 128K | Ver → | ||
| Anthropic | Modelos de diálogo | $3.00 | $15.00 | 200K | Ver → | ||
| OpenAI | Modelos de raciocínio | $15.00 | $60.00 | 1.0M | Ver → | ||
| Anthropic | Modelos de raciocínio | $15.00 | $75.00 | 200K | Ver → |
Modelos de diálogo
Ideal para atendimento ao cliente, conversa diária, assistência de escritório e criação de conteúdo — a capacidade de IA mais versátil.
| Modelo | Fornecedor | Entrada /1M | Saída /1M | Contexto | API | Detalhes |
|---|---|---|---|---|---|---|
GPT-4oHot GPT-4o é um modelo multimodal rápido da OpenAI, otimizado para diálogo, código e análise de imagens. | OpenAI | $2.50 | $10.00 | 128K | Ver → | |
Body Builder (beta) é um modelo de IA de diálogo generalista desenvolvido pela Openrouter, com velocidade intermédia. Janela de contexto até 128K tokens. Capacidades: acesso API. Preço: entrada $-1000000/milhão de tokens, saída $-1000000/milhão de tokens. (Descrição oficial: Transform your natural language requests into structured OpenRouter API request objects.) | Openrouter | Não baseado em tokens | — | 128K | Ver → | |
IBM: Granite 4.0 Micro é um modelo de IA de diálogo generalista desenvolvido pela Ibm-granite, com velocidade intermédia. Janela de contexto até 131K tokens. Capacidades: acesso API. Preço: entrada $0.017/milhão de tokens, saída $0.11/milhão de tokens. (Descrição oficial: Granite-4.0-H-Micro is a 3B parameter from the Granite 4 family of models.) | Ibm-granite | $0.017 | $0.11 | 131K | Ver → | |
Meta: Llama 3.1 8B Instruct é um modelo de IA de diálogo generalista desenvolvido pela Meta, com velocidade intermédia. Janela de contexto até 16K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.02/milhão de tokens, saída $0.05/milhão de tokens. (Descrição oficial: Meta's latest class of model (Llama 3.1) launched with a variety of sizes & flavors.) | Meta | $0.02 | $0.05 | 16K | Ver → | |
Mistral: Mistral Nemo é um modelo de IA de diálogo generalista desenvolvido pela Mistral AI, com velocidade intermédia. Janela de contexto até 131K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.02/milhão de tokens, saída $0.03/milhão de tokens. (Descrição oficial: A 12B parameter model with a 128k token context length built by Mistral in collaboration with NVIDIA.) | Mistral AI | $0.02 | $0.03 | 131K | Ver → | |
Meta: Llama 3.2 1B Instruct é um modelo de IA de diálogo generalista desenvolvido pela Meta, com velocidade intermédia. Janela de contexto até 60K tokens. Capacidades: acesso API. Preço: entrada $0.027/milhão de tokens, saída $0.2/milhão de tokens. (Descrição oficial: Llama 3.2 1B is a 1-billion-parameter language model focused on efficiently performing natural language tasks, such as summarization, dialogue, and multilingual text analysis.) | Meta | $0.027 | $0.20 | 60K | Ver → | |
LiquidAI: LFM2-24B-A2B é um modelo de IA de diálogo generalista desenvolvido pela Liquid AI, com velocidade intermédia. Janela de contexto até 33K tokens. Capacidades: acesso API. Preço: entrada $0.03/milhão de tokens, saída $0.12/milhão de tokens. (Descrição oficial: LFM2-24B-A2B is the largest model in the LFM2 family of hybrid architectures designed for efficient on-device deployment.) | Liquid AI | $0.03 | $0.12 | 33K | Ver → | |
OpenAI: gpt-oss-20b é um modelo de IA de diálogo generalista desenvolvido pela OpenAI, com velocidade intermédia. Janela de contexto até 131K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.03/milhão de tokens, saída $0.14/milhão de tokens. (Descrição oficial: gpt-oss-20b is an open-weight 21B parameter model released by OpenAI under the Apache 2.0 license.) | OpenAI | $0.03 | $0.14 | 131K | Ver → | |
Qwen: Qwen-Turbo é um modelo de IA de diálogo generalista desenvolvido pela Alibaba, com resposta rápida. Janela de contexto até 131K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.0325/milhão de tokens, saída $0.13/milhão de tokens. (Descrição oficial: Qwen-Turbo, based on Qwen2.5, is a 1M context model that provides fast speed and low cost, suitable for simple tasks.) | Alibaba | $0.0325 | $0.13 | 131K | Ver → | |
Amazon: Nova Micro 1.0 é um modelo de IA de diálogo generalista desenvolvido pela Amazon, com velocidade intermédia. Janela de contexto até 128K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.035/milhão de tokens, saída $0.14/milhão de tokens. (Descrição oficial: Amazon Nova Micro 1.0 is a text-only model that delivers the lowest latency responses in the Amazon Nova family of models at a very low cost.) | Amazon | $0.035 | $0.14 | 128K | Ver → | |
Cohere: Command R7B (12-2024) é um modelo de IA de diálogo generalista desenvolvido pela Cohere, com velocidade intermédia. Janela de contexto até 128K tokens. Capacidades: acesso API. Preço: entrada $0.0375/milhão de tokens, saída $0.15/milhão de tokens. (Descrição oficial: Command R7B (12-2024) is a small, fast update of the Command R+ model, delivered in December 2024.) | Cohere | $0.0375 | $0.15 | 128K | Ver → | |
OpenAI: gpt-oss-120b é um modelo de IA de diálogo generalista desenvolvido pela OpenAI, com velocidade intermédia. Janela de contexto até 131K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.039/milhão de tokens, saída $0.18/milhão de tokens. (Descrição oficial: gpt-oss-120b is an open-weight, 117B-parameter Mixture-of-Experts (MoE) language model from OpenAI designed for high-reasoning, agentic, and general-purpose production use cases.) | OpenAI | $0.039 | $0.18 | 131K | Ver → |
Modelos de código
Otimizado para desenvolvimento de software: geração de código, depuração, revisão de código e documentação técnica.
| Modelo | Fornecedor | Entrada /1M | Saída /1M | Contexto | API | Detalhes |
|---|---|---|---|---|---|---|
DeepSeek V3Hot DeepSeek V3 é um modelo MoE muito competitivo para código e raciocínio geral a baixo custo. | DeepSeek | $0.27 | $1.10 | 128K | Ver → | |
Pareto Code Router é um modelo de IA de geração de código desenvolvido pela Openrouter, com velocidade intermédia. Janela de contexto até 2M tokens. Capacidades: acesso API. Preço: entrada $-1000000/milhão de tokens, saída $-1000000/milhão de tokens. (Descrição oficial: The Pareto Router maintains a tiered shortlist of strong coding models, ranked by Artificial Analysis coding percentiles.) | Openrouter | Não baseado em tokens | — | 2.0M | Ver → | |
Qwen: Qwen3 Coder 30B A3B Instruct é um modelo de IA de geração de código desenvolvido pela Alibaba, com velocidade intermédia. Janela de contexto até 160K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.07/milhão de tokens, saída $0.27/milhão de tokens. (Descrição oficial: Qwen3-Coder-30B-A3B-Instruct is a 30.5B parameter Mixture-of-Experts (MoE) model with 128 experts (8 active per forward pass), designed for advanced code generation, repository-scale understanding, and agentic tool use.) | Alibaba | $0.07 | $0.27 | 160K | Ver → | |
Qwen: Qwen3 Coder Next é um modelo de IA de geração de código desenvolvido pela Alibaba, com velocidade intermédia. Janela de contexto até 262K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.11/milhão de tokens, saída $0.8/milhão de tokens. (Descrição oficial: Qwen3-Coder-Next is an open-weight causal language model optimized for coding agents and local development workflows.) | Alibaba | $0.11 | $0.80 | 262K | Ver → | |
Qwen: Qwen3 Coder Flash é um modelo de IA de geração de código desenvolvido pela Alibaba, com resposta rápida. Janela de contexto até 1M tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.195/milhão de tokens, saída $0.975/milhão de tokens. (Descrição oficial: Qwen3 Coder Flash is Alibaba's fast and cost efficient version of their proprietary Qwen3 Coder Plus.) | Alibaba | $0.195 | $0.975 | 1.0M | Ver → | |
xAI: Grok Code Fast 1 é um modelo de IA de geração de código desenvolvido pela xAI, com resposta rápida. Janela de contexto até 256K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.2/milhão de tokens, saída $1.5/milhão de tokens. (Descrição oficial: Grok Code Fast 1 is a speedy and economical reasoning model that excels at agentic coding.) | xAI | $0.20 | $1.50 | 256K | Ver → | |
Qwen: Qwen3 Coder 480B A35B é um modelo de IA de geração de código desenvolvido pela Alibaba, com velocidade intermédia. Janela de contexto até 262K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.22/milhão de tokens, saída $1.8/milhão de tokens. (Descrição oficial: Qwen3-Coder-480B-A35B-Instruct is a Mixture-of-Experts (MoE) code generation model developed by the Qwen team.) | Alibaba | $0.22 | $1.80 | 262K | Ver → | |
Kwaipilot: KAT-Coder-Pro V2 é um modelo de IA de geração de código desenvolvido pela Kwaipilot, com velocidade intermédia. Janela de contexto até 256K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.3/milhão de tokens, saída $1.2/milhão de tokens. (Descrição oficial: KAT-Coder-Pro V2 is the latest high-performance model in KwaiKAT’s KAT-Coder series, designed for complex enterprise-grade software engineering and SaaS integration.) | Kwaipilot | $0.30 | $1.20 | 256K | Ver → | |
Mistral: Codestral 2508 é um modelo de IA de geração de código desenvolvido pela Mistral AI, com velocidade intermédia. Janela de contexto até 256K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.3/milhão de tokens, saída $0.9/milhão de tokens. (Descrição oficial: Mistral's cutting-edge language model for coding released end of July 2025.) | Mistral AI | $0.30 | $0.90 | 256K | Ver → | |
Qwen 2.5 72B é o modelo open-source insignia da Alibaba, com excelentes capacidades multilingue e de código. | Alibaba | $0.40 | $1.20 | 128K | Ver → | |
Arcee AI: Coder Large é um modelo de IA de geração de código desenvolvido pela Arcee-ai, com mais lento mas mais potente. Janela de contexto até 33K tokens. Capacidades: acesso API. Preço: entrada $0.5/milhão de tokens, saída $0.8/milhão de tokens. (Descrição oficial: Coder‑Large is a 32 B‑parameter offspring of Qwen 2.5‑Instruct that has been further trained on permissively‑licensed GitHub, CodeSearchNet and synthetic bug‑fix corpora.) | Arcee-ai | $0.50 | $0.80 | 33K | Ver → | |
Qwen: Qwen3 Coder Plus é um modelo de IA de geração de código desenvolvido pela Alibaba, com mais lento mas mais potente. Janela de contexto até 1M tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.65/milhão de tokens, saída $3.25/milhão de tokens. (Descrição oficial: Qwen3 Coder Plus is Alibaba's proprietary version of the Open Source Qwen3 Coder 480B A35B.) | Alibaba | $0.65 | $3.25 | 1.0M | Ver → |
Modelos de raciocínio
Raciocínio lógico avançado para matemática, ciências, análises complexas e planeamento estratégico.
| Modelo | Fornecedor | Entrada /1M | Saída /1M | Contexto | API | Detalhes |
|---|---|---|---|---|---|---|
DeepSeek R1Hot DeepSeek R1 é um modelo de raciocínio por cadeia de pensamento que rivaliza com o o1 a uma fração do preço. | DeepSeek | $0.55 | $2.19 | 128K | Ver → | |
Gemini 2.5 Pro é o modelo estrela do Google com um milhão de tokens de contexto nativo e raciocínio de ponta. | $1.25 | $10.00 | 1.0M | Ver → | ||
GPT-5 é o modelo mais potente da OpenAI, combinando raciocínio avançado e compreensão multimodal. | OpenAI | $15.00 | $60.00 | 1.0M | Ver → | |
Claude Opus é o modelo mais inteligente da Anthropic, concebido para raciocínio complexo e tarefas agênticas. | Anthropic | $15.00 | $75.00 | 200K | Ver → | |
Baidu: ERNIE 4.5 21B A3B Thinking é um modelo de IA de raciocínio avançado desenvolvido pela Baidu, com velocidade intermédia. Janela de contexto até 131K tokens. Capacidades: acesso API. Preço: entrada $0.07/milhão de tokens, saída $0.28/milhão de tokens. (Descrição oficial: ERNIE-4.5-21B-A3B-Thinking is Baidu's upgraded lightweight MoE model, refined to boost reasoning depth and quality for top-tier performance in logical puzzles, math, science, coding, text generation, and expert-level academic benchmarks.) | Baidu | $0.07 | $0.28 | 131K | Ver → | |
Qwen: Qwen3 30B A3B Thinking 2507 é um modelo de IA de raciocínio avançado desenvolvido pela Alibaba, com velocidade intermédia. Janela de contexto até 131K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.08/milhão de tokens, saída $0.4/milhão de tokens. (Descrição oficial: Qwen3-30B-A3B-Thinking-2507 is a 30B parameter Mixture-of-Experts reasoning model optimized for complex tasks requiring extended multi-step thinking.) | Alibaba | $0.08 | $0.40 | 131K | Ver → | |
Qwen: Qwen3 Next 80B A3B Thinking é um modelo de IA de raciocínio avançado desenvolvido pela Alibaba, com velocidade intermédia. Janela de contexto até 131K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.0975/milhão de tokens, saída $0.78/milhão de tokens. (Descrição oficial: Qwen3-Next-80B-A3B-Thinking is a reasoning-first chat model in the Qwen3-Next line that outputs structured “thinking” traces by default.) | Alibaba | $0.0975 | $0.78 | 131K | Ver → | |
Qwen: Qwen3 VL 8B Thinking é um modelo de IA de raciocínio avançado desenvolvido pela Alibaba, com velocidade intermédia. Janela de contexto até 131K tokens. Capacidades: análise de imagens, uso de ferramentas, acesso API. Preço: entrada $0.117/milhão de tokens, saída $1.365/milhão de tokens. (Descrição oficial: Qwen3-VL-8B-Thinking is the reasoning-optimized variant of the Qwen3-VL-8B multimodal model, designed for advanced visual and textual reasoning across complex scenes, documents, and temporal sequences.) | Alibaba | $0.117 | $1.365 | 131K | Ver → | |
Qwen: Qwen3 VL 30B A3B Thinking é um modelo de IA de raciocínio avançado desenvolvido pela Alibaba, com velocidade intermédia. Janela de contexto até 131K tokens. Capacidades: análise de imagens, uso de ferramentas, acesso API. Preço: entrada $0.13/milhão de tokens, saída $1.56/milhão de tokens. (Descrição oficial: Qwen3-VL-30B-A3B-Thinking is a multimodal model that unifies strong text generation with visual understanding for images and videos.) | Alibaba | $0.13 | $1.56 | 131K | Ver → | |
Qwen: Qwen3 235B A22B Thinking 2507 é um modelo de IA de raciocínio avançado desenvolvido pela Alibaba, com velocidade intermédia. Janela de contexto até 131K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.1495/milhão de tokens, saída $1.495/milhão de tokens. (Descrição oficial: Qwen3-235B-A22B-Thinking-2507 is a high-performance, open-weight Mixture-of-Experts (MoE) language model optimized for complex reasoning tasks.) | Alibaba | $0.1495 | $1.495 | 131K | Ver → | |
Arcee AI: Trinity Large Thinking é um modelo de IA de raciocínio avançado desenvolvido pela Arcee-ai, com mais lento mas mais potente. Janela de contexto até 262K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.22/milhão de tokens, saída $0.85/milhão de tokens. (Descrição oficial: Trinity Large Thinking is a powerful open source reasoning model from the team at Arcee AI.) | Arcee-ai | $0.22 | $0.85 | 262K | Ver → | |
Qwen: Qwen Plus 0728 (thinking) é um modelo de IA de raciocínio avançado desenvolvido pela Alibaba, com mais lento mas mais potente. Janela de contexto até 1M tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.26/milhão de tokens, saída $0.78/milhão de tokens. (Descrição oficial: Qwen Plus 0728, based on the Qwen3 foundation model, is a 1 million context hybrid reasoning model with a balanced performance, speed, and cost combination.) | Alibaba | $0.26 | $0.78 | 1.0M | Ver → |
Geração de imagens
Gere imagens de alta qualidade a partir de descrições de texto — ideal para design, publicidade, ilustração e arte.
| Modelo | Fornecedor | Entrada /1M | Saída /1M | Contexto | API | Detalhes |
|---|---|---|---|---|---|---|
FLUX.1Hot FLUX.1 é um modelo de geração de imagens de ponta, reconhecido pelo seu fotorrealismo e precisão. | Black Forest Labs | Não baseado em tokens | — | — | Ver → | |
Auto Router é um modelo de IA de geração de imagens desenvolvido pela Openrouter, com velocidade intermédia. Janela de contexto até 2M tokens. Capacidades: análise de imagens, uso de ferramentas, acesso API. Preço: entrada $-1000000/milhão de tokens, saída $-1000000/milhão de tokens. (Descrição oficial: Your prompt will be processed by a meta-model and routed to one of dozens of models (see below), optimizing for the best possible output.) | Openrouter | Não baseado em tokens | — | 2.0M | Ver → | |
Google: Nano Banana (Gemini 2.5 Flash Image) é um modelo de IA de geração de imagens desenvolvido pela Google, com resposta rápida. Janela de contexto até 33K tokens. Capacidades: análise de imagens, acesso API. Preço: entrada $0.3/milhão de tokens, saída $2.5/milhão de tokens. (Descrição oficial: Gemini 2.5 Flash Image, a.k.a.) | $0.30 | $2.50 | 33K | Ver → | ||
Google: Nano Banana 2 (Gemini 3.1 Flash Image Preview) é um modelo de IA de geração de imagens desenvolvido pela Google, com resposta rápida. Janela de contexto até 66K tokens. Capacidades: análise de imagens, acesso API. Preço: entrada $0.5/milhão de tokens, saída $3/milhão de tokens. (Descrição oficial: Gemini 3.1 Flash Image Preview, a.k.a.) | $0.50 | $3.00 | 66K | Ver → | ||
Google: Nano Banana Pro (Gemini 3 Pro Image Preview) é um modelo de IA de geração de imagens desenvolvido pela Google, com resposta rápida. Janela de contexto até 66K tokens. Capacidades: análise de imagens, acesso API. Preço: entrada $2/milhão de tokens, saída $12/milhão de tokens. (Descrição oficial: Nano Banana Pro is Google’s most advanced image-generation and editing model, built on Gemini 3 Pro.) | $2.00 | $12.00 | 66K | Ver → | ||
OpenAI: GPT-5 Image Mini é um modelo de IA de geração de imagens desenvolvido pela OpenAI, com resposta rápida. Janela de contexto até 400K tokens. Capacidades: análise de imagens, acesso API. Preço: entrada $2.5/milhão de tokens, saída $2/milhão de tokens. (Descrição oficial: GPT-5 Image Mini combines OpenAI's advanced language capabilities, powered by GPT-5 Mini, with GPT Image 1 Mini for efficient image generation.) | OpenAI | $2.50 | $2.00 | 400K | Ver → | |
OpenAI: GPT-5.4 Image 2 é um modelo de IA de geração de imagens desenvolvido pela OpenAI, com velocidade intermédia. Janela de contexto até 272K tokens. Capacidades: análise de imagens, acesso API. Preço: entrada $8/milhão de tokens, saída $15/milhão de tokens. (Descrição oficial: GPT-5.4 Image 2 combines OpenAI's GPT-5.4 model with state-of-the-art image generation capabilities from GPT Image 2.) | OpenAI | $8.00 | $15.00 | 272K | Ver → | |
OpenAI: GPT-5 Image é um modelo de IA de geração de imagens desenvolvido pela OpenAI, com velocidade intermédia. Janela de contexto até 400K tokens. Capacidades: análise de imagens, acesso API. Preço: entrada $10/milhão de tokens, saída $10/milhão de tokens. (Descrição oficial: GPT-5 Image combines OpenAI's GPT-5 model with state-of-the-art image generation capabilities.) | OpenAI | $10.00 | $10.00 | 400K | Ver → | |
Midjourney v6 produz imagens artísticas impressionantes com uma qualidade estética excecional. | Midjourney | Não baseado em tokens | — | — | — | Ver → |
Stable Diffusion XL é o modelo open-source de referência para geração de imagens em local. | Stability AI | Não baseado em tokens | — | — | Ver → |
Geração de vídeo
Gere vídeos a partir de texto ou imagens — perfeito para anúncios, conteúdo curto e assistência em produção cinematográfica.
| Modelo | Fornecedor | Entrada /1M | Saída /1M | Contexto | API | Detalhes |
|---|---|---|---|---|---|---|
SoraHot Sora gera vídeos realistas e criativos a partir de texto, até 60 segundos. | OpenAI | Não baseado em tokens | — | — | — | Ver → |
Kling AIHot Kling AI gera vídeos de alta qualidade com movimentos realistas e transições fluidas. | Kling AI | Não baseado em tokens | — | — | Ver → | |
Veo 2 é o modelo de vídeo avançado do Google, com qualidade cinematográfica e compreensão física. | Não baseado em tokens | — | — | — | Ver → | |
Runway Gen-3 Alpha é um poderoso modelo de geração de vídeo com acesso API para desenvolvedores. | Runway | Não baseado em tokens | — | — | Ver → |