TokenCenter
Atualizado maio 2026 · Mais de 20 modelos rastreados

Compare modelos de IA,
Preços e desempenho

Explore os melhores modelos de IA para código, escrita, geração de imagens, vídeo, raciocínio e APIs.

Tabela de preços API

Por milhão de tokens — USD. Clique num modelo para ver detalhes.

ModeloFornecedorCategoriaEntrada /1MSaída /1MContextoAPIDetalhes
GoogleModelos de diálogo$0.10$0.401.0MVer →
DeepSeekModelos de código$0.27$1.10128KVer →
AlibabaModelos de código$0.40$1.20128KVer →
MoonshotModelos de raciocínio$0.50$2.00128KVer →
DeepSeekModelos de raciocínio$0.55$2.19128KVer →
AnthropicModelos de diálogo$0.80$4.00200KVer →
GoogleModelos de raciocínio$1.25$10.001.0MVer →
OpenAIModelos de diálogo$2.00$8.001.0MVer →
GPT-4o🔥
OpenAIModelos de diálogo$2.50$10.00128KVer →
AnthropicModelos de diálogo$3.00$15.00200KVer →
GPT-5🔥NEW
OpenAIModelos de raciocínio$15.00$60.001.0MVer →
AnthropicModelos de raciocínio$15.00$75.00200KVer →
💬

Modelos de diálogo

Ideal para atendimento ao cliente, conversa diária, assistência de escritório e criação de conteúdo — a capacidade de IA mais versátil.

ModeloFornecedorEntrada /1MSaída /1MContextoAPIDetalhes

GPT-4o é um modelo multimodal rápido da OpenAI, otimizado para diálogo, código e análise de imagens.

OpenAI$2.50$10.00128KVer →

Body Builder (beta) é um modelo de IA de diálogo generalista desenvolvido pela Openrouter, com velocidade intermédia. Janela de contexto até 128K tokens. Capacidades: acesso API. Preço: entrada $-1000000/milhão de tokens, saída $-1000000/milhão de tokens. (Descrição oficial: Transform your natural language requests into structured OpenRouter API request objects.)

OpenrouterNão baseado em tokens128KVer →

IBM: Granite 4.0 Micro é um modelo de IA de diálogo generalista desenvolvido pela Ibm-granite, com velocidade intermédia. Janela de contexto até 131K tokens. Capacidades: acesso API. Preço: entrada $0.017/milhão de tokens, saída $0.11/milhão de tokens. (Descrição oficial: Granite-4.0-H-Micro is a 3B parameter from the Granite 4 family of models.)

Ibm-granite$0.017$0.11131KVer →

Meta: Llama 3.1 8B Instruct é um modelo de IA de diálogo generalista desenvolvido pela Meta, com velocidade intermédia. Janela de contexto até 16K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.02/milhão de tokens, saída $0.05/milhão de tokens. (Descrição oficial: Meta's latest class of model (Llama 3.1) launched with a variety of sizes & flavors.)

Meta$0.02$0.0516KVer →

Mistral: Mistral Nemo é um modelo de IA de diálogo generalista desenvolvido pela Mistral AI, com velocidade intermédia. Janela de contexto até 131K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.02/milhão de tokens, saída $0.03/milhão de tokens. (Descrição oficial: A 12B parameter model with a 128k token context length built by Mistral in collaboration with NVIDIA.)

Mistral AI$0.02$0.03131KVer →

Meta: Llama 3.2 1B Instruct é um modelo de IA de diálogo generalista desenvolvido pela Meta, com velocidade intermédia. Janela de contexto até 60K tokens. Capacidades: acesso API. Preço: entrada $0.027/milhão de tokens, saída $0.2/milhão de tokens. (Descrição oficial: Llama 3.2 1B is a 1-billion-parameter language model focused on efficiently performing natural language tasks, such as summarization, dialogue, and multilingual text analysis.)

Meta$0.027$0.2060KVer →

LiquidAI: LFM2-24B-A2B é um modelo de IA de diálogo generalista desenvolvido pela Liquid AI, com velocidade intermédia. Janela de contexto até 33K tokens. Capacidades: acesso API. Preço: entrada $0.03/milhão de tokens, saída $0.12/milhão de tokens. (Descrição oficial: LFM2-24B-A2B is the largest model in the LFM2 family of hybrid architectures designed for efficient on-device deployment.)

Liquid AI$0.03$0.1233KVer →

OpenAI: gpt-oss-20b é um modelo de IA de diálogo generalista desenvolvido pela OpenAI, com velocidade intermédia. Janela de contexto até 131K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.03/milhão de tokens, saída $0.14/milhão de tokens. (Descrição oficial: gpt-oss-20b is an open-weight 21B parameter model released by OpenAI under the Apache 2.0 license.)

OpenAI$0.03$0.14131KVer →

Qwen: Qwen-Turbo é um modelo de IA de diálogo generalista desenvolvido pela Alibaba, com resposta rápida. Janela de contexto até 131K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.0325/milhão de tokens, saída $0.13/milhão de tokens. (Descrição oficial: Qwen-Turbo, based on Qwen2.5, is a 1M context model that provides fast speed and low cost, suitable for simple tasks.)

Alibaba$0.0325$0.13131KVer →

Amazon: Nova Micro 1.0 é um modelo de IA de diálogo generalista desenvolvido pela Amazon, com velocidade intermédia. Janela de contexto até 128K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.035/milhão de tokens, saída $0.14/milhão de tokens. (Descrição oficial: Amazon Nova Micro 1.0 is a text-only model that delivers the lowest latency responses in the Amazon Nova family of models at a very low cost.)

Amazon$0.035$0.14128KVer →

Cohere: Command R7B (12-2024) é um modelo de IA de diálogo generalista desenvolvido pela Cohere, com velocidade intermédia. Janela de contexto até 128K tokens. Capacidades: acesso API. Preço: entrada $0.0375/milhão de tokens, saída $0.15/milhão de tokens. (Descrição oficial: Command R7B (12-2024) is a small, fast update of the Command R+ model, delivered in December 2024.)

Cohere$0.0375$0.15128KVer →

OpenAI: gpt-oss-120b é um modelo de IA de diálogo generalista desenvolvido pela OpenAI, com velocidade intermédia. Janela de contexto até 131K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.039/milhão de tokens, saída $0.18/milhão de tokens. (Descrição oficial: gpt-oss-120b is an open-weight, 117B-parameter Mixture-of-Experts (MoE) language model from OpenAI designed for high-reasoning, agentic, and general-purpose production use cases.)

OpenAI$0.039$0.18131KVer →
💻

Modelos de código

Otimizado para desenvolvimento de software: geração de código, depuração, revisão de código e documentação técnica.

ModeloFornecedorEntrada /1MSaída /1MContextoAPIDetalhes

DeepSeek V3 é um modelo MoE muito competitivo para código e raciocínio geral a baixo custo.

DeepSeek$0.27$1.10128KVer →

Pareto Code Router é um modelo de IA de geração de código desenvolvido pela Openrouter, com velocidade intermédia. Janela de contexto até 2M tokens. Capacidades: acesso API. Preço: entrada $-1000000/milhão de tokens, saída $-1000000/milhão de tokens. (Descrição oficial: The Pareto Router maintains a tiered shortlist of strong coding models, ranked by Artificial Analysis coding percentiles.)

OpenrouterNão baseado em tokens2.0MVer →

Qwen: Qwen3 Coder 30B A3B Instruct é um modelo de IA de geração de código desenvolvido pela Alibaba, com velocidade intermédia. Janela de contexto até 160K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.07/milhão de tokens, saída $0.27/milhão de tokens. (Descrição oficial: Qwen3-Coder-30B-A3B-Instruct is a 30.5B parameter Mixture-of-Experts (MoE) model with 128 experts (8 active per forward pass), designed for advanced code generation, repository-scale understanding, and agentic tool use.)

Alibaba$0.07$0.27160KVer →

Qwen: Qwen3 Coder Next é um modelo de IA de geração de código desenvolvido pela Alibaba, com velocidade intermédia. Janela de contexto até 262K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.11/milhão de tokens, saída $0.8/milhão de tokens. (Descrição oficial: Qwen3-Coder-Next is an open-weight causal language model optimized for coding agents and local development workflows.)

Alibaba$0.11$0.80262KVer →

Qwen: Qwen3 Coder Flash é um modelo de IA de geração de código desenvolvido pela Alibaba, com resposta rápida. Janela de contexto até 1M tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.195/milhão de tokens, saída $0.975/milhão de tokens. (Descrição oficial: Qwen3 Coder Flash is Alibaba's fast and cost efficient version of their proprietary Qwen3 Coder Plus.)

Alibaba$0.195$0.9751.0MVer →

xAI: Grok Code Fast 1 é um modelo de IA de geração de código desenvolvido pela xAI, com resposta rápida. Janela de contexto até 256K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.2/milhão de tokens, saída $1.5/milhão de tokens. (Descrição oficial: Grok Code Fast 1 is a speedy and economical reasoning model that excels at agentic coding.)

xAI$0.20$1.50256KVer →

Qwen: Qwen3 Coder 480B A35B é um modelo de IA de geração de código desenvolvido pela Alibaba, com velocidade intermédia. Janela de contexto até 262K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.22/milhão de tokens, saída $1.8/milhão de tokens. (Descrição oficial: Qwen3-Coder-480B-A35B-Instruct is a Mixture-of-Experts (MoE) code generation model developed by the Qwen team.)

Alibaba$0.22$1.80262KVer →

Kwaipilot: KAT-Coder-Pro V2 é um modelo de IA de geração de código desenvolvido pela Kwaipilot, com velocidade intermédia. Janela de contexto até 256K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.3/milhão de tokens, saída $1.2/milhão de tokens. (Descrição oficial: KAT-Coder-Pro V2 is the latest high-performance model in KwaiKAT’s KAT-Coder series, designed for complex enterprise-grade software engineering and SaaS integration.)

Kwaipilot$0.30$1.20256KVer →

Mistral: Codestral 2508 é um modelo de IA de geração de código desenvolvido pela Mistral AI, com velocidade intermédia. Janela de contexto até 256K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.3/milhão de tokens, saída $0.9/milhão de tokens. (Descrição oficial: Mistral's cutting-edge language model for coding released end of July 2025.)

Mistral AI$0.30$0.90256KVer →

Qwen 2.5 72B é o modelo open-source insignia da Alibaba, com excelentes capacidades multilingue e de código.

Alibaba$0.40$1.20128KVer →

Arcee AI: Coder Large é um modelo de IA de geração de código desenvolvido pela Arcee-ai, com mais lento mas mais potente. Janela de contexto até 33K tokens. Capacidades: acesso API. Preço: entrada $0.5/milhão de tokens, saída $0.8/milhão de tokens. (Descrição oficial: Coder‑Large is a 32 B‑parameter offspring of Qwen 2.5‑Instruct that has been further trained on permissively‑licensed GitHub, CodeSearchNet and synthetic bug‑fix corpora.)

Arcee-ai$0.50$0.8033KVer →

Qwen: Qwen3 Coder Plus é um modelo de IA de geração de código desenvolvido pela Alibaba, com mais lento mas mais potente. Janela de contexto até 1M tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.65/milhão de tokens, saída $3.25/milhão de tokens. (Descrição oficial: Qwen3 Coder Plus is Alibaba's proprietary version of the Open Source Qwen3 Coder 480B A35B.)

Alibaba$0.65$3.251.0MVer →
🧠

Modelos de raciocínio

Raciocínio lógico avançado para matemática, ciências, análises complexas e planeamento estratégico.

ModeloFornecedorEntrada /1MSaída /1MContextoAPIDetalhes

DeepSeek R1 é um modelo de raciocínio por cadeia de pensamento que rivaliza com o o1 a uma fração do preço.

DeepSeek$0.55$2.19128KVer →

Gemini 2.5 Pro é o modelo estrela do Google com um milhão de tokens de contexto nativo e raciocínio de ponta.

Google$1.25$10.001.0MVer →
GPT-5HotNew

GPT-5 é o modelo mais potente da OpenAI, combinando raciocínio avançado e compreensão multimodal.

OpenAI$15.00$60.001.0MVer →

Claude Opus é o modelo mais inteligente da Anthropic, concebido para raciocínio complexo e tarefas agênticas.

Anthropic$15.00$75.00200KVer →

Baidu: ERNIE 4.5 21B A3B Thinking é um modelo de IA de raciocínio avançado desenvolvido pela Baidu, com velocidade intermédia. Janela de contexto até 131K tokens. Capacidades: acesso API. Preço: entrada $0.07/milhão de tokens, saída $0.28/milhão de tokens. (Descrição oficial: ERNIE-4.5-21B-A3B-Thinking is Baidu's upgraded lightweight MoE model, refined to boost reasoning depth and quality for top-tier performance in logical puzzles, math, science, coding, text generation, and expert-level academic benchmarks.)

Baidu$0.07$0.28131KVer →

Qwen: Qwen3 30B A3B Thinking 2507 é um modelo de IA de raciocínio avançado desenvolvido pela Alibaba, com velocidade intermédia. Janela de contexto até 131K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.08/milhão de tokens, saída $0.4/milhão de tokens. (Descrição oficial: Qwen3-30B-A3B-Thinking-2507 is a 30B parameter Mixture-of-Experts reasoning model optimized for complex tasks requiring extended multi-step thinking.)

Alibaba$0.08$0.40131KVer →

Qwen: Qwen3 Next 80B A3B Thinking é um modelo de IA de raciocínio avançado desenvolvido pela Alibaba, com velocidade intermédia. Janela de contexto até 131K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.0975/milhão de tokens, saída $0.78/milhão de tokens. (Descrição oficial: Qwen3-Next-80B-A3B-Thinking is a reasoning-first chat model in the Qwen3-Next line that outputs structured “thinking” traces by default.)

Alibaba$0.0975$0.78131KVer →

Qwen: Qwen3 VL 8B Thinking é um modelo de IA de raciocínio avançado desenvolvido pela Alibaba, com velocidade intermédia. Janela de contexto até 131K tokens. Capacidades: análise de imagens, uso de ferramentas, acesso API. Preço: entrada $0.117/milhão de tokens, saída $1.365/milhão de tokens. (Descrição oficial: Qwen3-VL-8B-Thinking is the reasoning-optimized variant of the Qwen3-VL-8B multimodal model, designed for advanced visual and textual reasoning across complex scenes, documents, and temporal sequences.)

Alibaba$0.117$1.365131KVer →

Qwen: Qwen3 VL 30B A3B Thinking é um modelo de IA de raciocínio avançado desenvolvido pela Alibaba, com velocidade intermédia. Janela de contexto até 131K tokens. Capacidades: análise de imagens, uso de ferramentas, acesso API. Preço: entrada $0.13/milhão de tokens, saída $1.56/milhão de tokens. (Descrição oficial: Qwen3-VL-30B-A3B-Thinking is a multimodal model that unifies strong text generation with visual understanding for images and videos.)

Alibaba$0.13$1.56131KVer →

Qwen: Qwen3 235B A22B Thinking 2507 é um modelo de IA de raciocínio avançado desenvolvido pela Alibaba, com velocidade intermédia. Janela de contexto até 131K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.1495/milhão de tokens, saída $1.495/milhão de tokens. (Descrição oficial: Qwen3-235B-A22B-Thinking-2507 is a high-performance, open-weight Mixture-of-Experts (MoE) language model optimized for complex reasoning tasks.)

Alibaba$0.1495$1.495131KVer →

Arcee AI: Trinity Large Thinking é um modelo de IA de raciocínio avançado desenvolvido pela Arcee-ai, com mais lento mas mais potente. Janela de contexto até 262K tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.22/milhão de tokens, saída $0.85/milhão de tokens. (Descrição oficial: Trinity Large Thinking is a powerful open source reasoning model from the team at Arcee AI.)

Arcee-ai$0.22$0.85262KVer →

Qwen: Qwen Plus 0728 (thinking) é um modelo de IA de raciocínio avançado desenvolvido pela Alibaba, com mais lento mas mais potente. Janela de contexto até 1M tokens. Capacidades: uso de ferramentas, acesso API. Preço: entrada $0.26/milhão de tokens, saída $0.78/milhão de tokens. (Descrição oficial: Qwen Plus 0728, based on the Qwen3 foundation model, is a 1 million context hybrid reasoning model with a balanced performance, speed, and cost combination.)

Alibaba$0.26$0.781.0MVer →
🖼️

Geração de imagens

Gere imagens de alta qualidade a partir de descrições de texto — ideal para design, publicidade, ilustração e arte.

ModeloFornecedorEntrada /1MSaída /1MContextoAPIDetalhes

FLUX.1 é um modelo de geração de imagens de ponta, reconhecido pelo seu fotorrealismo e precisão.

Black Forest LabsNão baseado em tokensVer →

Auto Router é um modelo de IA de geração de imagens desenvolvido pela Openrouter, com velocidade intermédia. Janela de contexto até 2M tokens. Capacidades: análise de imagens, uso de ferramentas, acesso API. Preço: entrada $-1000000/milhão de tokens, saída $-1000000/milhão de tokens. (Descrição oficial: Your prompt will be processed by a meta-model and routed to one of dozens of models (see below), optimizing for the best possible output.)

OpenrouterNão baseado em tokens2.0MVer →

Google: Nano Banana (Gemini 2.5 Flash Image) é um modelo de IA de geração de imagens desenvolvido pela Google, com resposta rápida. Janela de contexto até 33K tokens. Capacidades: análise de imagens, acesso API. Preço: entrada $0.3/milhão de tokens, saída $2.5/milhão de tokens. (Descrição oficial: Gemini 2.5 Flash Image, a.k.a.)

Google$0.30$2.5033KVer →

Google: Nano Banana 2 (Gemini 3.1 Flash Image Preview) é um modelo de IA de geração de imagens desenvolvido pela Google, com resposta rápida. Janela de contexto até 66K tokens. Capacidades: análise de imagens, acesso API. Preço: entrada $0.5/milhão de tokens, saída $3/milhão de tokens. (Descrição oficial: Gemini 3.1 Flash Image Preview, a.k.a.)

Google$0.50$3.0066KVer →

Google: Nano Banana Pro (Gemini 3 Pro Image Preview) é um modelo de IA de geração de imagens desenvolvido pela Google, com resposta rápida. Janela de contexto até 66K tokens. Capacidades: análise de imagens, acesso API. Preço: entrada $2/milhão de tokens, saída $12/milhão de tokens. (Descrição oficial: Nano Banana Pro is Google’s most advanced image-generation and editing model, built on Gemini 3 Pro.)

Google$2.00$12.0066KVer →

OpenAI: GPT-5 Image Mini é um modelo de IA de geração de imagens desenvolvido pela OpenAI, com resposta rápida. Janela de contexto até 400K tokens. Capacidades: análise de imagens, acesso API. Preço: entrada $2.5/milhão de tokens, saída $2/milhão de tokens. (Descrição oficial: GPT-5 Image Mini combines OpenAI's advanced language capabilities, powered by GPT-5 Mini, with GPT Image 1 Mini for efficient image generation.)

OpenAI$2.50$2.00400KVer →

OpenAI: GPT-5.4 Image 2 é um modelo de IA de geração de imagens desenvolvido pela OpenAI, com velocidade intermédia. Janela de contexto até 272K tokens. Capacidades: análise de imagens, acesso API. Preço: entrada $8/milhão de tokens, saída $15/milhão de tokens. (Descrição oficial: GPT-5.4 Image 2 combines OpenAI's GPT-5.4 model with state-of-the-art image generation capabilities from GPT Image 2.)

OpenAI$8.00$15.00272KVer →

OpenAI: GPT-5 Image é um modelo de IA de geração de imagens desenvolvido pela OpenAI, com velocidade intermédia. Janela de contexto até 400K tokens. Capacidades: análise de imagens, acesso API. Preço: entrada $10/milhão de tokens, saída $10/milhão de tokens. (Descrição oficial: GPT-5 Image combines OpenAI's GPT-5 model with state-of-the-art image generation capabilities.)

OpenAI$10.00$10.00400KVer →

Midjourney v6 produz imagens artísticas impressionantes com uma qualidade estética excecional.

MidjourneyNão baseado em tokensVer →

Stable Diffusion XL é o modelo open-source de referência para geração de imagens em local.

Stability AINão baseado em tokensVer →
🎬

Geração de vídeo

Gere vídeos a partir de texto ou imagens — perfeito para anúncios, conteúdo curto e assistência em produção cinematográfica.

ModeloFornecedorEntrada /1MSaída /1MContextoAPIDetalhes
SoraHot

Sora gera vídeos realistas e criativos a partir de texto, até 60 segundos.

OpenAINão baseado em tokensVer →

Kling AI gera vídeos de alta qualidade com movimentos realistas e transições fluidas.

Kling AINão baseado em tokensVer →

Veo 2 é o modelo de vídeo avançado do Google, com qualidade cinematográfica e compreensão física.

GoogleNão baseado em tokensVer →

Runway Gen-3 Alpha é um poderoso modelo de geração de vídeo com acesso API para desenvolvedores.

RunwayNão baseado em tokensVer →

Comparações populares

Últimos modelos