TokenCenter
← ホームに戻る
💬

チャットモデル

319モデル

カスタマーサポート、日常会話、オフィスアシスタント、コンテンツ作成に最適。最も汎用性の高いAI機能です。

モデル提供元入力 /1M出力 /1MコンテキストAPI詳細
GPT-4o热门

GPT-4oはOpenAIの高速マルチモーダルモデルで、チャット、コーディング、画像認識タスクに最適化されています。

OpenAI$2.50$10.00128K見る →

Body Builder (beta)はOpenrouterが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大128Kトークン。対応機能:APIアクセス。料金:入力 $-1000000/100万トークン、出力 $-1000000/100万トークン。(公式説明:Transform your natural language requests into structured OpenRouter API request objects.)

Openrouterトークン課金なし128K見る →

IBM: Granite 4.0 MicroはIbm-graniteが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:APIアクセス。料金:入力 $0.017/100万トークン、出力 $0.11/100万トークン。(公式説明:Granite-4.0-H-Micro is a 3B parameter from the Granite 4 family of models.)

Ibm-granite$0.017$0.11131K見る →

Meta: Llama 3.1 8B InstructはMetaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大16Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.02/100万トークン、出力 $0.05/100万トークン。(公式説明:Meta's latest class of model (Llama 3.1) launched with a variety of sizes & flavors.)

Meta$0.02$0.0516K見る →

Mistral: Mistral NemoはMistral AIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.02/100万トークン、出力 $0.03/100万トークン。(公式説明:A 12B parameter model with a 128k token context length built by Mistral in collaboration with NVIDIA.)

Mistral AI$0.02$0.03131K見る →

Meta: Llama 3.2 1B InstructはMetaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大60Kトークン。対応機能:APIアクセス。料金:入力 $0.027/100万トークン、出力 $0.2/100万トークン。(公式説明:Llama 3.2 1B is a 1-billion-parameter language model focused on efficiently performing natural language tasks, such as summarization, dialogue, and multilingual text analysis.)

Meta$0.027$0.2060K見る →

LiquidAI: LFM2-24B-A2BはLiquid AIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大33Kトークン。対応機能:APIアクセス。料金:入力 $0.03/100万トークン、出力 $0.12/100万トークン。(公式説明:LFM2-24B-A2B is the largest model in the LFM2 family of hybrid architectures designed for efficient on-device deployment.)

Liquid AI$0.03$0.1233K見る →

OpenAI: gpt-oss-20bはOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.03/100万トークン、出力 $0.14/100万トークン。(公式説明:gpt-oss-20b is an open-weight 21B parameter model released by OpenAI under the Apache 2.0 license.)

OpenAI$0.03$0.14131K見る →

Qwen: Qwen-TurboはAlibabaが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.0325/100万トークン、出力 $0.13/100万トークン。(公式説明:Qwen-Turbo, based on Qwen2.5, is a 1M context model that provides fast speed and low cost, suitable for simple tasks.)

Alibaba$0.0325$0.13131K見る →

Amazon: Nova Micro 1.0はAmazonが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大128Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.035/100万トークン、出力 $0.14/100万トークン。(公式説明:Amazon Nova Micro 1.0 is a text-only model that delivers the lowest latency responses in the Amazon Nova family of models at a very low cost.)

Amazon$0.035$0.14128K見る →

Cohere: Command R7B (12-2024)はCohereが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大128Kトークン。対応機能:APIアクセス。料金:入力 $0.0375/100万トークン、出力 $0.15/100万トークン。(公式説明:Command R7B (12-2024) is a small, fast update of the Command R+ model, delivered in December 2024.)

Cohere$0.0375$0.15128K見る →

OpenAI: gpt-oss-120bはOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.039/100万トークン、出力 $0.18/100万トークン。(公式説明:gpt-oss-120b is an open-weight, 117B-parameter Mixture-of-Experts (MoE) language model from OpenAI designed for high-reasoning, agentic, and general-purpose production use cases.)

OpenAI$0.039$0.18131K見る →

Qwen: Qwen2.5 7B InstructはAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大33Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.04/100万トークン、出力 $0.1/100万トークン。(公式説明:Qwen2.5 7B is the latest series of Qwen large language models.)

Alibaba$0.04$0.1033K見る →

Qwen: Qwen3.5-9BはAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.04/100万トークン、出力 $0.15/100万トークン。(公式説明:Qwen3.5-9B is a multimodal foundation model from the Qwen3.5 family, designed to deliver strong reasoning, coding, and visual understanding in an efficient 9B-parameter architecture.)

Alibaba$0.04$0.15262K見る →

Google: Gemma 3 12BはGoogleが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.04/100万トークン、出力 $0.13/100万トークン。(公式説明:Gemma 3 introduces multimodality, supporting vision-language input and text outputs.)

Google$0.04$0.13131K見る →

Google: Gemma 3 4BはGoogleが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:画像認識、APIアクセス。料金:入力 $0.04/100万トークン、出力 $0.08/100万トークン。(公式説明:Gemma 3 introduces multimodality, supporting vision-language input and text outputs.)

Google$0.04$0.08131K見る →

Meta: Llama 3 8B InstructはMetaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大8Kトークン。対応機能:APIアクセス。料金:入力 $0.04/100万トークン、出力 $0.04/100万トークン。(公式説明:Meta's latest class of model (Llama 3) launched with a variety of sizes & flavors.)

Meta$0.04$0.048K見る →

NVIDIA: Nemotron Nano 9B V2はNVIDIAが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.04/100万トークン、出力 $0.16/100万トークン。(公式説明:NVIDIA-Nemotron-Nano-9B-v2 is a large language model (LLM) trained from scratch by NVIDIA, and designed as a unified model for both reasoning and non-reasoning tasks.)

NVIDIA$0.04$0.16131K見る →

Sao10K: Llama 3 8B LunarisはSao10Kが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大8Kトークン。対応機能:APIアクセス。料金:入力 $0.04/100万トークン、出力 $0.05/100万トークン。(公式説明:Lunaris 8B is a versatile generalist and roleplaying model based on Llama 3.)

Sao10K$0.04$0.058K見る →

Arcee AI: Trinity MiniはArcee-aiが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.045/100万トークン、出力 $0.15/100万トークン。(公式説明:Trinity Mini is a 26B-parameter (3B active) sparse mixture-of-experts language model featuring 128 experts with 8 active per token.)

Arcee-ai$0.045$0.15131K見る →

Qwen: Qwen3 8BはAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大41Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.05/100万トークン、出力 $0.4/100万トークン。(公式説明:Qwen3-8B is a dense 8.2B parameter causal language model from the Qwen3 series, designed for both reasoning-heavy tasks and efficient dialogue.)

Alibaba$0.05$0.4041K見る →

IBM: Granite 4.1 8BはIbm-graniteが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.05/100万トークン、出力 $0.1/100万トークン。(公式説明:Granite 4.1 8B is a dense, decoder-only 8-billion-parameter language model from IBM, part of the Granite 4.1 family.)

Ibm-granite$0.05$0.10131K見る →

Mistral: Mistral Small 3はMistral AIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大33Kトークン。対応機能:APIアクセス。料金:入力 $0.05/100万トークン、出力 $0.08/100万トークン。(公式説明:Mistral Small 3 is a 24B-parameter language model optimized for low-latency performance across common AI tasks.)

Mistral AI$0.05$0.0833K見る →

NVIDIA: Nemotron 3 Nano 30B A3BはNVIDIAが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大262Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.05/100万トークン、出力 $0.2/100万トークン。(公式説明:NVIDIA Nemotron 3 Nano 30B A3B is a small language MoE model with highest compute efficiency and accuracy for developers to build specialized agentic AI systems.)

NVIDIA$0.05$0.20262K見る →

OpenAI: GPT-5 NanoはOpenAIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大400Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.05/100万トークン、出力 $0.4/100万トークン。(公式説明:GPT-5-Nano is the smallest and fastest variant in the GPT-5 system, optimized for developer tools, rapid interactions, and ultra-low latency environments.)

OpenAI$0.05$0.40400K見る →

Meta: Llama 3.2 3B InstructはMetaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大80Kトークン。対応機能:APIアクセス。料金:入力 $0.051/100万トークン、出力 $0.34/100万トークン。(公式説明:Llama 3.2 3B is a 3-billion-parameter multilingual large language model, optimized for advanced natural language processing tasks like dialogue generation, reasoning, and summarization.)

Meta$0.051$0.3480K見る →

Qwen: Qwen3 14BはAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大41Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.06/100万トークン、出力 $0.24/100万トークン。(公式説明:Qwen3-14B is a dense 14.8B parameter causal language model from the Qwen3 series, designed for both complex reasoning and efficient dialogue.)

Alibaba$0.06$0.2441K見る →

Amazon: Nova Lite 1.0はAmazonが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大300Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.06/100万トークン、出力 $0.24/100万トークン。(公式説明:Amazon Nova Lite 1.0 is a very low-cost multimodal model from Amazon that focused on fast processing of image, video, and text inputs to generate text output.)

Amazon$0.06$0.24300K見る →

Google: Gemma 3n 4BはGoogleが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大33Kトークン。対応機能:APIアクセス。料金:入力 $0.06/100万トークン、出力 $0.12/100万トークン。(公式説明:Gemma 3n E4B-it is optimized for efficient execution on mobile and low-resource devices, such as phones, laptops, and tablets.)

Google$0.06$0.1233K見る →

Google: Gemma 4 26B A4B はGoogleが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.06/100万トークン、出力 $0.33/100万トークン。(公式説明:Gemma 4 26B A4B IT is an instruction-tuned Mixture-of-Experts (MoE) model from Google DeepMind.)

Google$0.06$0.33262K見る →

MythoMax 13BはGrypheが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大4Kトークン。対応機能:APIアクセス。料金:入力 $0.06/100万トークン、出力 $0.06/100万トークン。(公式説明:One of the highest performing and most popular fine-tunes of Llama 2 13B, with rich descriptions and roleplay.)

Gryphe$0.06$0.064K見る →

Z.ai: GLM 4.7 FlashはZ-aiが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大203Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.06/100万トークン、出力 $0.4/100万トークン。(公式説明:As a 30B-class SOTA model, GLM-4.7-Flash offers a new option that balances performance and efficiency.)

Z-ai$0.06$0.40203K見る →

Qwen: Qwen3.5-FlashはAlibabaが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.065/100万トークン、出力 $0.26/100万トークン。(公式説明:The Qwen3.5 native vision-language Flash models are built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency.)

Alibaba$0.065$0.261.0M見る →

Microsoft: Phi 4はMicrosoftが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大16Kトークン。対応機能:APIアクセス。料金:入力 $0.065/100万トークン、出力 $0.14/100万トークン。(公式説明:Microsoft Research Phi-4 is designed to perform well in complex reasoning tasks and can operate efficiently in situations with limited memory or where quick responses are needed.)

Microsoft$0.065$0.1416K見る →

Tencent: Hy3 previewはTencentが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.066/100万トークン、出力 $0.26/100万トークン。(公式説明:Hy3 preview is a high-efficiency Mixture-of-Experts model from Tencent designed for agentic workflows and production use.)

Tencent$0.066$0.26262K見る →

Baidu: ERNIE 4.5 21B A3BはBaiduが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大120Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.07/100万トークン、出力 $0.28/100万トークン。(公式説明:A sophisticated text-based Mixture-of-Experts (MoE) model featuring 21B total parameters with 3B activated per token, delivering exceptional multimodal understanding and generation through heterogeneous MoE structures and modality-isolated routing.)

Baidu$0.07$0.28120K見る →

Qwen: Qwen3 235B A22B Instruct 2507はAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.071/100万トークン、出力 $0.1/100万トークン。(公式説明:Qwen3-235B-A22B-Instruct-2507 is a multilingual, instruction-tuned mixture-of-experts language model based on the Qwen3-235B architecture, with 22B active parameters per forward pass.)

Alibaba$0.071$0.10262K見る →

ByteDance Seed: Seed 1.6 FlashはBytedance-seedが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大262Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.075/100万トークン、出力 $0.3/100万トークン。(公式説明:Seed 1.6 Flash is an ultra-fast multimodal deep thinking model by ByteDance Seed, supporting both text and visual understanding.)

Bytedance-seed$0.075$0.30262K見る →

Google: Gemini 2.0 Flash LiteはGoogleが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.075/100万トークン、出力 $0.3/100万トークン。(公式説明:Gemini 2.0 Flash Lite offers a significantly faster time to first token (TTFT) compared to Gemini Flash 1.5, while maintaining quality on par with larger models like Gemini Pro 1.5,)

Google$0.075$0.301.0M見る →

Mistral: Mistral Small 3.2 24BはMistral AIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大128Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.075/100万トークン、出力 $0.2/100万トークン。(公式説明:Mistral-Small-3.2-24B-Instruct-2506 is an updated 24B parameter model from Mistral optimized for instruction following, repetition reduction, and improved function calling.)

Mistral AI$0.075$0.20128K見る →

OpenAI: gpt-oss-safeguard-20bはOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.075/100万トークン、出力 $0.3/100万トークン。(公式説明:gpt-oss-safeguard-20b is a safety reasoning model from OpenAI built upon gpt-oss-20b.)

OpenAI$0.075$0.30131K見る →

Qwen: Qwen3 32BはAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大41Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.08/100万トークン、出力 $0.28/100万トークン。(公式説明:Qwen3-32B is a dense 32.8B parameter causal language model from the Qwen3 series, optimized for both complex reasoning and efficient dialogue.)

Alibaba$0.08$0.2841K見る →

Qwen: Qwen3 VL 8B InstructはAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.08/100万トークン、出力 $0.5/100万トークン。(公式説明:Qwen3-VL-8B-Instruct is a multimodal vision-language model from the Qwen3-VL series, built for high-fidelity understanding and reasoning across text, images, and video.)

Alibaba$0.08$0.50131K見る →

Google: Gemma 3 27BはGoogleが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.08/100万トークン、出力 $0.16/100万トークン。(公式説明:Gemma 3 introduces multimodality, supporting vision-language input and text outputs.)

Google$0.08$0.16131K見る →

inclusionAI: Ling-2.6-flashはInclusionaiが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大262Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.08/100万トークン、出力 $0.24/100万トークン。(公式説明:Ling-2.6-flash is an instant (instruct) model from inclusionAI with 104B total parameters and 7.4B active parameters, designed for real-world agents that require fast responses, strong execution, and high token efficiency)

Inclusionai$0.08$0.24262K見る →

Meta: Llama 4 ScoutはMetaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大328Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.08/100万トークン、出力 $0.3/100万トークン。(公式説明:Llama 4 Scout 17B Instruct (16E) is a mixture-of-experts (MoE) language model developed by Meta, activating 17 billion parameters out of a total of 109B.)

Meta$0.08$0.30328K見る →

Microsoft: Phi 4 Mini InstructはMicrosoftが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大128Kトークン。対応機能:APIアクセス。料金:入力 $0.08/100万トークン、出力 $0.35/100万トークン。(公式説明:Phi-4-mini-instruct is a lightweight open model built upon synthetic data and filtered publicly available websites - with a focus on high-quality, reasoning dense data.)

Microsoft$0.08$0.35128K見る →

Qwen: Qwen3 30B A3BはAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大41Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.09/100万トークン、出力 $0.45/100万トークン。(公式説明:Qwen3, the latest generation in the Qwen large language model series, features both dense and mixture-of-experts (MoE) architectures to excel in reasoning, multilingual support, and advanced agent tasks.)

Alibaba$0.09$0.4541K見る →

Qwen: Qwen3 30B A3B Instruct 2507はAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.09/100万トークン、出力 $0.3/100万トークン。(公式説明:Qwen3-30B-A3B-Instruct-2507 is a 30.5B-parameter mixture-of-experts language model from Qwen, with 3.3B active parameters per inference.)

Alibaba$0.09$0.30262K見る →

Qwen: Qwen3 Next 80B A3B InstructはAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.09/100万トークン、出力 $1.1/100万トークン。(公式説明:Qwen3-Next-80B-A3B-Instruct is an instruction-tuned chat model in the Qwen3-Next series optimized for fast, stable responses without “thinking” traces.)

Alibaba$0.09$1.10262K見る →

Tongyi DeepResearch 30B A3BはAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.09/100万トークン、出力 $0.45/100万トークン。(公式説明:Tongyi DeepResearch is an agentic large language model developed by Tongyi Lab, with 30 billion total parameters activating only 3 billion per token.)

Alibaba$0.09$0.45131K見る →

NVIDIA: Nemotron 3 SuperはNVIDIAが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.09/100万トークン、出力 $0.45/100万トークン。(公式説明:NVIDIA Nemotron 3 Super is a 120B-parameter open hybrid MoE model, activating just 12B parameters for maximum compute efficiency and accuracy in complex multi-agent applications.)

NVIDIA$0.09$0.45262K見る →

Gemini 2.0 FlashはGoogleの万能モデルで、高速・高効率・マルチモーダル対応が特徴です。

Google$0.10$0.401.0M見る →

ByteDance: UI-TARS 7B はByteDanceが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大128Kトークン。対応機能:画像認識、APIアクセス。料金:入力 $0.1/100万トークン、出力 $0.2/100万トークン。(公式説明:UI-TARS-1.5 is a multimodal vision-language agent optimized for GUI-based environments, including desktop interfaces, web browsers, mobile systems, and games.)

ByteDance$0.10$0.20128K見る →

ByteDance Seed: Seed-2.0-MiniはBytedance-seedが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大262Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.1/100万トークン、出力 $0.4/100万トークン。(公式説明:Seed-2.0-mini targets latency-sensitive, high-concurrency, and cost-sensitive scenarios, emphasizing fast response and flexible inference deployment.)

Bytedance-seed$0.10$0.40262K見る →

Google: Gemini 2.0 FlashはGoogleが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.1/100万トークン、出力 $0.4/100万トークン。(公式説明:Gemini Flash 2.0 offers a significantly faster time to first token (TTFT) compared to Gemini Flash 1.5, while maintaining quality on par with larger models like Gemini Pro 1.5.)

Google$0.10$0.401.0M見る →

Google: Gemini 2.5 Flash LiteはGoogleが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.1/100万トークン、出力 $0.4/100万トークン。(公式説明:Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency.)

Google$0.10$0.401.0M見る →

Google: Gemini 2.5 Flash Lite Preview 09-2025はGoogleが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.1/100万トークン、出力 $0.4/100万トークン。(公式説明:Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency.)

Google$0.10$0.401.0M見る →

Meta: Llama 3.3 70B InstructはMetaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.1/100万トークン、出力 $0.32/100万トークン。(公式説明:The Meta Llama 3.3 multilingual large language model (LLM) is a pretrained and instruction tuned generative model in 70B (text in/text out).)

Meta$0.10$0.32131K見る →

Mistral: Devstral Small 1.1はMistral AIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.1/100万トークン、出力 $0.3/100万トークン。(公式説明:Devstral Small 1.1 is a 24B parameter open-weight language model for software engineering agents, developed by Mistral AI in collaboration with All Hands AI.)

Mistral AI$0.10$0.30131K見る →

Mistral: Ministral 3 3B 2512はMistral AIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大131Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.1/100万トークン、出力 $0.1/100万トークン。(公式説明:The smallest model in the Ministral 3 family, Ministral 3 3B is a powerful, efficient tiny language model with vision capabilities.)

Mistral AI$0.10$0.10131K見る →

Mistral: Voxtral Small 24B 2507はMistral AIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大32Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.1/100万トークン、出力 $0.3/100万トークン。(公式説明:Voxtral Small is an enhancement of Mistral Small 3, incorporating state-of-the-art audio input capabilities while retaining best-in-class text performance.)

Mistral AI$0.10$0.3032K見る →

NVIDIA: Llama 3.3 Nemotron Super 49B V1.5はNVIDIAが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.1/100万トークン、出力 $0.4/100万トークン。(公式説明:Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context.)

NVIDIA$0.10$0.40131K見る →

OpenAI: GPT-4.1 NanoはOpenAIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.1/100万トークン、出力 $0.4/100万トークン。(公式説明:For tasks that demand low latency, GPT‑4.1 nano is the fastest and cheapest model in the GPT-4.1 series.)

OpenAI$0.10$0.401.0M見る →

Reka EdgeはRekaaiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大16Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.1/100万トークン、出力 $0.1/100万トークン。(公式説明:Reka Edge is an extremely efficient 7B multimodal vision-language model that accepts image/video+text inputs and generates text outputs.)

Rekaai$0.10$0.1016K見る →

Reka Flash 3はRekaaiが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大66Kトークン。対応機能:APIアクセス。料金:入力 $0.1/100万トークン、出力 $0.2/100万トークン。(公式説明:Reka Flash 3 is a general-purpose, instruction-tuned large language model with 21 billion parameters, developed by Reka.)

Rekaai$0.10$0.2066K見る →

StepFun: Step 3.5 FlashはStepfunが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大262Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.1/100万トークン、出力 $0.3/100万トークン。(公式説明:Step 3.5 Flash is StepFun's most capable open-source foundation model.)

Stepfun$0.10$0.30262K見る →

Xiaomi: MiMo-V2-FlashはXiaomiが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大262Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.1/100万トークン、出力 $0.3/100万トークン。(公式説明:MiMo-V2-Flash is an open-source foundation language model developed by Xiaomi.)

Xiaomi$0.10$0.30262K見る →

Z.ai: GLM 4 32B はZ-aiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大128Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.1/100万トークン、出力 $0.1/100万トークン。(公式説明:GLM 4 32B is a cost-effective foundation language model.)

Z-ai$0.10$0.10128K見る →

Qwen: Qwen3 VL 32B InstructはAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.104/100万トークン、出力 $0.416/100万トークン。(公式説明:Qwen3-VL-32B-Instruct is a large-scale multimodal vision-language model designed for high-precision understanding and reasoning across text, images, and video.)

Alibaba$0.104$0.416131K見る →

Mistral: Mistral 7B Instruct v0.1はMistral AIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大3Kトークン。対応機能:APIアクセス。料金:入力 $0.11/100万トークン、出力 $0.19/100万トークン。(公式説明:A 7.3B parameter model that outperforms Llama 2 13B on all benchmarks, with optimizations for speed and context length.)

Mistral AI$0.11$0.193K見る →

Google: Gemma 4 31BはGoogleが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.12/100万トークン、出力 $0.37/100万トークン。(公式説明:Gemma 4 31B Instruct is Google DeepMind's 30.7B dense multimodal model supporting text and image input with text output.)

Google$0.12$0.37262K見る →

Qwen: Qwen3 VL 30B A3B InstructはAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.13/100万トークン、出力 $0.52/100万トークン。(公式説明:Qwen3-VL-30B-A3B-Instruct is a multimodal model that unifies strong text generation with visual understanding for images and videos.)

Alibaba$0.13$0.52131K見る →

Nous: Hermes 4 70BはNous Researchが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:APIアクセス。料金:入力 $0.13/100万トークン、出力 $0.4/100万トークン。(公式説明:Hermes 4 70B is a hybrid reasoning model from Nous Research, built on Meta-Llama-3.1-70B.)

Nous Research$0.13$0.40131K見る →

Z.ai: GLM 4.5 AirはZ-aiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.13/100万トークン、出力 $0.85/100万トークン。(公式説明:GLM-4.5-Air is the lightweight variant of our latest flagship model family, also purpose-built for agent-centric applications.)

Z-ai$0.13$0.85131K見る →

Nex AGI: DeepSeek V3.1 Nex N1はNex-agiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.135/100万トークン、出力 $0.5/100万トークン。(公式説明:DeepSeek V3.1 Nex-N1 is the flagship release of the Nex-N1 series — a post-trained model designed to highlight agent autonomy, tool use, and real-world productivity.)

Nex-agi$0.135$0.50131K見る →

Qwen: Qwen VL PlusはAlibabaが提供する汎用チャット向けAIモデルで、低速だが高性能が特徴です。コンテキスト長は最大131Kトークン。対応機能:画像認識、APIアクセス。料金:入力 $0.1365/100万トークン、出力 $0.4095/100万トークン。(公式説明:Qwen's Enhanced Large Visual Language Model.)

Alibaba$0.1365$0.4095131K見る →

Qwen: Qwen3.5-35B-A3BはAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.14/100万トークン、出力 $1/100万トークン。(公式説明:The Qwen3.5 Series 35B-A3B is a native vision-language model designed with a hybrid architecture that integrates linear attention mechanisms and a sparse mixture-of-experts model, achieving higher inference efficiency.)

Alibaba$0.14$1.00262K見る →

Baidu: ERNIE 4.5 VL 28B A3BはBaiduが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大30Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.14/100万トークン、出力 $0.56/100万トークン。(公式説明:A powerful multimodal Mixture-of-Experts chat model featuring 28B total parameters with 3B activated per token, delivering exceptional text and vision understanding through its innovative heterogeneous MoE structure with modality-isolated routing)

Baidu$0.14$0.5630K見る →

DeepSeek: DeepSeek V4 FlashはDeepSeekが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大1Mトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.14/100万トークン、出力 $0.28/100万トークン。(公式説明:DeepSeek V4 Flash is an efficiency-optimized Mixture-of-Experts model from DeepSeek with 284B total parameters and 13B activated parameters, supporting a 1M-token context window.)

DeepSeek$0.14$0.281.0M見る →

NousResearch: Hermes 2 Pro - Llama-3 8BはNous Researchが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大8Kトークン。対応機能:APIアクセス。料金:入力 $0.14/100万トークン、出力 $0.14/100万トークン。(公式説明:Hermes 2 Pro is an upgraded, retrained version of Nous Hermes 2, consisting of an updated and cleaned version of the OpenHermes 2.5 Dataset, as well as a newly introduced)

Nous Research$0.14$0.148K見る →

Tencent: Hunyuan A13B InstructはTencentが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:APIアクセス。料金:入力 $0.14/100万トークン、出力 $0.57/100万トークン。(公式説明:Hunyuan-A13B is a 13B active parameter Mixture-of-Experts (MoE) language model developed by Tencent, with a total parameter count of 80B and support for reasoning via Chain-of-Thought.)

Tencent$0.14$0.57131K見る →

Qwen: Qwen3.6 35B A3BはAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.15/100万トークン、出力 $1/100万トークン。(公式説明:Qwen3.6-35B-A3B is an open-weight multimodal model from Alibaba Cloud with 35 billion total parameters and 3 billion active parameters per token.)

Alibaba$0.15$1.00262K見る →

AllenAI: Olmo 3 32B ThinkはAllen AIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大66Kトークン。対応機能:APIアクセス。料金:入力 $0.15/100万トークン、出力 $0.5/100万トークン。(公式説明:Olmo 3 32B Think is a large-scale, 32-billion-parameter model purpose-built for deep reasoning, complex logic chains and advanced instruction-following scenarios.)

Allen AI$0.15$0.5066K見る →

Arcee AI: Trinity Large PreviewはArcee-aiが提供する汎用チャット向けAIモデルで、低速だが高性能が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.15/100万トークン、出力 $0.45/100万トークン。(公式説明:Trinity-Large-Preview is a frontier-scale open-weight language model from Arcee, built as a 400B-parameter sparse Mixture-of-Experts with 13B active parameters per token using 4-of-256 expert routing.)

Arcee-ai$0.15$0.45131K見る →

Cohere: Command R (08-2024)はCohereが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大128Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.15/100万トークン、出力 $0.6/100万トークン。(公式説明:command-r-08-2024 is an update of the Command R with improved performance for multilingual retrieval-augmented generation (RAG) and tool use.)

Cohere$0.15$0.60128K見る →

EssentialAI: Rnj 1 InstructはEssentialaiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大33Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.15/100万トークン、出力 $0.15/100万トークン。(公式説明:Rnj-1 is an 8B-parameter, dense, open-weight model family developed by Essential AI and trained from scratch with a focus on programming, math, and scientific reasoning.)

Essentialai$0.15$0.1533K見る →

Meta: Llama 4 MaverickはMetaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、APIアクセス。料金:入力 $0.15/100万トークン、出力 $0.6/100万トークン。(公式説明:Llama 4 Maverick 17B Instruct (128E) is a high-capacity multimodal language model from Meta, built on a mixture-of-experts (MoE) architecture with 128 experts and 17 billion active parameters per forward)

Meta$0.15$0.601.0M見る →

MiniMax: MiniMax M2.5はMiniMaxが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大197Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.15/100万トークン、出力 $1.15/100万トークン。(公式説明:MiniMax-M2.5 is a SOTA large language model designed for real-world productivity.)

MiniMax$0.15$1.15197K見る →

Mistral: Ministral 3 8B 2512はMistral AIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大262Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.15/100万トークン、出力 $0.15/100万トークン。(公式説明:A balanced model in the Ministral 3 family, Ministral 3 8B is a powerful, efficient tiny language model with vision capabilities.)

Mistral AI$0.15$0.15262K見る →

Mistral: Mistral Small 4はMistral AIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大262Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.15/100万トークン、出力 $0.6/100万トークン。(公式説明:Mistral Small 4 is the next major release in the Mistral Small family, unifying the capabilities of several flagship Mistral models into a single system.)

Mistral AI$0.15$0.60262K見る →

OpenAI: GPT-4o-miniはOpenAIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大128Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.15/100万トークン、出力 $0.6/100万トークン。(公式説明:GPT-4o mini is OpenAI's newest model after GPT-4 Omni, supporting both text and image inputs with text outputs.)

OpenAI$0.15$0.60128K見る →

OpenAI: GPT-4o-mini (2024-07-18)はOpenAIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大128Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.15/100万トークン、出力 $0.6/100万トークン。(公式説明:GPT-4o mini is OpenAI's newest model after GPT-4 Omni, supporting both text and image inputs with text outputs.)

OpenAI$0.15$0.60128K見る →

OpenAI: GPT-4o-mini Search PreviewはOpenAIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大128Kトークン。対応機能:APIアクセス。料金:入力 $0.15/100万トークン、出力 $0.6/100万トークン。(公式説明:GPT-4o mini Search Preview is a specialized model for web search in Chat Completions.)

OpenAI$0.15$0.60128K見る →

Upstage: Solar Pro 3はUpstageが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大128Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.15/100万トークン、出力 $0.6/100万トークン。(公式説明:Solar Pro 3 is Upstage's powerful Mixture-of-Experts (MoE) language model.)

Upstage$0.15$0.60128K見る →

TheDrummer: Rocinante 12BはTheDrummerが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大33Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.17/100万トークン、出力 $0.43/100万トークン。(公式説明:Rocinante 12B is designed for engaging storytelling and rich prose.)

TheDrummer$0.17$0.4333K見る →

Arcee AI: SpotlightはArcee-aiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:画像認識、APIアクセス。料金:入力 $0.18/100万トークン、出力 $0.18/100万トークン。(公式説明:Spotlight is a 7‑billion‑parameter vision‑language model derived from Qwen 2.5‑VL and fine‑tuned by Arcee AI for tight image‑text grounding tasks.)

Arcee-ai$0.18$0.18131K見る →

Meta: Llama Guard 4 12BはMetaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大164Kトークン。対応機能:画像認識、APIアクセス。料金:入力 $0.18/100万トークン、出力 $0.18/100万トークン。(公式説明:Llama Guard 4 is a Llama 4 Scout-derived multimodal pretrained model, fine-tuned for content safety classification.)

Meta$0.18$0.18164K見る →

Qwen: Qwen3.5-27BはAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.195/100万トークン、出力 $1.56/100万トークン。(公式説明:The Qwen3.5 27B native vision-language Dense model incorporates a linear attention mechanism, delivering fast response times while balancing inference speed and performance.)

Alibaba$0.195$1.56262K見る →

Qwen: Qwen3 VL 235B A22B InstructはAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.2/100万トークン、出力 $0.88/100万トークン。(公式説明:Qwen3-VL-235B-A22B Instruct is an open-weight multimodal model that unifies strong text generation with visual understanding across images and video.)

Alibaba$0.20$0.88262K見る →

DeepSeek: DeepSeek V3 0324はDeepSeekが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大164Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.2/100万トークン、出力 $0.77/100万トークン。(公式説明:DeepSeek V3, a 685B-parameter, mixture-of-experts model, is the latest iteration of the flagship chat model family from the DeepSeek team.)

DeepSeek$0.20$0.77164K見る →

MiniMax: MiniMax-01はMiniMaxが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、APIアクセス。料金:入力 $0.2/100万トークン、出力 $1.1/100万トークン。(公式説明:MiniMax-01 is a combines MiniMax-Text-01 for text generation and MiniMax-VL-01 for image understanding.)

MiniMax$0.20$1.101.0M見る →

Mistral: Ministral 3 14B 2512はMistral AIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大262Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.2/100万トークン、出力 $0.2/100万トークン。(公式説明:The largest model in the Ministral 3 family, Ministral 3 14B offers frontier capabilities and performance comparable to its larger Mistral Small 3.2 24B counterpart.)

Mistral AI$0.20$0.20262K見る →

Mistral: SabaはMistral AIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大33Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.2/100万トークン、出力 $0.6/100万トークン。(公式説明:Mistral Saba is a 24B-parameter language model specifically designed for the Middle East and South Asia, delivering accurate and contextually relevant responses while maintaining efficient performance.)

Mistral AI$0.20$0.6033K見る →

OpenAI: GPT-5.4 NanoはOpenAIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大400Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.2/100万トークン、出力 $1.25/100万トークン。(公式説明:GPT-5.4 nano is the most lightweight and cost-efficient variant of the GPT-5.4 family, optimized for speed-critical and high-volume tasks.)

OpenAI$0.20$1.25400K見る →

Prime Intellect: INTELLECT-3はPrime-intellectが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.2/100万トークン、出力 $1.1/100万トークン。(公式説明:INTELLECT-3 is a 106B-parameter Mixture-of-Experts model (12B active) post-trained from GLM-4.5-Air-Base using supervised fine-tuning (SFT) followed by large-scale reinforcement learning (RL).)

Prime-intellect$0.20$1.10131K見る →

xAI: Grok 4 FastはxAIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大2Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.2/100万トークン、出力 $0.5/100万トークン。(公式説明:Grok 4 Fast is xAI's latest multimodal model with SOTA cost-efficiency and a 2M token context window.)

xAI$0.20$0.502.0M見る →

xAI: Grok 4.1 FastはxAIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大2Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.2/100万トークン、出力 $0.5/100万トークン。(公式説明:Grok 4.1 Fast is xAI's best agentic tool calling model that shines in real-world use cases like customer support and deep research.)

xAI$0.20$0.502.0M見る →

DeepSeek: DeepSeek V3.1はDeepSeekが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大164Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.21/100万トークン、出力 $0.79/100万トークン。(公式説明:DeepSeek-V3.1 is a large hybrid reasoning model (671B parameters, 37B active) that supports both thinking and non-thinking modes via prompt templates.)

DeepSeek$0.21$0.79164K見る →

Meta: Llama 3.2 11B Vision InstructはMetaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:画像認識、APIアクセス。料金:入力 $0.245/100万トークン、出力 $0.245/100万トークン。(公式説明:Llama 3.2 11B Vision is a multimodal model with 11 billion parameters, designed to handle tasks combining visual and textual data.)

Meta$0.245$0.245131K見る →

Qwen: Qwen2.5 VL 72B InstructはAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大32Kトークン。対応機能:画像認識、APIアクセス。料金:入力 $0.25/100万トークン、出力 $0.75/100万トークン。(公式説明:Qwen2.5-VL is proficient in recognizing common objects such as flowers, birds, fish, and insects.)

Alibaba$0.25$0.7532K見る →

Qwen: Qwen3.6 FlashはAlibabaが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.25/100万トークン、出力 $1.5/100万トークン。(公式説明:Qwen3.6 Flash is a fast, efficient language model from Alibaba's Qwen 3.6 series.)

Alibaba$0.25$1.501.0M見る →

Anthropic: Claude 3 HaikuはAnthropicが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大200Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.25/100万トークン、出力 $1.25/100万トークン。(公式説明:Claude 3 Haiku is Anthropic's fastest and most compact model for near-instant responsiveness.)

Anthropic$0.25$1.25200K見る →

ByteDance Seed: Seed 1.6はBytedance-seedが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.25/100万トークン、出力 $2/100万トークン。(公式説明:Seed 1.6 is a general-purpose model released by the ByteDance Seed team.)

Bytedance-seed$0.25$2.00262K見る →

ByteDance Seed: Seed-2.0-LiteはBytedance-seedが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大262Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.25/100万トークン、出力 $2/100万トークン。(公式説明:Seed-2.0-Lite is a versatile, cost‑efficient enterprise workhorse that delivers strong multimodal and agent capabilities while offering noticeably lower latency, making it a practical default choice for most production workloads across)

Bytedance-seed$0.25$2.00262K見る →

Google: Gemini 3.1 Flash LiteはGoogleが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.25/100万トークン、出力 $1.5/100万トークン。(公式説明:Gemini 3.1 Flash Lite is Google’s GA high-efficiency multimodal model optimized for low-latency, high-volume workloads.)

Google$0.25$1.501.0M見る →

Google: Gemini 3.1 Flash Lite PreviewはGoogleが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.25/100万トークン、出力 $1.5/100万トークン。(公式説明:Gemini 3.1 Flash Lite Preview is Google's high-efficiency model optimized for high-volume use cases.)

Google$0.25$1.501.0M見る →

Inception: Mercury 2はInceptionが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大128Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.25/100万トークン、出力 $0.75/100万トークン。(公式説明:Mercury 2 is an extremely fast reasoning LLM, and the first reasoning diffusion LLM (dLLM).)

Inception$0.25$0.75128K見る →

OpenAI: GPT-5 MiniはOpenAIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大400Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.25/100万トークン、出力 $2/100万トークン。(公式説明:GPT-5 Mini is a compact version of GPT-5, designed to handle lighter-weight reasoning tasks.)

OpenAI$0.25$2.00400K見る →

OpenAI: GPT-5.1-Codex-MiniはOpenAIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大400Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.25/100万トークン、出力 $2/100万トークン。(公式説明:GPT-5.1-Codex-Mini is a smaller and faster version of GPT-5.1-Codex)

OpenAI$0.25$2.00400K見る →

DeepSeek: DeepSeek V3.2はDeepSeekが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.252/100万トークン、出力 $0.378/100万トークン。(公式説明:DeepSeek-V3.2 is a large language model designed to harmonize high computational efficiency with strong reasoning and agentic tool-use performance.)

DeepSeek$0.252$0.378131K見る →

MiniMax: MiniMax M2はMiniMaxが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大197Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.255/100万トークン、出力 $1/100万トークン。(公式説明:MiniMax-M2 is a compact, high-efficiency large language model optimized for end-to-end coding and agentic workflows.)

MiniMax$0.255$1.00197K見る →

Qwen: Qwen Plus 0728はAlibabaが提供する汎用チャット向けAIモデルで、低速だが高性能が特徴です。コンテキスト長は最大1Mトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.26/100万トークン、出力 $0.78/100万トークン。(公式説明:Qwen Plus 0728, based on the Qwen3 foundation model, is a 1 million context hybrid reasoning model with a balanced performance, speed, and cost combination.)

Alibaba$0.26$0.781.0M見る →

Qwen: Qwen-PlusはAlibabaが提供する汎用チャット向けAIモデルで、低速だが高性能が特徴です。コンテキスト長は最大1Mトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.26/100万トークン、出力 $0.78/100万トークン。(公式説明:Qwen-Plus, based on the Qwen2.5 foundation model, is a 131K context model with a balanced performance, speed, and cost combination.)

Alibaba$0.26$0.781.0M見る →

Qwen: Qwen3.5 Plus 2026-02-15はAlibabaが提供する汎用チャット向けAIモデルで、低速だが高性能が特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.26/100万トークン、出力 $1.56/100万トークン。(公式説明:The Qwen3.5 native vision-language series Plus models are built on a hybrid architecture that integrates linear attention mechanisms with sparse mixture-of-experts models, achieving higher inference efficiency.)

Alibaba$0.26$1.561.0M見る →

Qwen: Qwen3.5-122B-A10BはAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.26/100万トークン、出力 $2.08/100万トークン。(公式説明:The Qwen3.5 122B-A10B native vision-language model is built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency.)

Alibaba$0.26$2.08262K見る →

DeepSeek: DeepSeek V3.1 TerminusはDeepSeekが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大164Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.27/100万トークン、出力 $0.95/100万トークン。(公式説明:DeepSeek-V3.1 Terminus is an update to DeepSeek V3.1 that maintains the model's original capabilities while addressing issues reported by users, including language consistency and agent capabilities, further optimizing the model's)

DeepSeek$0.27$0.95164K見る →

DeepSeek: DeepSeek V3.2 ExpはDeepSeekが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大164Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.27/100万トークン、出力 $0.41/100万トークン。(公式説明:DeepSeek-V3.2-Exp is an experimental large language model released by DeepSeek as an intermediate step between V3.1 and future architectures.)

DeepSeek$0.27$0.41164K見る →

Baidu: ERNIE 4.5 300B A47B はBaiduが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大123Kトークン。対応機能:APIアクセス。料金:入力 $0.28/100万トークン、出力 $1.1/100万トークン。(公式説明:ERNIE-4.5-300B-A47B is a 300B parameter Mixture-of-Experts (MoE) language model developed by Baidu as part of the ERNIE 4.5 series.)

Baidu$0.28$1.10123K見る →

DeepSeek: DeepSeek V3.2 SpecialeはDeepSeekが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大164Kトークン。対応機能:APIアクセス。料金:入力 $0.287/100万トークン、出力 $0.431/100万トークン。(公式説明:DeepSeek-V3.2-Speciale is a high-compute variant of DeepSeek-V3.2 optimized for maximum reasoning and agentic performance.)

DeepSeek$0.287$0.431164K見る →

MiniMax: MiniMax M2.1はMiniMaxが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大197Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.29/100万トークン、出力 $0.95/100万トークン。(公式説明:MiniMax-M2.1 is a lightweight, state-of-the-art large language model optimized for coding, agentic workflows, and modern application development.)

MiniMax$0.29$0.95197K見る →

MiniMax: MiniMax M2.7はMiniMaxが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大197Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.299/100万トークン、出力 $1.2/100万トークン。(公式説明:MiniMax-M2.7 is a next-generation large language model designed for autonomous, real-world productivity and continuous improvement.)

MiniMax$0.299$1.20197K見る →

Amazon: Nova 2 LiteはAmazonが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.3/100万トークン、出力 $2.5/100万トークン。(公式説明:Nova 2 Lite is a fast, cost-effective reasoning model for everyday workloads that can process text, images, and videos to generate text.)

Amazon$0.30$2.501.0M見る →

Google: Gemini 2.5 FlashはGoogleが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.3/100万トークン、出力 $2.5/100万トークン。(公式説明:Gemini 2.5 Flash is Google's state-of-the-art workhorse model, specifically designed for advanced reasoning, coding, mathematics, and scientific tasks.)

Google$0.30$2.501.0M見る →

inclusionAI: Ling-2.6-1TはInclusionaiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.3/100万トークン、出力 $2.5/100万トークン。(公式説明:Ling-2.6-1T is an instant (instruct) model from inclusionAI and the company’s trillion-parameter flagship, designed for real-world agents that require fast execution and high efficiency at scale.)

Inclusionai$0.30$2.50262K見る →

MiniMax: MiniMax M2-herはMiniMaxが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大66Kトークン。対応機能:APIアクセス。料金:入力 $0.3/100万トークン、出力 $1.2/100万トークン。(公式説明:MiniMax M2-her is a dialogue-first large language model built for immersive roleplay, character-driven chat, and expressive multi-turn conversations.)

MiniMax$0.30$1.2066K見る →

Nous: Hermes 3 70B InstructはNous Researchが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:APIアクセス。料金:入力 $0.3/100万トークン、出力 $0.3/100万トークン。(公式説明:Hermes 3 is a generalist language model with many improvements over Hermes 2, including advanced agentic capabilities, much better roleplaying, reasoning, multi-turn conversation, long context coherence, and improvements across the)

Nous Research$0.30$0.30131K見る →

TheDrummer: Cydonia 24B V4.1はTheDrummerが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:APIアクセス。料金:入力 $0.3/100万トークン、出力 $0.5/100万トークン。(公式説明:Uncensored and creative writing model based on Mistral Small 3.2 24B with good recall, prompt adherence, and intelligence.)

TheDrummer$0.30$0.50131K見る →

Z.ai: GLM 4.6VはZ-aiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.3/100万トークン、出力 $0.9/100万トークン。(公式説明:GLM-4.6V is a large multimodal model designed for high-fidelity visual understanding and long-context reasoning across images, documents, and mixed media.)

Z-ai$0.30$0.90131K見る →

xAI: Grok 3 MiniはxAIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.3/100万トークン、出力 $0.5/100万トークン。(公式説明:A lightweight model that thinks before responding.)

xAI$0.30$0.50131K見る →

xAI: Grok 3 Mini BetaはxAIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.3/100万トークン、出力 $0.5/100万トークン。(公式説明:Grok 3 Mini is a lightweight, smaller thinking model.)

xAI$0.30$0.50131K見る →

Qwen: Qwen3.6 27BはAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.32/100万トークン、出力 $3.2/100万トークン。(公式説明:Qwen3.6 27B is a dense 27-billion-parameter language model from the Qwen Team at Alibaba, released in April 2026.)

Alibaba$0.32$3.20262K見る →

DeepSeek: DeepSeek V3はDeepSeekが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大164Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.32/100万トークン、出力 $0.89/100万トークン。(公式説明:DeepSeek-V3 is the latest model from the DeepSeek team, building upon the instruction following and coding abilities of the previous versions.)

DeepSeek$0.32$0.89164K見る →

Qwen: Qwen3.6 PlusはAlibabaが提供する汎用チャット向けAIモデルで、低速だが高性能が特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.325/100万トークン、出力 $1.95/100万トークン。(公式説明:Qwen 3.6 Plus builds on a hybrid architecture that combines efficient linear attention with sparse mixture-of-experts routing, enabling strong scalability and high-performance inference.)

Alibaba$0.325$1.951.0M見る →

Mistral: Mistral Small 3.1 24BはMistral AIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大128Kトークン。対応機能:画像認識、APIアクセス。料金:入力 $0.35/100万トークン、出力 $0.56/100万トークン。(公式説明:Mistral Small 3.1 24B Instruct is an upgraded variant of Mistral Small 3 (2501), featuring 24 billion parameters with advanced multimodal capabilities.)

Mistral AI$0.35$0.56128K見る →

Qwen2.5 72B InstructはAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大33Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.36/100万トークン、出力 $0.4/100万トークン。(公式説明:Qwen2.5 72B is the latest series of Qwen large language models.)

Alibaba$0.36$0.4033K見る →

Qwen: Qwen3.5 397B A17BはAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.39/100万トークン、出力 $2.34/100万トークン。(公式説明:The Qwen3.5 series 397B-A17B native vision-language model is built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency.)

Alibaba$0.39$2.34262K見る →

Z.ai: GLM 4.6はZ-aiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大205Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.39/100万トークン、出力 $1.9/100万トークン。(公式説明:Compared with GLM-4.5, this generation brings several key improvements: Longer context window: The context window has been expanded from 128K to 200K tokens, enabling the model to handle more complex)

Z-ai$0.39$1.90205K見る →

Qwen: Qwen3.5 Plus 2026-04-20はAlibabaが提供する汎用チャット向けAIモデルで、低速だが高性能が特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.4/100万トークン、出力 $2.4/100万トークン。(公式説明:Qwen3.5 Plus (April 2026) is a large-scale multimodal language model from Alibaba.)

Alibaba$0.40$2.401.0M見る →

Meta: Llama 3.1 70B InstructはMetaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.4/100万トークン、出力 $0.4/100万トークン。(公式説明:Meta's latest class of model (Llama 3.1) launched with a variety of sizes & flavors.)

Meta$0.40$0.40131K見る →

MiniMax: MiniMax M1はMiniMaxが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大1Mトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.4/100万トークン、出力 $2.2/100万トークン。(公式説明:MiniMax-M1 is a large-scale, open-weight reasoning model designed for extended context and high-efficiency inference.)

MiniMax$0.40$2.201.0M見る →

Mistral: Devstral 2 2512はMistral AIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.4/100万トークン、出力 $2/100万トークン。(公式説明:Devstral 2 is a state-of-the-art open-source model by Mistral AI specializing in agentic coding.)

Mistral AI$0.40$2.00262K見る →

Mistral: Devstral MediumはMistral AIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.4/100万トークン、出力 $2/100万トークン。(公式説明:Devstral Medium is a high-performance code generation and agentic reasoning model developed jointly by Mistral AI and All Hands AI.)

Mistral AI$0.40$2.00131K見る →

Mistral: Mistral Medium 3はMistral AIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.4/100万トークン、出力 $2/100万トークン。(公式説明:Mistral Medium 3 is a high-performance enterprise-grade language model designed to deliver frontier-level capabilities at significantly reduced operational cost.)

Mistral AI$0.40$2.00131K見る →

Mistral: Mistral Medium 3.1はMistral AIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.4/100万トークン、出力 $2/100万トークン。(公式説明:Mistral Medium 3.1 is an updated version of Mistral Medium 3, which is a high-performance enterprise-grade language model designed to deliver frontier-level capabilities at significantly reduced operational cost.)

Mistral AI$0.40$2.00131K見る →

MoonshotAI: Kimi K2 0905はMoonshotaiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.4/100万トークン、出力 $2/100万トークン。(公式説明:Kimi K2 0905 is the September update of Kimi K2 0711.)

Moonshotai$0.40$2.00262K見る →

MoonshotAI: Kimi K2.5はMoonshotaiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.4/100万トークン、出力 $1.98/100万トークン。(公式説明:Kimi K2.5 is Moonshot AI's native multimodal model, delivering state-of-the-art visual coding capability and a self-directed agent swarm paradigm.)

Moonshotai$0.40$1.98262K見る →

OpenAI: GPT-4.1 MiniはOpenAIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.4/100万トークン、出力 $1.6/100万トークン。(公式説明:GPT-4.1 Mini is a mid-sized model delivering performance competitive with GPT-4o at substantially lower latency and cost.)

OpenAI$0.40$1.601.0M見る →

TheDrummer: UnslopNemo 12BはTheDrummerが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大33Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.4/100万トークン、出力 $0.4/100万トークン。(公式説明:UnslopNemo v4.1 is the latest addition from the creator of Rocinante, designed for adventure writing and role-play scenarios.)

TheDrummer$0.40$0.4033K見る →

Xiaomi: MiMo-V2-OmniはXiaomiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.4/100万トークン、出力 $2/100万トークン。(公式説明:MiMo-V2-Omni is a frontier omni-modal model that natively processes image, video, and audio inputs within a unified architecture.)

Xiaomi$0.40$2.00262K見る →

Xiaomi: MiMo-V2.5はXiaomiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.4/100万トークン、出力 $2/100万トークン。(公式説明:MiMo-V2.5 is a native omnimodal model by Xiaomi.)

Xiaomi$0.40$2.001.0M見る →

Z.ai: GLM 4.7はZ-aiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大203Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.4/100万トークン、出力 $1.75/100万トークン。(公式説明:GLM-4.7 is Z.ai’s latest flagship model, featuring upgrades in two key areas: enhanced programming capabilities and more stable multi-step reasoning/execution.)

Z-ai$0.40$1.75203K見る →

Baidu: ERNIE 4.5 VL 424B A47B はBaiduが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大123Kトークン。対応機能:画像認識、APIアクセス。料金:入力 $0.42/100万トークン、出力 $1.25/100万トークン。(公式説明:ERNIE-4.5-VL-424B-A47B is a multimodal Mixture-of-Experts (MoE) model from Baidu’s ERNIE 4.5 series, featuring 424B total parameters with 47B active per token.)

Baidu$0.42$1.25123K見る →

DeepSeek: DeepSeek V4 ProはDeepSeekが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大1Mトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.435/100万トークン、出力 $0.87/100万トークン。(公式説明:DeepSeek V4 Pro is a large-scale Mixture-of-Experts model from DeepSeek with 1.6T total parameters and 49B activated parameters, supporting a 1M-token context window.)

DeepSeek$0.435$0.871.0M見る →

ReMM SLERP 13BはUndi95が提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大6Kトークン。対応機能:APIアクセス。料金:入力 $0.45/100万トークン、出力 $0.65/100万トークン。(公式説明:A recreation trial of the original MythoMax-L2-B13 but with updated models.)

Undi95$0.45$0.656K見る →

Qwen: Qwen3 235B A22BはAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.455/100万トークン、出力 $1.82/100万トークン。(公式説明:Qwen3-235B-A22B is a 235B parameter mixture-of-experts (MoE) model developed by Qwen, activating 22B parameters per forward pass.)

Alibaba$0.455$1.82131K見る →

Llama Guard 3 8BはMetaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:APIアクセス。料金:入力 $0.48/100万トークン、出力 $0.03/100万トークン。(公式説明:Llama Guard 3 is a Llama-3.1-8B pretrained model, fine-tuned for content safety classification.)

Meta$0.48$0.03131K見る →

Google: Gemini 3 Flash PreviewはGoogleが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.5/100万トークン、出力 $3/100万トークン。(公式説明:Gemini 3 Flash Preview is a high speed, high value thinking model designed for agentic workflows, multi turn chat, and coding assistance.)

Google$0.50$3.001.0M見る →

Mistral: Mistral Large 3 2512はMistral AIが提供する汎用チャット向けAIモデルで、低速だが高性能が特徴です。コンテキスト長は最大262Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.5/100万トークン、出力 $1.5/100万トークン。(公式説明:Mistral Large 3 2512 is Mistral’s most capable model to date, featuring a sparse mixture-of-experts architecture with 41B active parameters (675B total), and released under the Apache 2.0 license.)

Mistral AI$0.50$1.50262K見る →

OpenAI: GPT-3.5 TurboはOpenAIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大16Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.5/100万トークン、出力 $1.5/100万トークン。(公式説明:GPT-3.5 Turbo is OpenAI's fastest model.)

OpenAI$0.50$1.5016K見る →

Google Gemini Flash Latestは~googleが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.5/100万トークン、出力 $3/100万トークン。(公式説明:This model always redirects to the latest model in the Google Gemini Flash family.)

~google$0.50$3.001.0M見る →

Meta: Llama 3 70B InstructはMetaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大8Kトークン。対応機能:APIアクセス。料金:入力 $0.51/100万トークン、出力 $0.74/100万トークン。(公式説明:Meta's latest class of model (Llama 3) launched with a variety of sizes & flavors.)

Meta$0.51$0.748K見る →

Qwen: Qwen VL MaxはAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.52/100万トークン、出力 $2.08/100万トークン。(公式説明:Qwen VL Max is a visual understanding model with 7500 tokens context length.)

Alibaba$0.52$2.08131K見る →

TheDrummer: Skyfall 36B V2はTheDrummerが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大33Kトークン。対応機能:APIアクセス。料金:入力 $0.55/100万トークン、出力 $0.8/100万トークン。(公式説明:Skyfall 36B v2 is an enhanced iteration of Mistral Small 2501, specifically fine-tuned for improved creativity, nuanced writing, role-playing, and coherent storytelling.)

TheDrummer$0.55$0.8033K見る →

MoonshotAI: Kimi K2 0711はMoonshotaiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.57/100万トークン、出力 $2.3/100万トークン。(公式説明:Kimi K2 Instruct is a large-scale Mixture-of-Experts (MoE) language model developed by Moonshot AI, featuring 1 trillion total parameters with 32 billion active per forward pass.)

Moonshotai$0.57$2.30131K見る →

OpenAI: GPT Audio MiniはOpenAIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大128Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.6/100万トークン、出力 $2.4/100万トークン。(公式説明:A cost-efficient version of GPT Audio.)

OpenAI$0.60$2.40128K見る →

Writer: Palmyra X5はWriterが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大1Mトークン。対応機能:APIアクセス。料金:入力 $0.6/100万トークン、出力 $6/100万トークン。(公式説明:Palmyra X5 is Writer's most advanced model, purpose-built for building and scaling AI agents across the enterprise.)

Writer$0.60$6.001.0M見る →

Z.ai: GLM 4.5はZ-aiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.6/100万トークン、出力 $2.2/100万トークン。(公式説明:GLM-4.5 is our latest flagship foundation model, purpose-built for agent-based applications.)

Z-ai$0.60$2.20131K見る →

Z.ai: GLM 4.5VはZ-aiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大66Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.6/100万トークン、出力 $1.8/100万トークン。(公式説明:GLM-4.5V is a vision-language foundation model for multimodal agent applications.)

Z-ai$0.60$1.8066K見る →

Z.ai: GLM 5はZ-aiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大203Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.6/100万トークン、出力 $1.92/100万トークン。(公式説明:GLM-5 is Z.ai’s flagship open-source foundation model engineered for complex systems design and long-horizon agent workflows.)

Z-ai$0.60$1.92203K見る →

WizardLM-2 8x22BはMicrosoftが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大66Kトークン。対応機能:APIアクセス。料金:入力 $0.62/100万トークン、出力 $0.62/100万トークン。(公式説明:WizardLM-2 8x22B is Microsoft AI's most advanced Wizard model.)

Microsoft$0.62$0.6266K見る →

Google: Gemma 2 27BはGoogleが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大8Kトークン。対応機能:APIアクセス。料金:入力 $0.65/100万トークン、出力 $0.65/100万トークン。(公式説明:Gemma 2 27B by Google is an open model built from the same research and technology used to create the Gemini models.)

Google$0.65$0.658K見る →

Sao10K: Llama 3.3 Euryale 70BはSao10Kが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:APIアクセス。料金:入力 $0.65/100万トークン、出力 $0.75/100万トークン。(公式説明:Euryale L3.3 70B is a model focused on creative roleplay from Sao10k.)

Sao10K$0.65$0.75131K見る →

AionLabs: Aion-1.0-MiniはAion-labsが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大131Kトークン。対応機能:APIアクセス。料金:入力 $0.7/100万トークン、出力 $1.4/100万トークン。(公式説明:Aion-1.0-Mini 32B parameter model is a distilled version of the DeepSeek-R1 model, designed for strong performance in reasoning domains such as mathematics, coding, and logic.)

Aion-labs$0.70$1.40131K見る →

MoonshotAI: Kimi K2.6はMoonshotaiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大33Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.74/100万トークン、出力 $3.5/100万トークン。(公式説明:Kimi K2.6 is Moonshot AI's next-generation multimodal model, designed for long-horizon coding, coding-driven UI/UX generation, and multi-agent orchestration.)

Moonshotai$0.74$3.5033K見る →

MoonshotAI Kimi Latestは~moonshotaiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大33Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.74/100万トークン、出力 $3.5/100万トークン。(公式説明:This model always redirects to the latest model in the MoonshotAI Kimi family.)

~moonshotai$0.74$3.5033K見る →

Arcee AI: Virtuoso LargeはArcee-aiが提供する汎用チャット向けAIモデルで、低速だが高性能が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.75/100万トークン、出力 $1.2/100万トークン。(公式説明:Virtuoso‑Large is Arcee's top‑tier general‑purpose LLM at 72 B parameters, tuned to tackle cross‑domain reasoning, creative writing and enterprise QA.)

Arcee-ai$0.75$1.20131K見る →

Mancer: Weaver (alpha)はMancerが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大8Kトークン。対応機能:APIアクセス。料金:入力 $0.75/100万トークン、出力 $1/100万トークン。(公式説明:An attempt to recreate Claude-style verbosity, but don't expect the same level of coherence or memory.)

Mancer$0.75$1.008K見る →

OpenAI: GPT-5.4 MiniはOpenAIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大400Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.75/100万トークン、出力 $4.5/100万トークン。(公式説明:GPT-5.4 mini brings the core capabilities of GPT-5.4 to a faster, more efficient model optimized for high-throughput workloads.)

OpenAI$0.75$4.50400K見る →

OpenAI GPT Mini Latestは~openaiが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大400Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.75/100万トークン、出力 $4.5/100万トークン。(公式説明:This model always redirects to the latest model in the OpenAI GPT Mini family.)

~openai$0.75$4.50400K見る →

Qwen: Qwen3 MaxはAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.78/100万トークン、出力 $3.9/100万トークン。(公式説明:Qwen3-Max is an updated release built on the Qwen3 series, offering major improvements in reasoning, instruction following, multilingual support, and long-tail knowledge coverage compared to the January 2025 version.)

Alibaba$0.78$3.90262K見る →

Claude HaikuはAnthropicの最速・最軽量モデルで、ほぼリアルタイムの応答を実現します。

Anthropic$0.80$4.00200K見る →

AionLabs: Aion-2.0はAion-labsが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:APIアクセス。料金:入力 $0.8/100万トークン、出力 $1.6/100万トークン。(公式説明:Aion-2.0 is a variant of DeepSeek V3.2 optimized for immersive roleplaying and storytelling.)

Aion-labs$0.80$1.60131K見る →

AionLabs: Aion-RP 1.0 (8B)はAion-labsが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大33Kトークン。対応機能:APIアクセス。料金:入力 $0.8/100万トークン、出力 $1.6/100万トークン。(公式説明:Aion-RP-Llama-3.1-8B ranks the highest in the character evaluation portion of the RPBench-Auto benchmark, a roleplaying-specific variant of Arena-Hard-Auto, where LLMs evaluate each other’s responses.)

Aion-labs$0.80$1.6033K見る →

AlfredPros: CodeLLaMa 7B Instruct SolidityはAlfredprosが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大4Kトークン。対応機能:APIアクセス。料金:入力 $0.8/100万トークン、出力 $1.2/100万トークン。(公式説明:A finetuned 7 billion parameters Code LLaMA - Instruct model to generate Solidity smart contract using 4-bit QLoRA finetuning provided by PEFT library.)

Alfredpros$0.80$1.204K見る →

Amazon: Nova Pro 1.0はAmazonが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大300Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.8/100万トークン、出力 $3.2/100万トークン。(公式説明:Amazon Nova Pro 1.0 is a capable multimodal model from Amazon focused on providing a combination of accuracy, speed, and cost for a wide range of tasks.)

Amazon$0.80$3.20300K見る →

Anthropic: Claude 3.5 HaikuはAnthropicが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大200Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $0.8/100万トークン、出力 $4/100万トークン。(公式説明:Claude 3.5 Haiku features offers enhanced capabilities in speed, coding accuracy, and tool use.)

Anthropic$0.80$4.00200K見る →

Morph: Morph V3 FastはMorphが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大82Kトークン。対応機能:APIアクセス。料金:入力 $0.8/100万トークン、出力 $1.2/100万トークン。(公式説明:Morph's fastest apply model for code edits.)

Morph$0.80$1.2082K見る →

Relace: Relace Apply 3はRelaceが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大256Kトークン。対応機能:APIアクセス。料金:入力 $0.85/100万トークン、出力 $1.25/100万トークン。(公式説明:Relace Apply 3 is a specialized code-patching LLM that merges AI-suggested edits straight into your source files.)

Relace$0.85$1.25256K見る →

Sao10K: Llama 3.1 Euryale 70B v2.2はSao10Kが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.85/100万トークン、出力 $0.85/100万トークン。(公式説明:Euryale L3.1 70B v2.2 is a model focused on creative roleplay from Sao10k.)

Sao10K$0.85$0.85131K見る →

Switchpoint RouterはSwitchpointが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:APIアクセス。料金:入力 $0.85/100万トークン、出力 $3.4/100万トークン。(公式説明:Switchpoint AI's router instantly analyzes your request and directs it to the optimal AI from an ever-evolving library.)

Switchpoint$0.85$3.40131K見る →

Arcee AI: Maestro ReasoningはArcee-aiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:APIアクセス。料金:入力 $0.9/100万トークン、出力 $3.3/100万トークン。(公式説明:Maestro Reasoning is Arcee's flagship analysis model: a 32 B‑parameter derivative of Qwen 2.5‑32 B tuned with DPO and chain‑of‑thought RL for step‑by‑step logic.)

Arcee-ai$0.90$3.30131K見る →

Morph: Morph V3 LargeはMorphが提供する汎用チャット向けAIモデルで、低速だが高性能が特徴です。コンテキスト長は最大262Kトークン。対応機能:APIアクセス。料金:入力 $0.9/100万トークン、出力 $1.9/100万トークン。(公式説明:Morph's high-accuracy apply model for complex code edits.)

Morph$0.90$1.90262K見る →

Z.ai: GLM 5.1はZ-aiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大203Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $0.98/100万トークン、出力 $3.08/100万トークン。(公式説明:GLM-5.1 delivers a major leap in coding capability, with particularly significant gains in handling long-horizon tasks.)

Z-ai$0.98$3.08203K見る →

Nous: Hermes 3 405B InstructはNous Researchが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:APIアクセス。料金:入力 $1/100万トークン、出力 $1/100万トークン。(公式説明:Hermes 3 is a generalist language model with many improvements over Hermes 2, including advanced agentic capabilities, much better roleplaying, reasoning, multi-turn conversation, long context coherence, and improvements across the)

Nous Research$1.00$1.00131K見る →

Nous: Hermes 4 405BはNous Researchが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:APIアクセス。料金:入力 $1/100万トークン、出力 $3/100万トークン。(公式説明:Hermes 4 is a large-scale reasoning model built on Meta-Llama-3.1-405B and released by Nous Research.)

Nous Research$1.00$3.00131K見る →

OpenAI: GPT-3.5 Turbo (older v0613)はOpenAIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大4Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $1/100万トークン、出力 $2/100万トークン。(公式説明:GPT-3.5 Turbo is OpenAI's fastest model.)

OpenAI$1.00$2.004K見る →

Perplexity: SonarはPerplexityが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大127Kトークン。対応機能:画像認識、APIアクセス。料金:入力 $1/100万トークン、出力 $1/100万トークン。(公式説明:Sonar is lightweight, affordable, fast, and simple to use — now featuring citations and the ability to customize sources.)

Perplexity$1.00$1.00127K見る →

Relace: Relace SearchはRelaceが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大256Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $1/100万トークン、出力 $3/100万トークン。(公式説明:The relace-search model uses 4-12 `view_file` and `grep` tools in parallel to explore a codebase and return relevant files to the user request.)

Relace$1.00$3.00256K見る →

Xiaomi: MiMo-V2-ProはXiaomiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大1Mトークン。対応機能:ツール使用、APIアクセス。料金:入力 $1/100万トークン、出力 $3/100万トークン。(公式説明:MiMo-V2-Pro is Xiaomi's flagship foundation model, featuring over 1T total parameters and a 1M context length, deeply optimized for agentic scenarios.)

Xiaomi$1.00$3.001.0M見る →

Xiaomi: MiMo-V2.5-ProはXiaomiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大1Mトークン。対応機能:ツール使用、APIアクセス。料金:入力 $1/100万トークン、出力 $3/100万トークン。(公式説明:MiMo-V2.5-Pro is Xiaomi’s flagship model, delivering strong performance in general agentic capabilities, complex software engineering, and long-horizon tasks, with top rankings on benchmarks such as ClawEval, GDPVal, and SWE-bench Pro)

Xiaomi$1.00$3.001.0M見る →

Anthropic Claude Haiku Latestは~anthropicが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大200Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $1/100万トークン、出力 $5/100万トークン。(公式説明:This model always redirects to the latest model in the Anthropic Claude Haiku family.)

~anthropic$1.00$5.00200K見る →

Qwen: Qwen-Max はAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大33Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $1.04/100万トークン、出力 $4.16/100万トークン。(公式説明:Qwen-Max, based on Qwen2.5, provides the best inference performance among Qwen models, especially for complex multi-step tasks.)

Alibaba$1.04$4.1633K見る →

Qwen: Qwen3.6 Max PreviewはAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $1.04/100万トークン、出力 $6.24/100万トークン。(公式説明:Qwen3.6-Max-Preview is a proprietary frontier model from Alibaba Cloud built on a sparse mixture-of-experts architecture with approximately 1 trillion total parameters.)

Alibaba$1.04$6.24262K見る →

Z.ai: GLM 5 TurboはZ-aiが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大203Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $1.2/100万トークン、出力 $4/100万トークン。(公式説明:GLM-5 Turbo is a new model from Z.ai designed for fast inference and strong performance in agent-driven environments such as OpenClaw scenarios.)

Z-ai$1.20$4.00203K見る →

Z.ai: GLM 5V TurboはZ-aiが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大203Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $1.2/100万トークン、出力 $4/100万トークン。(公式説明:GLM-5V-Turbo is Z.ai’s first native multimodal agent foundation model, built for vision-based coding and agent-driven tasks.)

Z-ai$1.20$4.00203K見る →

Deep Cogito: Cogito v2.1 671BはDeepcogitoが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大128Kトークン。対応機能:APIアクセス。料金:入力 $1.25/100万トークン、出力 $1.25/100万トークン。(公式説明:Cogito v2.1 671B MoE represents one of the strongest open models globally, matching performance of frontier closed and open models.)

Deepcogito$1.25$1.25128K見る →

Google: Gemini 2.5 ProはGoogleが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $1.25/100万トークン、出力 $10/100万トークン。(公式説明:Gemini 2.5 Pro is Google’s state-of-the-art AI model designed for advanced reasoning, coding, mathematics, and scientific tasks.)

Google$1.25$10.001.0M見る →

Google: Gemini 2.5 Pro Preview 05-06はGoogleが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $1.25/100万トークン、出力 $10/100万トークン。(公式説明:Gemini 2.5 Pro is Google’s state-of-the-art AI model designed for advanced reasoning, coding, mathematics, and scientific tasks.)

Google$1.25$10.001.0M見る →

Google: Gemini 2.5 Pro Preview 06-05はGoogleが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $1.25/100万トークン、出力 $10/100万トークン。(公式説明:Gemini 2.5 Pro is Google’s state-of-the-art AI model designed for advanced reasoning, coding, mathematics, and scientific tasks.)

Google$1.25$10.001.0M見る →

OpenAI: GPT-5 ChatはOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大128Kトークン。対応機能:画像認識、APIアクセス。料金:入力 $1.25/100万トークン、出力 $10/100万トークン。(公式説明:GPT-5 Chat is designed for advanced, natural, multimodal, and context-aware conversations for enterprise applications.)

OpenAI$1.25$10.00128K見る →

OpenAI: GPT-5 CodexはOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大400Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $1.25/100万トークン、出力 $10/100万トークン。(公式説明:GPT-5-Codex is a specialized version of GPT-5 optimized for software engineering and coding workflows.)

OpenAI$1.25$10.00400K見る →

OpenAI: GPT-5.1はOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大400Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $1.25/100万トークン、出力 $10/100万トークン。(公式説明:GPT-5.1 is the latest frontier-grade model in the GPT-5 series, offering stronger general-purpose reasoning, improved instruction adherence, and a more natural conversational style compared to GPT-5.)

OpenAI$1.25$10.00400K見る →

OpenAI: GPT-5.1 ChatはOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大128Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $1.25/100万トークン、出力 $10/100万トークン。(公式説明:GPT-5.1 Chat (AKA Instant is the fast, lightweight member of the 5.1 family, optimized for low-latency chat while retaining strong general intelligence.)

OpenAI$1.25$10.00128K見る →

OpenAI: GPT-5.1-CodexはOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大400Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $1.25/100万トークン、出力 $10/100万トークン。(公式説明:GPT-5.1-Codex is a specialized version of GPT-5.1 optimized for software engineering and coding workflows.)

OpenAI$1.25$10.00400K見る →

OpenAI: GPT-5.1-Codex-MaxはOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大400Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $1.25/100万トークン、出力 $10/100万トークン。(公式説明:GPT-5.1-Codex-Max is OpenAI’s latest agentic coding model, designed for long-running, high-context software development tasks.)

OpenAI$1.25$10.00400K見る →

xAI: Grok 4.20はxAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大2Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $1.25/100万トークン、出力 $2.5/100万トークン。(公式説明:Grok 4.20 is a reasoning model from xAI with industry-leading speed and agentic tool calling capabilities.)

xAI$1.25$2.502.0M見る →

xAI: Grok 4.3はxAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $1.25/100万トークン、出力 $2.5/100万トークン。(公式説明:Grok 4.3 is a reasoning model from xAI.)

xAI$1.25$2.501.0M見る →

Sao10k: Llama 3 Euryale 70B v2.1はSao10Kが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大8Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $1.48/100万トークン、出力 $1.48/100万トークン。(公式説明:Euryale 70B v2.1 is a model focused on creative roleplay from Sao10k.)

Sao10K$1.48$1.488K見る →

Mistral: Mistral Medium 3.5はMistral AIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $1.5/100万トークン、出力 $7.5/100万トークン。(公式説明:Mistral Medium 3.5 is a dense 128B instruction-following model from Mistral AI.)

Mistral AI$1.50$7.50262K見る →

OpenAI: GPT-3.5 Turbo InstructはOpenAIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大4Kトークン。対応機能:APIアクセス。料金:入力 $1.5/100万トークン、出力 $2/100万トークン。(公式説明:This model is a variant of GPT-3.5 Turbo tuned for instructional prompts and omitting chat-related optimizations.)

OpenAI$1.50$2.004K見る →

OpenAI: GPT-5.2はOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大400Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $1.75/100万トークン、出力 $14/100万トークン。(公式説明:GPT-5.2 is the latest frontier-grade model in the GPT-5 series, offering stronger agentic and long context perfomance compared to GPT-5.1.)

OpenAI$1.75$14.00400K見る →

OpenAI: GPT-5.2 ChatはOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大128Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $1.75/100万トークン、出力 $14/100万トークン。(公式説明:GPT-5.2 Chat (AKA Instant) is the fast, lightweight member of the 5.2 family, optimized for low-latency chat while retaining strong general intelligence.)

OpenAI$1.75$14.00128K見る →

OpenAI: GPT-5.2-CodexはOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大400Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $1.75/100万トークン、出力 $14/100万トークン。(公式説明:GPT-5.2-Codex is an upgraded version of GPT-5.1-Codex optimized for software engineering and coding workflows.)

OpenAI$1.75$14.00400K見る →

OpenAI: GPT-5.3 ChatはOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大128Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $1.75/100万トークン、出力 $14/100万トークン。(公式説明:GPT-5.3 Chat is an update to ChatGPT's most-used model that makes everyday conversations smoother, more useful, and more directly helpful.)

OpenAI$1.75$14.00128K見る →

OpenAI: GPT-5.3-CodexはOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大400Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $1.75/100万トークン、出力 $14/100万トークン。(公式説明:GPT-5.3-Codex is OpenAI’s most advanced agentic coding model, combining the frontier software engineering performance of GPT-5.2-Codex with the broader reasoning and professional knowledge capabilities of GPT-5.2.)

OpenAI$1.75$14.00400K見る →
GPT-4.1最新

GPT-4.1はOpenAIの最新世代モデルで、100万トークンのコンテキストと優れた指示への追従性を備えています。

OpenAI$2.00$8.001.0M見る →

AI21: Jamba Large 1.7はAI21 Labsが提供する汎用チャット向けAIモデルで、低速だが高性能が特徴です。コンテキスト長は最大256Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $2/100万トークン、出力 $8/100万トークン。(公式説明:Jamba Large 1.7 is the latest model in the Jamba open family, offering improvements in grounding, instruction-following, and overall efficiency.)

AI21 Labs$2.00$8.00256K見る →

Google: Gemini 3.1 Pro PreviewはGoogleが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $2/100万トークン、出力 $12/100万トークン。(公式説明:Gemini 3.1 Pro Preview is Google’s frontier reasoning model, delivering enhanced software engineering performance, improved agentic reliability, and more efficient token usage across complex workflows.)

Google$2.00$12.001.0M見る →

Google: Gemini 3.1 Pro Preview Custom ToolsはGoogleが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $2/100万トークン、出力 $12/100万トークン。(公式説明:Gemini 3.1 Pro Preview Custom Tools is a variant of Gemini 3.1 Pro that improves tool selection behavior by preventing overuse of a general bash tool when more efficient third-party)

Google$2.00$12.001.0M見る →

Mistral LargeはMistral AIが提供する汎用チャット向けAIモデルで、低速だが高性能が特徴です。コンテキスト長は最大128Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $2/100万トークン、出力 $6/100万トークン。(公式説明:This is Mistral AI's flagship model, Mistral Large 2 (version `mistral-large-2407`).)

Mistral AI$2.00$6.00128K見る →

Mistral Large 2407はMistral AIが提供する汎用チャット向けAIモデルで、低速だが高性能が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $2/100万トークン、出力 $6/100万トークン。(公式説明:This is Mistral AI's flagship model, Mistral Large 2 (version mistral-large-2407).)

Mistral AI$2.00$6.00131K見る →

Mistral Large 2411はMistral AIが提供する汎用チャット向けAIモデルで、低速だが高性能が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $2/100万トークン、出力 $6/100万トークン。(公式説明:Mistral Large 2 2411 is an update of Mistral Large 2 released together with Pixtral Large 2411 It provides a significant upgrade on the previous Mistral Large 24.07, with notable)

Mistral AI$2.00$6.00131K見る →

Mistral: Mixtral 8x22B InstructはMistral AIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大66Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $2/100万トークン、出力 $6/100万トークン。(公式説明:Mistral's official instruct fine-tuned version of Mixtral 8x22B.)

Mistral AI$2.00$6.0066K見る →

Mistral: Pixtral Large 2411はMistral AIが提供する汎用チャット向けAIモデルで、低速だが高性能が特徴です。コンテキスト長は最大131Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $2/100万トークン、出力 $6/100万トークン。(公式説明:Pixtral Large is a 124B parameter, open-weight, multimodal model built on top of Mistral Large 2.)

Mistral AI$2.00$6.00131K見る →

OpenAI: GPT-4.1はOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $2/100万トークン、出力 $8/100万トークン。(公式説明:GPT-4.1 is a flagship large language model optimized for advanced instruction following, real-world software engineering, and long-context reasoning.)

OpenAI$2.00$8.001.0M見る →

Perplexity: Sonar Deep ResearchはPerplexityが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大128Kトークン。対応機能:APIアクセス。料金:入力 $2/100万トークン、出力 $8/100万トークン。(公式説明:Sonar Deep Research is a research-focused model designed for multi-step retrieval, synthesis, and reasoning across complex topics.)

Perplexity$2.00$8.00128K見る →

Perplexity: Sonar Reasoning ProはPerplexityが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大128Kトークン。対応機能:画像認識、APIアクセス。料金:入力 $2/100万トークン、出力 $8/100万トークン。(公式説明:Note: Sonar Pro pricing includes Perplexity search pricing.)

Perplexity$2.00$8.00128K見る →

xAI: Grok 4.20 Multi-AgentはxAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大2Mトークン。対応機能:画像認識、APIアクセス。料金:入力 $2/100万トークン、出力 $6/100万トークン。(公式説明:Grok 4.20 Multi-Agent is a variant of xAI’s Grok 4.20 designed for collaborative, agent-based workflows.)

xAI$2.00$6.002.0M見る →

Google Gemini Pro Latestは~googleが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $2/100万トークン、出力 $12/100万トークン。(公式説明:This model always redirects to the latest model in the Google Gemini Pro family.)

~google$2.00$12.001.0M見る →

Amazon: Nova Premier 1.0はAmazonが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $2.5/100万トークン、出力 $12.5/100万トークン。(公式説明:Amazon Nova Premier is the most capable of Amazon’s multimodal models for complex reasoning tasks and for use as the best teacher for distilling custom models.)

Amazon$2.50$12.501.0M見る →

Cohere: Command AはCohereが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大256Kトークン。対応機能:APIアクセス。料金:入力 $2.5/100万トークン、出力 $10/100万トークン。(公式説明:Command A is an open-weights 111B parameter model with a 256k context window focused on delivering great performance across agentic, multilingual, and coding use cases.)

Cohere$2.50$10.00256K見る →

Cohere: Command R+ (08-2024)はCohereが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大128Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $2.5/100万トークン、出力 $10/100万トークン。(公式説明:command-r-plus-08-2024 is an update of the Command R+ with roughly 50% higher throughput and 25% lower latencies as compared to the previous Command R+ version, while keeping the hardware footprint)

Cohere$2.50$10.00128K見る →

Inflection: Inflection 3 PiはInflectionが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大8Kトークン。対応機能:APIアクセス。料金:入力 $2.5/100万トークン、出力 $10/100万トークン。(公式説明:Inflection 3 Pi powers Inflection's Pi chatbot, including backstory, emotional intelligence, productivity, and safety.)

Inflection$2.50$10.008K見る →

Inflection: Inflection 3 ProductivityはInflectionが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大8Kトークン。対応機能:APIアクセス。料金:入力 $2.5/100万トークン、出力 $10/100万トークン。(公式説明:Inflection 3 Productivity is optimized for following instructions.)

Inflection$2.50$10.008K見る →

OpenAI: GPT AudioはOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大128Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $2.5/100万トークン、出力 $10/100万トークン。(公式説明:The gpt-audio model is OpenAI's first generally available audio model.)

OpenAI$2.50$10.00128K見る →

OpenAI: GPT-4o (2024-08-06)はOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大128Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $2.5/100万トークン、出力 $10/100万トークン。(公式説明:The 2024-08-06 version of GPT-4o offers improved performance in structured outputs, with the ability to supply a JSON schema in the respone_format.)

OpenAI$2.50$10.00128K見る →

OpenAI: GPT-4o (2024-11-20)はOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大128Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $2.5/100万トークン、出力 $10/100万トークン。(公式説明:The 2024-11-20 version of GPT-4o offers a leveled-up creative writing ability with more natural, engaging, and tailored writing to improve relevance & readability.)

OpenAI$2.50$10.00128K見る →

OpenAI: GPT-4o AudioはOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大128Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $2.5/100万トークン、出力 $10/100万トークン。(公式説明:The gpt-4o-audio-preview model adds support for audio inputs as prompts.)

OpenAI$2.50$10.00128K見る →

OpenAI: GPT-4o Search PreviewはOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大128Kトークン。対応機能:APIアクセス。料金:入力 $2.5/100万トークン、出力 $10/100万トークン。(公式説明:GPT-4o Search Previewis a specialized model for web search in Chat Completions.)

OpenAI$2.50$10.00128K見る →

OpenAI: GPT-5.4はOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $2.5/100万トークン、出力 $15/100万トークン。(公式説明:GPT-5.4 is OpenAI’s latest frontier model, unifying the Codex and GPT lines into a single system.)

OpenAI$2.50$15.001.1M見る →

Claude Sonnetは知性と速度の最良バランスを実現し、高スループットのタスクに対応します。

Anthropic$3.00$15.00200K見る →

Magnum v4 72BはAnthracite-orgが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大16Kトークン。対応機能:APIアクセス。料金:入力 $3/100万トークン、出力 $5/100万トークン。(公式説明:This is a series of models designed to replicate the prose quality of the Claude 3 models, specifically Sonnet(https://openrouter.ai/anthropic/claude-3.5-sonnet) and Opus(https://openrouter.ai/anthropic/claude-3-opus).)

Anthracite-org$3.00$5.0016K見る →

Anthropic: Claude Sonnet 4はAnthropicが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $3/100万トークン、出力 $15/100万トークン。(公式説明:Claude Sonnet 4 significantly enhances the capabilities of its predecessor, Sonnet 3.7, excelling in both coding and reasoning tasks with improved precision and controllability.)

Anthropic$3.00$15.001.0M見る →

Anthropic: Claude Sonnet 4.5はAnthropicが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $3/100万トークン、出力 $15/100万トークン。(公式説明:Claude Sonnet 4.5 is Anthropic’s most advanced Sonnet model to date, optimized for real-world agents and coding workflows.)

Anthropic$3.00$15.001.0M見る →

OpenAI: GPT-3.5 Turbo 16kはOpenAIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大16Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $3/100万トークン、出力 $4/100万トークン。(公式説明:This model offers four times the context length of gpt-3.5-turbo, allowing it to support approximately 20 pages of text in a single request at a higher cost.)

OpenAI$3.00$4.0016K見る →

Perplexity: Sonar ProはPerplexityが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大200Kトークン。対応機能:画像認識、APIアクセス。料金:入力 $3/100万トークン、出力 $15/100万トークン。(公式説明:Note: Sonar Pro pricing includes Perplexity search pricing.)

Perplexity$3.00$15.00200K見る →

Perplexity: Sonar Pro SearchはPerplexityが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大200Kトークン。対応機能:画像認識、APIアクセス。料金:入力 $3/100万トークン、出力 $15/100万トークン。(公式説明:Exclusively available on the OpenRouter API, Sonar Pro's new Pro Search mode is Perplexity's most advanced agentic search system.)

Perplexity$3.00$15.00200K見る →

Sao10K: Llama 3.1 70B Hanami x1はSao10Kが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大16Kトークン。対応機能:APIアクセス。料金:入力 $3/100万トークン、出力 $3/100万トークン。(公式説明:This is Sao10K's experiment over Euryale v2.2.)

Sao10K$3.00$3.0016K見る →

xAI: Grok 3はxAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $3/100万トークン、出力 $15/100万トークン。(公式説明:Grok 3 is the latest model from xAI.)

xAI$3.00$15.00131K見る →

xAI: Grok 3 BetaはxAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $3/100万トークン、出力 $15/100万トークン。(公式説明:Grok 3 is the latest model from xAI.)

xAI$3.00$15.00131K見る →

xAI: Grok 4はxAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大256Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $3/100万トークン、出力 $15/100万トークン。(公式説明:Grok 4 is xAI's latest reasoning model with a 256k context window.)

xAI$3.00$15.00256K見る →

Anthropic Claude Sonnet Latestは~anthropicが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $3/100万トークン、出力 $15/100万トークン。(公式説明:This model always redirects to the latest model in the Anthropic Claude Sonnet family.)

~anthropic$3.00$15.001.0M見る →

AionLabs: Aion-1.0はAion-labsが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:APIアクセス。料金:入力 $4/100万トークン、出力 $8/100万トークン。(公式説明:Aion-1.0 is a multi-model system designed for high performance across various tasks, including reasoning and coding.)

Aion-labs$4.00$8.00131K見る →

Anthropic: Claude Opus 4.5はAnthropicが提供する汎用チャット向けAIモデルで、低速だが高性能が特徴です。コンテキスト長は最大200Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $5/100万トークン、出力 $25/100万トークン。(公式説明:Claude Opus 4.5 is Anthropic’s frontier reasoning model optimized for complex software engineering, agentic workflows, and long-horizon computer use.)

Anthropic$5.00$25.00200K見る →

Anthropic: Claude Opus 4.6はAnthropicが提供する汎用チャット向けAIモデルで、低速だが高性能が特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $5/100万トークン、出力 $25/100万トークン。(公式説明:Opus 4.6 is Anthropic’s strongest model for coding and long-running professional tasks.)

Anthropic$5.00$25.001.0M見る →

OpenAI: GPT Chat LatestはOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大400Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $5/100万トークン、出力 $30/100万トークン。(公式説明:GPT Chat Latest points to OpenAI's stable API alias `chat-latest` that always resolves to the latest Instant chat model used in ChatGPT.)

OpenAI$5.00$30.00400K見る →

OpenAI: GPT-4o (2024-05-13)はOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大128Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $5/100万トークン、出力 $15/100万トークン。(公式説明:GPT-4o ("o" for "omni") is OpenAI's latest AI model, supporting both text and image inputs with text outputs.)

OpenAI$5.00$15.00128K見る →

OpenAI: GPT-5.5はOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $5/100万トークン、出力 $30/100万トークン。(公式説明:GPT-5.5 is OpenAI’s frontier model designed for complex professional workloads, building on GPT-5.4 with stronger reasoning, higher reliability, and improved token efficiency on hard tasks.)

OpenAI$5.00$30.001.1M見る →

Anthropic: Claude Opus Latestは~anthropicが提供する汎用チャット向けAIモデルで、低速だが高性能が特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $5/100万トークン、出力 $25/100万トークン。(公式説明:This model always redirects to the latest model in the Claude Opus family.)

~anthropic$5.00$25.001.0M見る →

OpenAI GPT Latestは~openaiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $5/100万トークン、出力 $30/100万トークン。(公式説明:This model always redirects to the latest model in the OpenAI GPT family.)

~openai$5.00$30.001.1M見る →

OpenAI: GPT-4 TurboはOpenAIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大128Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $10/100万トークン、出力 $30/100万トークン。(公式説明:The latest GPT-4 Turbo model with vision capabilities.)

OpenAI$10.00$30.00128K見る →

OpenAI: GPT-4 Turbo (older v1106)はOpenAIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大128Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $10/100万トークン、出力 $30/100万トークン。(公式説明:The latest GPT-4 Turbo model with vision capabilities.)

OpenAI$10.00$30.00128K見る →

OpenAI: GPT-4 Turbo PreviewはOpenAIが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大128Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $10/100万トークン、出力 $30/100万トークン。(公式説明:The preview GPT-4 model with improved instruction following, JSON mode, reproducible outputs, parallel function calling, and more.)

OpenAI$10.00$30.00128K見る →

Anthropic: Claude Opus 4はAnthropicが提供する汎用チャット向けAIモデルで、低速だが高性能が特徴です。コンテキスト長は最大200Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $15/100万トークン、出力 $75/100万トークン。(公式説明:Claude Opus 4 is benchmarked as the world’s best coding model, at time of release, bringing sustained performance on complex, long-running tasks and agent workflows.)

Anthropic$15.00$75.00200K見る →

Anthropic: Claude Opus 4.1はAnthropicが提供する汎用チャット向けAIモデルで、低速だが高性能が特徴です。コンテキスト長は最大200Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $15/100万トークン、出力 $75/100万トークン。(公式説明:Claude Opus 4.1 is an updated version of Anthropic’s flagship model, offering improved performance in coding, reasoning, and agentic tasks.)

Anthropic$15.00$75.00200K見る →

OpenAI: GPT-5 ProはOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大400Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $15/100万トークン、出力 $120/100万トークン。(公式説明:GPT-5 Pro is OpenAI’s most advanced model, offering major improvements in reasoning, code quality, and user experience.)

OpenAI$15.00$120.00400K見る →

OpenAI: GPT-5.2 ProはOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大400Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $21/100万トークン、出力 $168/100万トークン。(公式説明:GPT-5.2 Pro is OpenAI’s most advanced model, offering major improvements in agentic coding and long context performance over GPT-5 Pro.)

OpenAI$21.00$168.00400K見る →

Anthropic: Claude Opus 4.6 (Fast)はAnthropicが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $30/100万トークン、出力 $150/100万トークン。(公式説明:Fast-mode variant of Opus 4.6 - identical capabilities with higher output speed at premium 6x pricing.)

Anthropic$30.00$150.001.0M見る →

OpenAI: GPT-4はOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大8Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $30/100万トークン、出力 $60/100万トークン。(公式説明:OpenAI's flagship model, GPT-4 is a large-scale multimodal language model capable of solving difficult problems with greater accuracy than previous models due to its broader general knowledge and advanced reasoning)

OpenAI$30.00$60.008K見る →

OpenAI: GPT-4 (older v0314)はOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大8Kトークン。対応機能:ツール使用、APIアクセス。料金:入力 $30/100万トークン、出力 $60/100万トークン。(公式説明:GPT-4-0314 is the first version of GPT-4 released, with a context length of 8,192 tokens, and was supported until June 14.)

OpenAI$30.00$60.008K見る →

OpenAI: GPT-5.4 ProはOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $30/100万トークン、出力 $180/100万トークン。(公式説明:GPT-5.4 Pro is OpenAI's most advanced model, building on GPT-5.4's unified architecture with enhanced reasoning capabilities for complex, high-stakes tasks.)

OpenAI$30.00$180.001.1M見る →

OpenAI: GPT-5.5 ProはOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:入力 $30/100万トークン、出力 $180/100万トークン。(公式説明:GPT-5.5 Pro is OpenAI’s high-capability model optimized for deep reasoning and accuracy on complex, high-stakes workloads.)

OpenAI$30.00$180.001.1M見る →

Qwen: Qwen3 Next 80B A3B Instruct (free)はAlibabaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:ツール使用、APIアクセス。料金:OpenRouter経由で無料。(公式説明:Qwen3-Next-80B-A3B-Instruct is an instruction-tuned chat model in the Qwen3-Next series optimized for fast, stable responses without “thinking” traces.)

Alibabaトークン課金なし262K見る →

Baidu Qianfan: CoBuddy (free)はBaiduが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:OpenRouter経由で無料。(公式説明:CoBuddy is a code generation model from Baidu, optimized for coding tasks and AI Agent workflows.)

Baiduトークン課金なし131K見る →

Baidu: Qianfan-OCR-Fast (free)はBaiduが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大66Kトークン。対応機能:画像認識、APIアクセス。料金:OpenRouter経由で無料。(公式説明:Qianfan-OCR-Fast is a domain-specific multimodal large model purpose-built for OCR.)

Baiduトークン課金なし66K見る →

Venice: Uncensored (free)はCognitive Computationsが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大33Kトークン。対応機能:APIアクセス。料金:OpenRouter経由で無料。(公式説明:Venice Uncensored Dolphin Mistral 24B Venice Edition is a fine-tuned variant of Mistral-Small-24B-Instruct-2501, developed by dphn.ai in collaboration with Venice.ai.)

Cognitive Computationsトークン課金なし33K見る →

Google: Gemma 4 26B A4B (free)はGoogleが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:OpenRouter経由で無料。(公式説明:Gemma 4 26B A4B IT is an instruction-tuned Mixture-of-Experts (MoE) model from Google DeepMind.)

Googleトークン課金なし262K見る →

Google: Gemma 4 31B (free)はGoogleが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:OpenRouter経由で無料。(公式説明:Gemma 4 31B Instruct is Google DeepMind's 30.7B dense multimodal model supporting text and image input with text output.)

Googleトークン課金なし262K見る →

Google: Lyria 3 Clip PreviewはGoogleが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、APIアクセス。料金:OpenRouter経由で無料。(公式説明:30 second duration clips are priced at $0.04 per clip.)

Googleトークン課金なし1.0M見る →

Google: Lyria 3 Pro PreviewはGoogleが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大1Mトークン。対応機能:画像認識、APIアクセス。料金:OpenRouter経由で無料。(公式説明:Full-length songs are priced at $0.08 per song.)

Googleトークン課金なし1.0M見る →

inclusionAI: Ring-2.6-1T (free)はInclusionaiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:ツール使用、APIアクセス。料金:OpenRouter経由で無料。(公式説明:Ring-2.6-1T is a 1T-parameter-scale thinking model with 63B active parameters, built for real-world agent workflows that require both strong capability and operational efficiency.)

Inclusionaiトークン課金なし262K見る →

LiquidAI: LFM2.5-1.2B-Instruct (free)はLiquid AIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大33Kトークン。対応機能:APIアクセス。料金:OpenRouter経由で無料。(公式説明:LFM2.5-1.2B-Instruct is a compact, high-performance instruction-tuned model built for fast on-device AI.)

Liquid AIトークン課金なし33K見る →

Meta: Llama 3.2 3B Instruct (free)はMetaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:APIアクセス。料金:OpenRouter経由で無料。(公式説明:Llama 3.2 3B is a 3-billion-parameter multilingual large language model, optimized for advanced natural language processing tasks like dialogue generation, reasoning, and summarization.)

Metaトークン課金なし131K見る →

Meta: Llama 3.3 70B Instruct (free)はMetaが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大66Kトークン。対応機能:ツール使用、APIアクセス。料金:OpenRouter経由で無料。(公式説明:The Meta Llama 3.3 multilingual large language model (LLM) is a pretrained and instruction tuned generative model in 70B (text in/text out).)

Metaトークン課金なし66K見る →

MiniMax: MiniMax M2.5 (free)はMiniMaxが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大197Kトークン。対応機能:ツール使用、APIアクセス。料金:OpenRouter経由で無料。(公式説明:MiniMax-M2.5 is a SOTA large language model designed for real-world productivity.)

MiniMaxトークン課金なし197K見る →

NVIDIA: Nemotron 3 Nano 30B A3B (free)はNVIDIAが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大256Kトークン。対応機能:ツール使用、APIアクセス。料金:OpenRouter経由で無料。(公式説明:NVIDIA Nemotron 3 Nano 30B A3B is a small language MoE model with highest compute efficiency and accuracy for developers to build specialized agentic AI systems.)

NVIDIAトークン課金なし256K見る →

NVIDIA: Nemotron 3 Nano Omni (free)はNVIDIAが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大256Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:OpenRouter経由で無料。(公式説明:NVIDIA Nemotron™ 3 Nano Omni is a 30B-A3B open multimodal model designed to function as a perception and context sub-agent in enterprise agent systems.)

NVIDIAトークン課金なし256K見る →

NVIDIA: Nemotron 3 Super (free)はNVIDIAが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大262Kトークン。対応機能:ツール使用、APIアクセス。料金:OpenRouter経由で無料。(公式説明:NVIDIA Nemotron 3 Super is a 120B-parameter open hybrid MoE model, activating just 12B parameters for maximum compute efficiency and accuracy in complex multi-agent applications.)

NVIDIAトークン課金なし262K見る →

NVIDIA: Nemotron Nano 12B 2 VL (free)はNVIDIAが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大128Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:OpenRouter経由で無料。(公式説明:NVIDIA Nemotron Nano 2 VL is a 12-billion-parameter open multimodal reasoning model designed for video understanding and document intelligence.)

NVIDIAトークン課金なし128K見る →

NVIDIA: Nemotron Nano 9B V2 (free)はNVIDIAが提供する汎用チャット向けAIモデルで、高速レスポンスが特徴です。コンテキスト長は最大128Kトークン。対応機能:ツール使用、APIアクセス。料金:OpenRouter経由で無料。(公式説明:NVIDIA-Nemotron-Nano-9B-v2 is a large language model (LLM) trained from scratch by NVIDIA, and designed as a unified model for both reasoning and non-reasoning tasks.)

NVIDIAトークン課金なし128K見る →

Nous: Hermes 3 405B Instruct (free)はNous Researchが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:APIアクセス。料金:OpenRouter経由で無料。(公式説明:Hermes 3 is a generalist language model with many improvements over Hermes 2, including advanced agentic capabilities, much better roleplaying, reasoning, multi-turn conversation, long context coherence, and improvements across the)

Nous Researchトークン課金なし131K見る →

OpenAI: gpt-oss-120b (free)はOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:OpenRouter経由で無料。(公式説明:gpt-oss-120b is an open-weight, 117B-parameter Mixture-of-Experts (MoE) language model from OpenAI designed for high-reasoning, agentic, and general-purpose production use cases.)

OpenAIトークン課金なし131K見る →

OpenAI: gpt-oss-20b (free)はOpenAIが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:OpenRouter経由で無料。(公式説明:gpt-oss-20b is an open-weight 21B parameter model released by OpenAI under the Apache 2.0 license.)

OpenAIトークン課金なし131K見る →

Free Models RouterはOpenrouterが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大200Kトークン。対応機能:画像認識、ツール使用、APIアクセス。料金:OpenRouter経由で無料。(公式説明:The simplest way to get free inference.)

Openrouterトークン課金なし200K見る →

Owl AlphaはOpenrouterが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大1Mトークン。対応機能:ツール使用、APIアクセス。料金:OpenRouter経由で無料。(公式説明:Owl Alpha is a high-performance foundation model designed for agentic workloads.)

Openrouterトークン課金なし1.0M見る →

Poolside: Laguna M.1 (free)はPoolsideが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:OpenRouter経由で無料。(公式説明:Laguna M.1 is the flagship coding agent model from Poolside, optimized for complex software engineering tasks.)

Poolsideトークン課金なし131K見る →

Poolside: Laguna XS.2 (free)はPoolsideが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:OpenRouter経由で無料。(公式説明:Laguna XS.2 is the second-generation model in the XS size class from Poolside, their efficient coding agent series.)

Poolsideトークン課金なし131K見る →

Z.ai: GLM 4.5 Air (free)はZ-aiが提供する汎用チャット向けAIモデルで、標準的な速度が特徴です。コンテキスト長は最大131Kトークン。対応機能:ツール使用、APIアクセス。料金:OpenRouter経由で無料。(公式説明:GLM-4.5-Air is the lightweight variant of our latest flagship model family, also purpose-built for agent-centric applications.)

Z-aiトークン課金なし131K見る →