💬

Чат-модели

319 моделей

Идеально для службы поддержки, повседневного общения, офисных задач и создания контента — самая универсальная возможность ИИ.

Модель	Провайдер	Вход /1М	Выход /1М	Контекст	Детали
GPT-4o热门 GPT-4o — быстрая мультимодальная модель от OpenAI, оптимизированная для чата, кода и анализа изображений.	OpenAI	$2.50	$10.00	128K	Смотреть →
Body Builder (beta) Body Builder (beta) — ИИ-модель для универсального чата от Openrouter, с средняя скорость. Контекстное окно до 128К токенов. Возможности: доступ к API. Цена: вход $-1000000/млн токенов, выход $-1000000/млн токенов. (Официальное описание: Transform your natural language requests into structured OpenRouter API request objects.)	Openrouter	Без токенной тарификации	—	128K	Смотреть →
IBM: Granite 4.0 Micro IBM: Granite 4.0 Micro — ИИ-модель для универсального чата от Ibm-granite, с средняя скорость. Контекстное окно до 131К токенов. Возможности: доступ к API. Цена: вход $0.017/млн токенов, выход $0.11/млн токенов. (Официальное описание: Granite-4.0-H-Micro is a 3B parameter from the Granite 4 family of models.)	Ibm-granite	$0.017	$0.11	131K	Смотреть →
Meta: Llama 3.1 8B Instruct Meta: Llama 3.1 8B Instruct — ИИ-модель для универсального чата от Meta, с средняя скорость. Контекстное окно до 16К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.02/млн токенов, выход $0.05/млн токенов. (Официальное описание: Meta's latest class of model (Llama 3.1) launched with a variety of sizes & flavors.)	Meta	$0.02	$0.05	16K	Смотреть →
Mistral: Mistral Nemo Mistral: Mistral Nemo — ИИ-модель для универсального чата от Mistral AI, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.02/млн токенов, выход $0.03/млн токенов. (Официальное описание: A 12B parameter model with a 128k token context length built by Mistral in collaboration with NVIDIA.)	Mistral AI	$0.02	$0.03	131K	Смотреть →
Meta: Llama 3.2 1B Instruct Meta: Llama 3.2 1B Instruct — ИИ-модель для универсального чата от Meta, с средняя скорость. Контекстное окно до 60К токенов. Возможности: доступ к API. Цена: вход $0.027/млн токенов, выход $0.2/млн токенов. (Официальное описание: Llama 3.2 1B is a 1-billion-parameter language model focused on efficiently performing natural language tasks, such as summarization, dialogue, and multilingual text analysis.)	Meta	$0.027	$0.20	60K	Смотреть →
LiquidAI: LFM2-24B-A2B LiquidAI: LFM2-24B-A2B — ИИ-модель для универсального чата от Liquid AI, с средняя скорость. Контекстное окно до 33К токенов. Возможности: доступ к API. Цена: вход $0.03/млн токенов, выход $0.12/млн токенов. (Официальное описание: LFM2-24B-A2B is the largest model in the LFM2 family of hybrid architectures designed for efficient on-device deployment.)	Liquid AI	$0.03	$0.12	33K	Смотреть →
OpenAI: gpt-oss-20b OpenAI: gpt-oss-20b — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.03/млн токенов, выход $0.14/млн токенов. (Официальное описание: gpt-oss-20b is an open-weight 21B parameter model released by OpenAI under the Apache 2.0 license.)	OpenAI	$0.03	$0.14	131K	Смотреть →
Qwen: Qwen-Turbo Qwen: Qwen-Turbo — ИИ-модель для универсального чата от Alibaba, с быстрый отклик. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.0325/млн токенов, выход $0.13/млн токенов. (Официальное описание: Qwen-Turbo, based on Qwen2.5, is a 1M context model that provides fast speed and low cost, suitable for simple tasks.)	Alibaba	$0.0325	$0.13	131K	Смотреть →
Amazon: Nova Micro 1.0 Amazon: Nova Micro 1.0 — ИИ-модель для универсального чата от Amazon, с средняя скорость. Контекстное окно до 128К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.035/млн токенов, выход $0.14/млн токенов. (Официальное описание: Amazon Nova Micro 1.0 is a text-only model that delivers the lowest latency responses in the Amazon Nova family of models at a very low cost.)	Amazon	$0.035	$0.14	128K	Смотреть →
Cohere: Command R7B (12-2024) Cohere: Command R7B (12-2024) — ИИ-модель для универсального чата от Cohere, с средняя скорость. Контекстное окно до 128К токенов. Возможности: доступ к API. Цена: вход $0.0375/млн токенов, выход $0.15/млн токенов. (Официальное описание: Command R7B (12-2024) is a small, fast update of the Command R+ model, delivered in December 2024.)	Cohere	$0.0375	$0.15	128K	Смотреть →
OpenAI: gpt-oss-120b OpenAI: gpt-oss-120b — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.039/млн токенов, выход $0.18/млн токенов. (Официальное описание: gpt-oss-120b is an open-weight, 117B-parameter Mixture-of-Experts (MoE) language model from OpenAI designed for high-reasoning, agentic, and general-purpose production use cases.)	OpenAI	$0.039	$0.18	131K	Смотреть →
Qwen: Qwen2.5 7B Instruct Qwen: Qwen2.5 7B Instruct — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 33К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.04/млн токенов, выход $0.1/млн токенов. (Официальное описание: Qwen2.5 7B is the latest series of Qwen large language models.)	Alibaba	$0.04	$0.10	33K	Смотреть →
Qwen: Qwen3.5-9B Qwen: Qwen3.5-9B — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 262К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.04/млн токенов, выход $0.15/млн токенов. (Официальное описание: Qwen3.5-9B is a multimodal foundation model from the Qwen3.5 family, designed to deliver strong reasoning, coding, and visual understanding in an efficient 9B-parameter architecture.)	Alibaba	$0.04	$0.15	262K	Смотреть →
Google: Gemma 3 12B Google: Gemma 3 12B — ИИ-модель для универсального чата от Google, с средняя скорость. Контекстное окно до 131К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.04/млн токенов, выход $0.13/млн токенов. (Официальное описание: Gemma 3 introduces multimodality, supporting vision-language input and text outputs.)	Google	$0.04	$0.13	131K	Смотреть →
Google: Gemma 3 4B Google: Gemma 3 4B — ИИ-модель для универсального чата от Google, с средняя скорость. Контекстное окно до 131К токенов. Возможности: анализ изображений, доступ к API. Цена: вход $0.04/млн токенов, выход $0.08/млн токенов. (Официальное описание: Gemma 3 introduces multimodality, supporting vision-language input and text outputs.)	Google	$0.04	$0.08	131K	Смотреть →
Meta: Llama 3 8B Instruct Meta: Llama 3 8B Instruct — ИИ-модель для универсального чата от Meta, с средняя скорость. Контекстное окно до 8К токенов. Возможности: доступ к API. Цена: вход $0.04/млн токенов, выход $0.04/млн токенов. (Официальное описание: Meta's latest class of model (Llama 3) launched with a variety of sizes & flavors.)	Meta	$0.04	$0.04	8K	Смотреть →
NVIDIA: Nemotron Nano 9B V2 NVIDIA: Nemotron Nano 9B V2 — ИИ-модель для универсального чата от NVIDIA, с быстрый отклик. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.04/млн токенов, выход $0.16/млн токенов. (Официальное описание: NVIDIA-Nemotron-Nano-9B-v2 is a large language model (LLM) trained from scratch by NVIDIA, and designed as a unified model for both reasoning and non-reasoning tasks.)	NVIDIA	$0.04	$0.16	131K	Смотреть →
Sao10K: Llama 3 8B Lunaris Sao10K: Llama 3 8B Lunaris — ИИ-модель для универсального чата от Sao10K, с средняя скорость. Контекстное окно до 8К токенов. Возможности: доступ к API. Цена: вход $0.04/млн токенов, выход $0.05/млн токенов. (Официальное описание: Lunaris 8B is a versatile generalist and roleplaying model based on Llama 3.)	Sao10K	$0.04	$0.05	8K	Смотреть →
Arcee AI: Trinity Mini Arcee AI: Trinity Mini — ИИ-модель для универсального чата от Arcee-ai, с быстрый отклик. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.045/млн токенов, выход $0.15/млн токенов. (Официальное описание: Trinity Mini is a 26B-parameter (3B active) sparse mixture-of-experts language model featuring 128 experts with 8 active per token.)	Arcee-ai	$0.045	$0.15	131K	Смотреть →
Qwen: Qwen3 8B Qwen: Qwen3 8B — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 41К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.05/млн токенов, выход $0.4/млн токенов. (Официальное описание: Qwen3-8B is a dense 8.2B parameter causal language model from the Qwen3 series, designed for both reasoning-heavy tasks and efficient dialogue.)	Alibaba	$0.05	$0.40	41K	Смотреть →
IBM: Granite 4.1 8B IBM: Granite 4.1 8B — ИИ-модель для универсального чата от Ibm-granite, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.05/млн токенов, выход $0.1/млн токенов. (Официальное описание: Granite 4.1 8B is a dense, decoder-only 8-billion-parameter language model from IBM, part of the Granite 4.1 family.)	Ibm-granite	$0.05	$0.10	131K	Смотреть →
Mistral: Mistral Small 3 Mistral: Mistral Small 3 — ИИ-модель для универсального чата от Mistral AI, с быстрый отклик. Контекстное окно до 33К токенов. Возможности: доступ к API. Цена: вход $0.05/млн токенов, выход $0.08/млн токенов. (Официальное описание: Mistral Small 3 is a 24B-parameter language model optimized for low-latency performance across common AI tasks.)	Mistral AI	$0.05	$0.08	33K	Смотреть →
NVIDIA: Nemotron 3 Nano 30B A3B NVIDIA: Nemotron 3 Nano 30B A3B — ИИ-модель для универсального чата от NVIDIA, с быстрый отклик. Контекстное окно до 262К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.05/млн токенов, выход $0.2/млн токенов. (Официальное описание: NVIDIA Nemotron 3 Nano 30B A3B is a small language MoE model with highest compute efficiency and accuracy for developers to build specialized agentic AI systems.)	NVIDIA	$0.05	$0.20	262K	Смотреть →
OpenAI: GPT-5 Nano OpenAI: GPT-5 Nano — ИИ-модель для универсального чата от OpenAI, с быстрый отклик. Контекстное окно до 400К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.05/млн токенов, выход $0.4/млн токенов. (Официальное описание: GPT-5-Nano is the smallest and fastest variant in the GPT-5 system, optimized for developer tools, rapid interactions, and ultra-low latency environments.)	OpenAI	$0.05	$0.40	400K	Смотреть →
Meta: Llama 3.2 3B Instruct Meta: Llama 3.2 3B Instruct — ИИ-модель для универсального чата от Meta, с средняя скорость. Контекстное окно до 80К токенов. Возможности: доступ к API. Цена: вход $0.051/млн токенов, выход $0.34/млн токенов. (Официальное описание: Llama 3.2 3B is a 3-billion-parameter multilingual large language model, optimized for advanced natural language processing tasks like dialogue generation, reasoning, and summarization.)	Meta	$0.051	$0.34	80K	Смотреть →
Qwen: Qwen3 14B Qwen: Qwen3 14B — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 41К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.06/млн токенов, выход $0.24/млн токенов. (Официальное описание: Qwen3-14B is a dense 14.8B parameter causal language model from the Qwen3 series, designed for both complex reasoning and efficient dialogue.)	Alibaba	$0.06	$0.24	41K	Смотреть →
Amazon: Nova Lite 1.0 Amazon: Nova Lite 1.0 — ИИ-модель для универсального чата от Amazon, с быстрый отклик. Контекстное окно до 300К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.06/млн токенов, выход $0.24/млн токенов. (Официальное описание: Amazon Nova Lite 1.0 is a very low-cost multimodal model from Amazon that focused on fast processing of image, video, and text inputs to generate text output.)	Amazon	$0.06	$0.24	300K	Смотреть →
Google: Gemma 3n 4B Google: Gemma 3n 4B — ИИ-модель для универсального чата от Google, с средняя скорость. Контекстное окно до 33К токенов. Возможности: доступ к API. Цена: вход $0.06/млн токенов, выход $0.12/млн токенов. (Официальное описание: Gemma 3n E4B-it is optimized for efficient execution on mobile and low-resource devices, such as phones, laptops, and tablets.)	Google	$0.06	$0.12	33K	Смотреть →
Google: Gemma 4 26B A4B Google: Gemma 4 26B A4B — ИИ-модель для универсального чата от Google, с средняя скорость. Контекстное окно до 262К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.06/млн токенов, выход $0.33/млн токенов. (Официальное описание: Gemma 4 26B A4B IT is an instruction-tuned Mixture-of-Experts (MoE) model from Google DeepMind.)	Google	$0.06	$0.33	262K	Смотреть →
MythoMax 13B MythoMax 13B — ИИ-модель для универсального чата от Gryphe, с средняя скорость. Контекстное окно до 4К токенов. Возможности: доступ к API. Цена: вход $0.06/млн токенов, выход $0.06/млн токенов. (Официальное описание: One of the highest performing and most popular fine-tunes of Llama 2 13B, with rich descriptions and roleplay.)	Gryphe	$0.06	$0.06	4K	Смотреть →
Z.ai: GLM 4.7 Flash Z.ai: GLM 4.7 Flash — ИИ-модель для универсального чата от Z-ai, с быстрый отклик. Контекстное окно до 203К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.06/млн токенов, выход $0.4/млн токенов. (Официальное описание: As a 30B-class SOTA model, GLM-4.7-Flash offers a new option that balances performance and efficiency.)	Z-ai	$0.06	$0.40	203K	Смотреть →
Qwen: Qwen3.5-Flash Qwen: Qwen3.5-Flash — ИИ-модель для универсального чата от Alibaba, с быстрый отклик. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.065/млн токенов, выход $0.26/млн токенов. (Официальное описание: The Qwen3.5 native vision-language Flash models are built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency.)	Alibaba	$0.065	$0.26	1.0M	Смотреть →
Microsoft: Phi 4 Microsoft: Phi 4 — ИИ-модель для универсального чата от Microsoft, с средняя скорость. Контекстное окно до 16К токенов. Возможности: доступ к API. Цена: вход $0.065/млн токенов, выход $0.14/млн токенов. (Официальное описание: Microsoft Research Phi-4 is designed to perform well in complex reasoning tasks and can operate efficiently in situations with limited memory or where quick responses are needed.)	Microsoft	$0.065	$0.14	16K	Смотреть →
Tencent: Hy3 preview Tencent: Hy3 preview — ИИ-модель для универсального чата от Tencent, с средняя скорость. Контекстное окно до 262К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.066/млн токенов, выход $0.26/млн токенов. (Официальное описание: Hy3 preview is a high-efficiency Mixture-of-Experts model from Tencent designed for agentic workflows and production use.)	Tencent	$0.066	$0.26	262K	Смотреть →
Baidu: ERNIE 4.5 21B A3B Baidu: ERNIE 4.5 21B A3B — ИИ-модель для универсального чата от Baidu, с средняя скорость. Контекстное окно до 120К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.07/млн токенов, выход $0.28/млн токенов. (Официальное описание: A sophisticated text-based Mixture-of-Experts (MoE) model featuring 21B total parameters with 3B activated per token, delivering exceptional multimodal understanding and generation through heterogeneous MoE structures and modality-isolated routing.)	Baidu	$0.07	$0.28	120K	Смотреть →
Qwen: Qwen3 235B A22B Instruct 2507 Qwen: Qwen3 235B A22B Instruct 2507 — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 262К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.071/млн токенов, выход $0.1/млн токенов. (Официальное описание: Qwen3-235B-A22B-Instruct-2507 is a multilingual, instruction-tuned mixture-of-experts language model based on the Qwen3-235B architecture, with 22B active parameters per forward pass.)	Alibaba	$0.071	$0.10	262K	Смотреть →
ByteDance Seed: Seed 1.6 Flash ByteDance Seed: Seed 1.6 Flash — ИИ-модель для универсального чата от Bytedance-seed, с быстрый отклик. Контекстное окно до 262К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.075/млн токенов, выход $0.3/млн токенов. (Официальное описание: Seed 1.6 Flash is an ultra-fast multimodal deep thinking model by ByteDance Seed, supporting both text and visual understanding.)	Bytedance-seed	$0.075	$0.30	262K	Смотреть →
Google: Gemini 2.0 Flash Lite Google: Gemini 2.0 Flash Lite — ИИ-модель для универсального чата от Google, с быстрый отклик. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.075/млн токенов, выход $0.3/млн токенов. (Официальное описание: Gemini 2.0 Flash Lite offers a significantly faster time to first token (TTFT) compared to Gemini Flash 1.5, while maintaining quality on par with larger models like Gemini Pro 1.5,)	Google	$0.075	$0.30	1.0M	Смотреть →
Mistral: Mistral Small 3.2 24B Mistral: Mistral Small 3.2 24B — ИИ-модель для универсального чата от Mistral AI, с быстрый отклик. Контекстное окно до 128К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.075/млн токенов, выход $0.2/млн токенов. (Официальное описание: Mistral-Small-3.2-24B-Instruct-2506 is an updated 24B parameter model from Mistral optimized for instruction following, repetition reduction, and improved function calling.)	Mistral AI	$0.075	$0.20	128K	Смотреть →
OpenAI: gpt-oss-safeguard-20b OpenAI: gpt-oss-safeguard-20b — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.075/млн токенов, выход $0.3/млн токенов. (Официальное описание: gpt-oss-safeguard-20b is a safety reasoning model from OpenAI built upon gpt-oss-20b.)	OpenAI	$0.075	$0.30	131K	Смотреть →
Qwen: Qwen3 32B Qwen: Qwen3 32B — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 41К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.08/млн токенов, выход $0.28/млн токенов. (Официальное описание: Qwen3-32B is a dense 32.8B parameter causal language model from the Qwen3 series, optimized for both complex reasoning and efficient dialogue.)	Alibaba	$0.08	$0.28	41K	Смотреть →
Qwen: Qwen3 VL 8B Instruct Qwen: Qwen3 VL 8B Instruct — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 131К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.08/млн токенов, выход $0.5/млн токенов. (Официальное описание: Qwen3-VL-8B-Instruct is a multimodal vision-language model from the Qwen3-VL series, built for high-fidelity understanding and reasoning across text, images, and video.)	Alibaba	$0.08	$0.50	131K	Смотреть →
Google: Gemma 3 27B Google: Gemma 3 27B — ИИ-модель для универсального чата от Google, с средняя скорость. Контекстное окно до 131К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.08/млн токенов, выход $0.16/млн токенов. (Официальное описание: Gemma 3 introduces multimodality, supporting vision-language input and text outputs.)	Google	$0.08	$0.16	131K	Смотреть →
inclusionAI: Ling-2.6-flash inclusionAI: Ling-2.6-flash — ИИ-модель для универсального чата от Inclusionai, с быстрый отклик. Контекстное окно до 262К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.08/млн токенов, выход $0.24/млн токенов. (Официальное описание: Ling-2.6-flash is an instant (instruct) model from inclusionAI with 104B total parameters and 7.4B active parameters, designed for real-world agents that require fast responses, strong execution, and high token efficiency)	Inclusionai	$0.08	$0.24	262K	Смотреть →
Meta: Llama 4 Scout Meta: Llama 4 Scout — ИИ-модель для универсального чата от Meta, с средняя скорость. Контекстное окно до 328К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.08/млн токенов, выход $0.3/млн токенов. (Официальное описание: Llama 4 Scout 17B Instruct (16E) is a mixture-of-experts (MoE) language model developed by Meta, activating 17 billion parameters out of a total of 109B.)	Meta	$0.08	$0.30	328K	Смотреть →
Microsoft: Phi 4 Mini Instruct Microsoft: Phi 4 Mini Instruct — ИИ-модель для универсального чата от Microsoft, с быстрый отклик. Контекстное окно до 128К токенов. Возможности: доступ к API. Цена: вход $0.08/млн токенов, выход $0.35/млн токенов. (Официальное описание: Phi-4-mini-instruct is a lightweight open model built upon synthetic data and filtered publicly available websites - with a focus on high-quality, reasoning dense data.)	Microsoft	$0.08	$0.35	128K	Смотреть →
Qwen: Qwen3 30B A3B Qwen: Qwen3 30B A3B — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 41К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.09/млн токенов, выход $0.45/млн токенов. (Официальное описание: Qwen3, the latest generation in the Qwen large language model series, features both dense and mixture-of-experts (MoE) architectures to excel in reasoning, multilingual support, and advanced agent tasks.)	Alibaba	$0.09	$0.45	41K	Смотреть →
Qwen: Qwen3 30B A3B Instruct 2507 Qwen: Qwen3 30B A3B Instruct 2507 — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 262К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.09/млн токенов, выход $0.3/млн токенов. (Официальное описание: Qwen3-30B-A3B-Instruct-2507 is a 30.5B-parameter mixture-of-experts language model from Qwen, with 3.3B active parameters per inference.)	Alibaba	$0.09	$0.30	262K	Смотреть →
Qwen: Qwen3 Next 80B A3B Instruct Qwen: Qwen3 Next 80B A3B Instruct — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 262К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.09/млн токенов, выход $1.1/млн токенов. (Официальное описание: Qwen3-Next-80B-A3B-Instruct is an instruction-tuned chat model in the Qwen3-Next series optimized for fast, stable responses without “thinking” traces.)	Alibaba	$0.09	$1.10	262K	Смотреть →
Tongyi DeepResearch 30B A3B Tongyi DeepResearch 30B A3B — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.09/млн токенов, выход $0.45/млн токенов. (Официальное описание: Tongyi DeepResearch is an agentic large language model developed by Tongyi Lab, with 30 billion total parameters activating only 3 billion per token.)	Alibaba	$0.09	$0.45	131K	Смотреть →
NVIDIA: Nemotron 3 Super NVIDIA: Nemotron 3 Super — ИИ-модель для универсального чата от NVIDIA, с средняя скорость. Контекстное окно до 262К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.09/млн токенов, выход $0.45/млн токенов. (Официальное описание: NVIDIA Nemotron 3 Super is a 120B-parameter open hybrid MoE model, activating just 12B parameters for maximum compute efficiency and accuracy in complex multi-agent applications.)	NVIDIA	$0.09	$0.45	262K	Смотреть →
Gemini 2.0 Flash Gemini 2.0 Flash — универсальная модель Google: быстрая, эффективная и мультимодальная.	Google	$0.10	$0.40	1.0M	Смотреть →
ByteDance: UI-TARS 7B ByteDance: UI-TARS 7B — ИИ-модель для универсального чата от ByteDance, с средняя скорость. Контекстное окно до 128К токенов. Возможности: анализ изображений, доступ к API. Цена: вход $0.1/млн токенов, выход $0.2/млн токенов. (Официальное описание: UI-TARS-1.5 is a multimodal vision-language agent optimized for GUI-based environments, including desktop interfaces, web browsers, mobile systems, and games.)	ByteDance	$0.10	$0.20	128K	Смотреть →
ByteDance Seed: Seed-2.0-Mini ByteDance Seed: Seed-2.0-Mini — ИИ-модель для универсального чата от Bytedance-seed, с быстрый отклик. Контекстное окно до 262К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.1/млн токенов, выход $0.4/млн токенов. (Официальное описание: Seed-2.0-mini targets latency-sensitive, high-concurrency, and cost-sensitive scenarios, emphasizing fast response and flexible inference deployment.)	Bytedance-seed	$0.10	$0.40	262K	Смотреть →
Google: Gemini 2.0 Flash Google: Gemini 2.0 Flash — ИИ-модель для универсального чата от Google, с быстрый отклик. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.1/млн токенов, выход $0.4/млн токенов. (Официальное описание: Gemini Flash 2.0 offers a significantly faster time to first token (TTFT) compared to Gemini Flash 1.5, while maintaining quality on par with larger models like Gemini Pro 1.5.)	Google	$0.10	$0.40	1.0M	Смотреть →
Google: Gemini 2.5 Flash Lite Google: Gemini 2.5 Flash Lite — ИИ-модель для универсального чата от Google, с быстрый отклик. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.1/млн токенов, выход $0.4/млн токенов. (Официальное описание: Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency.)	Google	$0.10	$0.40	1.0M	Смотреть →
Google: Gemini 2.5 Flash Lite Preview 09-2025 Google: Gemini 2.5 Flash Lite Preview 09-2025 — ИИ-модель для универсального чата от Google, с быстрый отклик. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.1/млн токенов, выход $0.4/млн токенов. (Официальное описание: Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency.)	Google	$0.10	$0.40	1.0M	Смотреть →
Meta: Llama 3.3 70B Instruct Meta: Llama 3.3 70B Instruct — ИИ-модель для универсального чата от Meta, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.1/млн токенов, выход $0.32/млн токенов. (Официальное описание: The Meta Llama 3.3 multilingual large language model (LLM) is a pretrained and instruction tuned generative model in 70B (text in/text out).)	Meta	$0.10	$0.32	131K	Смотреть →
Mistral: Devstral Small 1.1 Mistral: Devstral Small 1.1 — ИИ-модель для универсального чата от Mistral AI, с быстрый отклик. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.1/млн токенов, выход $0.3/млн токенов. (Официальное описание: Devstral Small 1.1 is a 24B parameter open-weight language model for software engineering agents, developed by Mistral AI in collaboration with All Hands AI.)	Mistral AI	$0.10	$0.30	131K	Смотреть →
Mistral: Ministral 3 3B 2512 Mistral: Ministral 3 3B 2512 — ИИ-модель для универсального чата от Mistral AI, с быстрый отклик. Контекстное окно до 131К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.1/млн токенов, выход $0.1/млн токенов. (Официальное описание: The smallest model in the Ministral 3 family, Ministral 3 3B is a powerful, efficient tiny language model with vision capabilities.)	Mistral AI	$0.10	$0.10	131K	Смотреть →
Mistral: Voxtral Small 24B 2507 Mistral: Voxtral Small 24B 2507 — ИИ-модель для универсального чата от Mistral AI, с быстрый отклик. Контекстное окно до 32К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.1/млн токенов, выход $0.3/млн токенов. (Официальное описание: Voxtral Small is an enhancement of Mistral Small 3, incorporating state-of-the-art audio input capabilities while retaining best-in-class text performance.)	Mistral AI	$0.10	$0.30	32K	Смотреть →
NVIDIA: Llama 3.3 Nemotron Super 49B V1.5 NVIDIA: Llama 3.3 Nemotron Super 49B V1.5 — ИИ-модель для универсального чата от NVIDIA, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.1/млн токенов, выход $0.4/млн токенов. (Официальное описание: Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context.)	NVIDIA	$0.10	$0.40	131K	Смотреть →
OpenAI: GPT-4.1 Nano OpenAI: GPT-4.1 Nano — ИИ-модель для универсального чата от OpenAI, с быстрый отклик. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.1/млн токенов, выход $0.4/млн токенов. (Официальное описание: For tasks that demand low latency, GPT‑4.1 nano is the fastest and cheapest model in the GPT-4.1 series.)	OpenAI	$0.10	$0.40	1.0M	Смотреть →
Reka Edge Reka Edge — ИИ-модель для универсального чата от Rekaai, с средняя скорость. Контекстное окно до 16К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.1/млн токенов, выход $0.1/млн токенов. (Официальное описание: Reka Edge is an extremely efficient 7B multimodal vision-language model that accepts image/video+text inputs and generates text outputs.)	Rekaai	$0.10	$0.10	16K	Смотреть →
Reka Flash 3 Reka Flash 3 — ИИ-модель для универсального чата от Rekaai, с быстрый отклик. Контекстное окно до 66К токенов. Возможности: доступ к API. Цена: вход $0.1/млн токенов, выход $0.2/млн токенов. (Официальное описание: Reka Flash 3 is a general-purpose, instruction-tuned large language model with 21 billion parameters, developed by Reka.)	Rekaai	$0.10	$0.20	66K	Смотреть →
StepFun: Step 3.5 Flash StepFun: Step 3.5 Flash — ИИ-модель для универсального чата от Stepfun, с быстрый отклик. Контекстное окно до 262К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.1/млн токенов, выход $0.3/млн токенов. (Официальное описание: Step 3.5 Flash is StepFun's most capable open-source foundation model.)	Stepfun	$0.10	$0.30	262K	Смотреть →
Xiaomi: MiMo-V2-Flash Xiaomi: MiMo-V2-Flash — ИИ-модель для универсального чата от Xiaomi, с быстрый отклик. Контекстное окно до 262К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.1/млн токенов, выход $0.3/млн токенов. (Официальное описание: MiMo-V2-Flash is an open-source foundation language model developed by Xiaomi.)	Xiaomi	$0.10	$0.30	262K	Смотреть →
Z.ai: GLM 4 32B Z.ai: GLM 4 32B — ИИ-модель для универсального чата от Z-ai, с средняя скорость. Контекстное окно до 128К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.1/млн токенов, выход $0.1/млн токенов. (Официальное описание: GLM 4 32B is a cost-effective foundation language model.)	Z-ai	$0.10	$0.10	128K	Смотреть →
Qwen: Qwen3 VL 32B Instruct Qwen: Qwen3 VL 32B Instruct — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 131К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.104/млн токенов, выход $0.416/млн токенов. (Официальное описание: Qwen3-VL-32B-Instruct is a large-scale multimodal vision-language model designed for high-precision understanding and reasoning across text, images, and video.)	Alibaba	$0.104	$0.416	131K	Смотреть →
Mistral: Mistral 7B Instruct v0.1 Mistral: Mistral 7B Instruct v0.1 — ИИ-модель для универсального чата от Mistral AI, с средняя скорость. Контекстное окно до 3К токенов. Возможности: доступ к API. Цена: вход $0.11/млн токенов, выход $0.19/млн токенов. (Официальное описание: A 7.3B parameter model that outperforms Llama 2 13B on all benchmarks, with optimizations for speed and context length.)	Mistral AI	$0.11	$0.19	3K	Смотреть →
Google: Gemma 4 31B Google: Gemma 4 31B — ИИ-модель для универсального чата от Google, с средняя скорость. Контекстное окно до 262К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.12/млн токенов, выход $0.37/млн токенов. (Официальное описание: Gemma 4 31B Instruct is Google DeepMind's 30.7B dense multimodal model supporting text and image input with text output.)	Google	$0.12	$0.37	262K	Смотреть →
Qwen: Qwen3 VL 30B A3B Instruct Qwen: Qwen3 VL 30B A3B Instruct — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 131К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.13/млн токенов, выход $0.52/млн токенов. (Официальное описание: Qwen3-VL-30B-A3B-Instruct is a multimodal model that unifies strong text generation with visual understanding for images and videos.)	Alibaba	$0.13	$0.52	131K	Смотреть →
Nous: Hermes 4 70B Nous: Hermes 4 70B — ИИ-модель для универсального чата от Nous Research, с средняя скорость. Контекстное окно до 131К токенов. Возможности: доступ к API. Цена: вход $0.13/млн токенов, выход $0.4/млн токенов. (Официальное описание: Hermes 4 70B is a hybrid reasoning model from Nous Research, built on Meta-Llama-3.1-70B.)	Nous Research	$0.13	$0.40	131K	Смотреть →
Z.ai: GLM 4.5 Air Z.ai: GLM 4.5 Air — ИИ-модель для универсального чата от Z-ai, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.13/млн токенов, выход $0.85/млн токенов. (Официальное описание: GLM-4.5-Air is the lightweight variant of our latest flagship model family, also purpose-built for agent-centric applications.)	Z-ai	$0.13	$0.85	131K	Смотреть →
Nex AGI: DeepSeek V3.1 Nex N1 Nex AGI: DeepSeek V3.1 Nex N1 — ИИ-модель для универсального чата от Nex-agi, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.135/млн токенов, выход $0.5/млн токенов. (Официальное описание: DeepSeek V3.1 Nex-N1 is the flagship release of the Nex-N1 series — a post-trained model designed to highlight agent autonomy, tool use, and real-world productivity.)	Nex-agi	$0.135	$0.50	131K	Смотреть →
Qwen: Qwen VL Plus Qwen: Qwen VL Plus — ИИ-модель для универсального чата от Alibaba, с медленная, но мощная обработка. Контекстное окно до 131К токенов. Возможности: анализ изображений, доступ к API. Цена: вход $0.1365/млн токенов, выход $0.4095/млн токенов. (Официальное описание: Qwen's Enhanced Large Visual Language Model.)	Alibaba	$0.1365	$0.4095	131K	Смотреть →
Qwen: Qwen3.5-35B-A3B Qwen: Qwen3.5-35B-A3B — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 262К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.14/млн токенов, выход $1/млн токенов. (Официальное описание: The Qwen3.5 Series 35B-A3B is a native vision-language model designed with a hybrid architecture that integrates linear attention mechanisms and a sparse mixture-of-experts model, achieving higher inference efficiency.)	Alibaba	$0.14	$1.00	262K	Смотреть →
Baidu: ERNIE 4.5 VL 28B A3B Baidu: ERNIE 4.5 VL 28B A3B — ИИ-модель для универсального чата от Baidu, с средняя скорость. Контекстное окно до 30К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.14/млн токенов, выход $0.56/млн токенов. (Официальное описание: A powerful multimodal Mixture-of-Experts chat model featuring 28B total parameters with 3B activated per token, delivering exceptional text and vision understanding through its innovative heterogeneous MoE structure with modality-isolated routing)	Baidu	$0.14	$0.56	30K	Смотреть →
DeepSeek: DeepSeek V4 Flash DeepSeek: DeepSeek V4 Flash — ИИ-модель для универсального чата от DeepSeek, с быстрый отклик. Контекстное окно до 1М токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.14/млн токенов, выход $0.28/млн токенов. (Официальное описание: DeepSeek V4 Flash is an efficiency-optimized Mixture-of-Experts model from DeepSeek with 284B total parameters and 13B activated parameters, supporting a 1M-token context window.)	DeepSeek	$0.14	$0.28	1.0M	Смотреть →
NousResearch: Hermes 2 Pro - Llama-3 8B NousResearch: Hermes 2 Pro - Llama-3 8B — ИИ-модель для универсального чата от Nous Research, с средняя скорость. Контекстное окно до 8К токенов. Возможности: доступ к API. Цена: вход $0.14/млн токенов, выход $0.14/млн токенов. (Официальное описание: Hermes 2 Pro is an upgraded, retrained version of Nous Hermes 2, consisting of an updated and cleaned version of the OpenHermes 2.5 Dataset, as well as a newly introduced)	Nous Research	$0.14	$0.14	8K	Смотреть →
Tencent: Hunyuan A13B Instruct Tencent: Hunyuan A13B Instruct — ИИ-модель для универсального чата от Tencent, с средняя скорость. Контекстное окно до 131К токенов. Возможности: доступ к API. Цена: вход $0.14/млн токенов, выход $0.57/млн токенов. (Официальное описание: Hunyuan-A13B is a 13B active parameter Mixture-of-Experts (MoE) language model developed by Tencent, with a total parameter count of 80B and support for reasoning via Chain-of-Thought.)	Tencent	$0.14	$0.57	131K	Смотреть →
Qwen: Qwen3.6 35B A3B Qwen: Qwen3.6 35B A3B — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 262К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.15/млн токенов, выход $1/млн токенов. (Официальное описание: Qwen3.6-35B-A3B is an open-weight multimodal model from Alibaba Cloud with 35 billion total parameters and 3 billion active parameters per token.)	Alibaba	$0.15	$1.00	262K	Смотреть →
AllenAI: Olmo 3 32B Think AllenAI: Olmo 3 32B Think — ИИ-модель для универсального чата от Allen AI, с средняя скорость. Контекстное окно до 66К токенов. Возможности: доступ к API. Цена: вход $0.15/млн токенов, выход $0.5/млн токенов. (Официальное описание: Olmo 3 32B Think is a large-scale, 32-billion-parameter model purpose-built for deep reasoning, complex logic chains and advanced instruction-following scenarios.)	Allen AI	$0.15	$0.50	66K	Смотреть →
Arcee AI: Trinity Large Preview Arcee AI: Trinity Large Preview — ИИ-модель для универсального чата от Arcee-ai, с медленная, но мощная обработка. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.15/млн токенов, выход $0.45/млн токенов. (Официальное описание: Trinity-Large-Preview is a frontier-scale open-weight language model from Arcee, built as a 400B-parameter sparse Mixture-of-Experts with 13B active parameters per token using 4-of-256 expert routing.)	Arcee-ai	$0.15	$0.45	131K	Смотреть →
Cohere: Command R (08-2024) Cohere: Command R (08-2024) — ИИ-модель для универсального чата от Cohere, с средняя скорость. Контекстное окно до 128К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.15/млн токенов, выход $0.6/млн токенов. (Официальное описание: command-r-08-2024 is an update of the Command R with improved performance for multilingual retrieval-augmented generation (RAG) and tool use.)	Cohere	$0.15	$0.60	128K	Смотреть →
EssentialAI: Rnj 1 Instruct EssentialAI: Rnj 1 Instruct — ИИ-модель для универсального чата от Essentialai, с средняя скорость. Контекстное окно до 33К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.15/млн токенов, выход $0.15/млн токенов. (Официальное описание: Rnj-1 is an 8B-parameter, dense, open-weight model family developed by Essential AI and trained from scratch with a focus on programming, math, and scientific reasoning.)	Essentialai	$0.15	$0.15	33K	Смотреть →
Meta: Llama 4 Maverick Meta: Llama 4 Maverick — ИИ-модель для универсального чата от Meta, с средняя скорость. Контекстное окно до 1М токенов. Возможности: анализ изображений, доступ к API. Цена: вход $0.15/млн токенов, выход $0.6/млн токенов. (Официальное описание: Llama 4 Maverick 17B Instruct (128E) is a high-capacity multimodal language model from Meta, built on a mixture-of-experts (MoE) architecture with 128 experts and 17 billion active parameters per forward)	Meta	$0.15	$0.60	1.0M	Смотреть →
MiniMax: MiniMax M2.5 MiniMax: MiniMax M2.5 — ИИ-модель для универсального чата от MiniMax, с быстрый отклик. Контекстное окно до 197К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.15/млн токенов, выход $1.15/млн токенов. (Официальное описание: MiniMax-M2.5 is a SOTA large language model designed for real-world productivity.)	MiniMax	$0.15	$1.15	197K	Смотреть →
Mistral: Ministral 3 8B 2512 Mistral: Ministral 3 8B 2512 — ИИ-модель для универсального чата от Mistral AI, с быстрый отклик. Контекстное окно до 262К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.15/млн токенов, выход $0.15/млн токенов. (Официальное описание: A balanced model in the Ministral 3 family, Ministral 3 8B is a powerful, efficient tiny language model with vision capabilities.)	Mistral AI	$0.15	$0.15	262K	Смотреть →
Mistral: Mistral Small 4 Mistral: Mistral Small 4 — ИИ-модель для универсального чата от Mistral AI, с быстрый отклик. Контекстное окно до 262К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.15/млн токенов, выход $0.6/млн токенов. (Официальное описание: Mistral Small 4 is the next major release in the Mistral Small family, unifying the capabilities of several flagship Mistral models into a single system.)	Mistral AI	$0.15	$0.60	262K	Смотреть →
OpenAI: GPT-4o-mini OpenAI: GPT-4o-mini — ИИ-модель для универсального чата от OpenAI, с быстрый отклик. Контекстное окно до 128К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.15/млн токенов, выход $0.6/млн токенов. (Официальное описание: GPT-4o mini is OpenAI's newest model after GPT-4 Omni, supporting both text and image inputs with text outputs.)	OpenAI	$0.15	$0.60	128K	Смотреть →
OpenAI: GPT-4o-mini (2024-07-18) OpenAI: GPT-4o-mini (2024-07-18) — ИИ-модель для универсального чата от OpenAI, с быстрый отклик. Контекстное окно до 128К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.15/млн токенов, выход $0.6/млн токенов. (Официальное описание: GPT-4o mini is OpenAI's newest model after GPT-4 Omni, supporting both text and image inputs with text outputs.)	OpenAI	$0.15	$0.60	128K	Смотреть →
OpenAI: GPT-4o-mini Search Preview OpenAI: GPT-4o-mini Search Preview — ИИ-модель для универсального чата от OpenAI, с быстрый отклик. Контекстное окно до 128К токенов. Возможности: доступ к API. Цена: вход $0.15/млн токенов, выход $0.6/млн токенов. (Официальное описание: GPT-4o mini Search Preview is a specialized model for web search in Chat Completions.)	OpenAI	$0.15	$0.60	128K	Смотреть →
Upstage: Solar Pro 3 Upstage: Solar Pro 3 — ИИ-модель для универсального чата от Upstage, с средняя скорость. Контекстное окно до 128К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.15/млн токенов, выход $0.6/млн токенов. (Официальное описание: Solar Pro 3 is Upstage's powerful Mixture-of-Experts (MoE) language model.)	Upstage	$0.15	$0.60	128K	Смотреть →
TheDrummer: Rocinante 12B TheDrummer: Rocinante 12B — ИИ-модель для универсального чата от TheDrummer, с средняя скорость. Контекстное окно до 33К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.17/млн токенов, выход $0.43/млн токенов. (Официальное описание: Rocinante 12B is designed for engaging storytelling and rich prose.)	TheDrummer	$0.17	$0.43	33K	Смотреть →
Arcee AI: Spotlight Arcee AI: Spotlight — ИИ-модель для универсального чата от Arcee-ai, с средняя скорость. Контекстное окно до 131К токенов. Возможности: анализ изображений, доступ к API. Цена: вход $0.18/млн токенов, выход $0.18/млн токенов. (Официальное описание: Spotlight is a 7‑billion‑parameter vision‑language model derived from Qwen 2.5‑VL and fine‑tuned by Arcee AI for tight image‑text grounding tasks.)	Arcee-ai	$0.18	$0.18	131K	Смотреть →
Meta: Llama Guard 4 12B Meta: Llama Guard 4 12B — ИИ-модель для универсального чата от Meta, с средняя скорость. Контекстное окно до 164К токенов. Возможности: анализ изображений, доступ к API. Цена: вход $0.18/млн токенов, выход $0.18/млн токенов. (Официальное описание: Llama Guard 4 is a Llama 4 Scout-derived multimodal pretrained model, fine-tuned for content safety classification.)	Meta	$0.18	$0.18	164K	Смотреть →
Qwen: Qwen3.5-27B Qwen: Qwen3.5-27B — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 262К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.195/млн токенов, выход $1.56/млн токенов. (Официальное описание: The Qwen3.5 27B native vision-language Dense model incorporates a linear attention mechanism, delivering fast response times while balancing inference speed and performance.)	Alibaba	$0.195	$1.56	262K	Смотреть →
Qwen: Qwen3 VL 235B A22B Instruct Qwen: Qwen3 VL 235B A22B Instruct — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 262К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.2/млн токенов, выход $0.88/млн токенов. (Официальное описание: Qwen3-VL-235B-A22B Instruct is an open-weight multimodal model that unifies strong text generation with visual understanding across images and video.)	Alibaba	$0.20	$0.88	262K	Смотреть →
DeepSeek: DeepSeek V3 0324 DeepSeek: DeepSeek V3 0324 — ИИ-модель для универсального чата от DeepSeek, с средняя скорость. Контекстное окно до 164К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.2/млн токенов, выход $0.77/млн токенов. (Официальное описание: DeepSeek V3, a 685B-parameter, mixture-of-experts model, is the latest iteration of the flagship chat model family from the DeepSeek team.)	DeepSeek	$0.20	$0.77	164K	Смотреть →
MiniMax: MiniMax-01 MiniMax: MiniMax-01 — ИИ-модель для универсального чата от MiniMax, с быстрый отклик. Контекстное окно до 1М токенов. Возможности: анализ изображений, доступ к API. Цена: вход $0.2/млн токенов, выход $1.1/млн токенов. (Официальное описание: MiniMax-01 is a combines MiniMax-Text-01 for text generation and MiniMax-VL-01 for image understanding.)	MiniMax	$0.20	$1.10	1.0M	Смотреть →
Mistral: Ministral 3 14B 2512 Mistral: Ministral 3 14B 2512 — ИИ-модель для универсального чата от Mistral AI, с быстрый отклик. Контекстное окно до 262К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.2/млн токенов, выход $0.2/млн токенов. (Официальное описание: The largest model in the Ministral 3 family, Ministral 3 14B offers frontier capabilities and performance comparable to its larger Mistral Small 3.2 24B counterpart.)	Mistral AI	$0.20	$0.20	262K	Смотреть →
Mistral: Saba Mistral: Saba — ИИ-модель для универсального чата от Mistral AI, с средняя скорость. Контекстное окно до 33К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.2/млн токенов, выход $0.6/млн токенов. (Официальное описание: Mistral Saba is a 24B-parameter language model specifically designed for the Middle East and South Asia, delivering accurate and contextually relevant responses while maintaining efficient performance.)	Mistral AI	$0.20	$0.60	33K	Смотреть →
OpenAI: GPT-5.4 Nano OpenAI: GPT-5.4 Nano — ИИ-модель для универсального чата от OpenAI, с быстрый отклик. Контекстное окно до 400К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.2/млн токенов, выход $1.25/млн токенов. (Официальное описание: GPT-5.4 nano is the most lightweight and cost-efficient variant of the GPT-5.4 family, optimized for speed-critical and high-volume tasks.)	OpenAI	$0.20	$1.25	400K	Смотреть →
Prime Intellect: INTELLECT-3 Prime Intellect: INTELLECT-3 — ИИ-модель для универсального чата от Prime-intellect, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.2/млн токенов, выход $1.1/млн токенов. (Официальное описание: INTELLECT-3 is a 106B-parameter Mixture-of-Experts model (12B active) post-trained from GLM-4.5-Air-Base using supervised fine-tuning (SFT) followed by large-scale reinforcement learning (RL).)	Prime-intellect	$0.20	$1.10	131K	Смотреть →
xAI: Grok 4 Fast xAI: Grok 4 Fast — ИИ-модель для универсального чата от xAI, с быстрый отклик. Контекстное окно до 2М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.2/млн токенов, выход $0.5/млн токенов. (Официальное описание: Grok 4 Fast is xAI's latest multimodal model with SOTA cost-efficiency and a 2M token context window.)	xAI	$0.20	$0.50	2.0M	Смотреть →
xAI: Grok 4.1 Fast xAI: Grok 4.1 Fast — ИИ-модель для универсального чата от xAI, с быстрый отклик. Контекстное окно до 2М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.2/млн токенов, выход $0.5/млн токенов. (Официальное описание: Grok 4.1 Fast is xAI's best agentic tool calling model that shines in real-world use cases like customer support and deep research.)	xAI	$0.20	$0.50	2.0M	Смотреть →
DeepSeek: DeepSeek V3.1 DeepSeek: DeepSeek V3.1 — ИИ-модель для универсального чата от DeepSeek, с средняя скорость. Контекстное окно до 164К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.21/млн токенов, выход $0.79/млн токенов. (Официальное описание: DeepSeek-V3.1 is a large hybrid reasoning model (671B parameters, 37B active) that supports both thinking and non-thinking modes via prompt templates.)	DeepSeek	$0.21	$0.79	164K	Смотреть →
Meta: Llama 3.2 11B Vision Instruct Meta: Llama 3.2 11B Vision Instruct — ИИ-модель для универсального чата от Meta, с средняя скорость. Контекстное окно до 131К токенов. Возможности: анализ изображений, доступ к API. Цена: вход $0.245/млн токенов, выход $0.245/млн токенов. (Официальное описание: Llama 3.2 11B Vision is a multimodal model with 11 billion parameters, designed to handle tasks combining visual and textual data.)	Meta	$0.245	$0.245	131K	Смотреть →
Qwen: Qwen2.5 VL 72B Instruct Qwen: Qwen2.5 VL 72B Instruct — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 32К токенов. Возможности: анализ изображений, доступ к API. Цена: вход $0.25/млн токенов, выход $0.75/млн токенов. (Официальное описание: Qwen2.5-VL is proficient in recognizing common objects such as flowers, birds, fish, and insects.)	Alibaba	$0.25	$0.75	32K	Смотреть →
Qwen: Qwen3.6 Flash Qwen: Qwen3.6 Flash — ИИ-модель для универсального чата от Alibaba, с быстрый отклик. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.25/млн токенов, выход $1.5/млн токенов. (Официальное описание: Qwen3.6 Flash is a fast, efficient language model from Alibaba's Qwen 3.6 series.)	Alibaba	$0.25	$1.50	1.0M	Смотреть →
Anthropic: Claude 3 Haiku Anthropic: Claude 3 Haiku — ИИ-модель для универсального чата от Anthropic, с быстрый отклик. Контекстное окно до 200К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.25/млн токенов, выход $1.25/млн токенов. (Официальное описание: Claude 3 Haiku is Anthropic's fastest and most compact model for near-instant responsiveness.)	Anthropic	$0.25	$1.25	200K	Смотреть →
ByteDance Seed: Seed 1.6 ByteDance Seed: Seed 1.6 — ИИ-модель для универсального чата от Bytedance-seed, с средняя скорость. Контекстное окно до 262К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.25/млн токенов, выход $2/млн токенов. (Официальное описание: Seed 1.6 is a general-purpose model released by the ByteDance Seed team.)	Bytedance-seed	$0.25	$2.00	262K	Смотреть →
ByteDance Seed: Seed-2.0-Lite ByteDance Seed: Seed-2.0-Lite — ИИ-модель для универсального чата от Bytedance-seed, с быстрый отклик. Контекстное окно до 262К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.25/млн токенов, выход $2/млн токенов. (Официальное описание: Seed-2.0-Lite is a versatile, cost‑efficient enterprise workhorse that delivers strong multimodal and agent capabilities while offering noticeably lower latency, making it a practical default choice for most production workloads across)	Bytedance-seed	$0.25	$2.00	262K	Смотреть →
Google: Gemini 3.1 Flash Lite Google: Gemini 3.1 Flash Lite — ИИ-модель для универсального чата от Google, с быстрый отклик. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.25/млн токенов, выход $1.5/млн токенов. (Официальное описание: Gemini 3.1 Flash Lite is Google’s GA high-efficiency multimodal model optimized for low-latency, high-volume workloads.)	Google	$0.25	$1.50	1.0M	Смотреть →
Google: Gemini 3.1 Flash Lite Preview Google: Gemini 3.1 Flash Lite Preview — ИИ-модель для универсального чата от Google, с быстрый отклик. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.25/млн токенов, выход $1.5/млн токенов. (Официальное описание: Gemini 3.1 Flash Lite Preview is Google's high-efficiency model optimized for high-volume use cases.)	Google	$0.25	$1.50	1.0M	Смотреть →
Inception: Mercury 2 Inception: Mercury 2 — ИИ-модель для универсального чата от Inception, с средняя скорость. Контекстное окно до 128К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.25/млн токенов, выход $0.75/млн токенов. (Официальное описание: Mercury 2 is an extremely fast reasoning LLM, and the first reasoning diffusion LLM (dLLM).)	Inception	$0.25	$0.75	128K	Смотреть →
OpenAI: GPT-5 Mini OpenAI: GPT-5 Mini — ИИ-модель для универсального чата от OpenAI, с быстрый отклик. Контекстное окно до 400К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.25/млн токенов, выход $2/млн токенов. (Официальное описание: GPT-5 Mini is a compact version of GPT-5, designed to handle lighter-weight reasoning tasks.)	OpenAI	$0.25	$2.00	400K	Смотреть →
OpenAI: GPT-5.1-Codex-Mini OpenAI: GPT-5.1-Codex-Mini — ИИ-модель для универсального чата от OpenAI, с быстрый отклик. Контекстное окно до 400К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.25/млн токенов, выход $2/млн токенов. (Официальное описание: GPT-5.1-Codex-Mini is a smaller and faster version of GPT-5.1-Codex)	OpenAI	$0.25	$2.00	400K	Смотреть →
DeepSeek: DeepSeek V3.2 DeepSeek: DeepSeek V3.2 — ИИ-модель для универсального чата от DeepSeek, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.252/млн токенов, выход $0.378/млн токенов. (Официальное описание: DeepSeek-V3.2 is a large language model designed to harmonize high computational efficiency with strong reasoning and agentic tool-use performance.)	DeepSeek	$0.252	$0.378	131K	Смотреть →
MiniMax: MiniMax M2 MiniMax: MiniMax M2 — ИИ-модель для универсального чата от MiniMax, с быстрый отклик. Контекстное окно до 197К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.255/млн токенов, выход $1/млн токенов. (Официальное описание: MiniMax-M2 is a compact, high-efficiency large language model optimized for end-to-end coding and agentic workflows.)	MiniMax	$0.255	$1.00	197K	Смотреть →
Qwen: Qwen Plus 0728 Qwen: Qwen Plus 0728 — ИИ-модель для универсального чата от Alibaba, с медленная, но мощная обработка. Контекстное окно до 1М токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.26/млн токенов, выход $0.78/млн токенов. (Официальное описание: Qwen Plus 0728, based on the Qwen3 foundation model, is a 1 million context hybrid reasoning model with a balanced performance, speed, and cost combination.)	Alibaba	$0.26	$0.78	1.0M	Смотреть →
Qwen: Qwen-Plus Qwen: Qwen-Plus — ИИ-модель для универсального чата от Alibaba, с медленная, но мощная обработка. Контекстное окно до 1М токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.26/млн токенов, выход $0.78/млн токенов. (Официальное описание: Qwen-Plus, based on the Qwen2.5 foundation model, is a 131K context model with a balanced performance, speed, and cost combination.)	Alibaba	$0.26	$0.78	1.0M	Смотреть →
Qwen: Qwen3.5 Plus 2026-02-15 Qwen: Qwen3.5 Plus 2026-02-15 — ИИ-модель для универсального чата от Alibaba, с медленная, но мощная обработка. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.26/млн токенов, выход $1.56/млн токенов. (Официальное описание: The Qwen3.5 native vision-language series Plus models are built on a hybrid architecture that integrates linear attention mechanisms with sparse mixture-of-experts models, achieving higher inference efficiency.)	Alibaba	$0.26	$1.56	1.0M	Смотреть →
Qwen: Qwen3.5-122B-A10B Qwen: Qwen3.5-122B-A10B — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 262К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.26/млн токенов, выход $2.08/млн токенов. (Официальное описание: The Qwen3.5 122B-A10B native vision-language model is built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency.)	Alibaba	$0.26	$2.08	262K	Смотреть →
DeepSeek: DeepSeek V3.1 Terminus DeepSeek: DeepSeek V3.1 Terminus — ИИ-модель для универсального чата от DeepSeek, с средняя скорость. Контекстное окно до 164К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.27/млн токенов, выход $0.95/млн токенов. (Официальное описание: DeepSeek-V3.1 Terminus is an update to DeepSeek V3.1 that maintains the model's original capabilities while addressing issues reported by users, including language consistency and agent capabilities, further optimizing the model's)	DeepSeek	$0.27	$0.95	164K	Смотреть →
DeepSeek: DeepSeek V3.2 Exp DeepSeek: DeepSeek V3.2 Exp — ИИ-модель для универсального чата от DeepSeek, с средняя скорость. Контекстное окно до 164К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.27/млн токенов, выход $0.41/млн токенов. (Официальное описание: DeepSeek-V3.2-Exp is an experimental large language model released by DeepSeek as an intermediate step between V3.1 and future architectures.)	DeepSeek	$0.27	$0.41	164K	Смотреть →
Baidu: ERNIE 4.5 300B A47B Baidu: ERNIE 4.5 300B A47B — ИИ-модель для универсального чата от Baidu, с средняя скорость. Контекстное окно до 123К токенов. Возможности: доступ к API. Цена: вход $0.28/млн токенов, выход $1.1/млн токенов. (Официальное описание: ERNIE-4.5-300B-A47B is a 300B parameter Mixture-of-Experts (MoE) language model developed by Baidu as part of the ERNIE 4.5 series.)	Baidu	$0.28	$1.10	123K	Смотреть →
DeepSeek: DeepSeek V3.2 Speciale DeepSeek: DeepSeek V3.2 Speciale — ИИ-модель для универсального чата от DeepSeek, с средняя скорость. Контекстное окно до 164К токенов. Возможности: доступ к API. Цена: вход $0.287/млн токенов, выход $0.431/млн токенов. (Официальное описание: DeepSeek-V3.2-Speciale is a high-compute variant of DeepSeek-V3.2 optimized for maximum reasoning and agentic performance.)	DeepSeek	$0.287	$0.431	164K	Смотреть →
MiniMax: MiniMax M2.1 MiniMax: MiniMax M2.1 — ИИ-модель для универсального чата от MiniMax, с быстрый отклик. Контекстное окно до 197К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.29/млн токенов, выход $0.95/млн токенов. (Официальное описание: MiniMax-M2.1 is a lightweight, state-of-the-art large language model optimized for coding, agentic workflows, and modern application development.)	MiniMax	$0.29	$0.95	197K	Смотреть →
MiniMax: MiniMax M2.7 MiniMax: MiniMax M2.7 — ИИ-модель для универсального чата от MiniMax, с быстрый отклик. Контекстное окно до 197К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.299/млн токенов, выход $1.2/млн токенов. (Официальное описание: MiniMax-M2.7 is a next-generation large language model designed for autonomous, real-world productivity and continuous improvement.)	MiniMax	$0.299	$1.20	197K	Смотреть →
Amazon: Nova 2 Lite Amazon: Nova 2 Lite — ИИ-модель для универсального чата от Amazon, с быстрый отклик. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.3/млн токенов, выход $2.5/млн токенов. (Официальное описание: Nova 2 Lite is a fast, cost-effective reasoning model for everyday workloads that can process text, images, and videos to generate text.)	Amazon	$0.30	$2.50	1.0M	Смотреть →
Google: Gemini 2.5 Flash Google: Gemini 2.5 Flash — ИИ-модель для универсального чата от Google, с быстрый отклик. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.3/млн токенов, выход $2.5/млн токенов. (Официальное описание: Gemini 2.5 Flash is Google's state-of-the-art workhorse model, specifically designed for advanced reasoning, coding, mathematics, and scientific tasks.)	Google	$0.30	$2.50	1.0M	Смотреть →
inclusionAI: Ling-2.6-1T inclusionAI: Ling-2.6-1T — ИИ-модель для универсального чата от Inclusionai, с средняя скорость. Контекстное окно до 262К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.3/млн токенов, выход $2.5/млн токенов. (Официальное описание: Ling-2.6-1T is an instant (instruct) model from inclusionAI and the company’s trillion-parameter flagship, designed for real-world agents that require fast execution and high efficiency at scale.)	Inclusionai	$0.30	$2.50	262K	Смотреть →
MiniMax: MiniMax M2-her MiniMax: MiniMax M2-her — ИИ-модель для универсального чата от MiniMax, с быстрый отклик. Контекстное окно до 66К токенов. Возможности: доступ к API. Цена: вход $0.3/млн токенов, выход $1.2/млн токенов. (Официальное описание: MiniMax M2-her is a dialogue-first large language model built for immersive roleplay, character-driven chat, and expressive multi-turn conversations.)	MiniMax	$0.30	$1.20	66K	Смотреть →
Nous: Hermes 3 70B Instruct Nous: Hermes 3 70B Instruct — ИИ-модель для универсального чата от Nous Research, с средняя скорость. Контекстное окно до 131К токенов. Возможности: доступ к API. Цена: вход $0.3/млн токенов, выход $0.3/млн токенов. (Официальное описание: Hermes 3 is a generalist language model with many improvements over Hermes 2, including advanced agentic capabilities, much better roleplaying, reasoning, multi-turn conversation, long context coherence, and improvements across the)	Nous Research	$0.30	$0.30	131K	Смотреть →
TheDrummer: Cydonia 24B V4.1 TheDrummer: Cydonia 24B V4.1 — ИИ-модель для универсального чата от TheDrummer, с средняя скорость. Контекстное окно до 131К токенов. Возможности: доступ к API. Цена: вход $0.3/млн токенов, выход $0.5/млн токенов. (Официальное описание: Uncensored and creative writing model based on Mistral Small 3.2 24B with good recall, prompt adherence, and intelligence.)	TheDrummer	$0.30	$0.50	131K	Смотреть →
Z.ai: GLM 4.6V Z.ai: GLM 4.6V — ИИ-модель для универсального чата от Z-ai, с средняя скорость. Контекстное окно до 131К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.3/млн токенов, выход $0.9/млн токенов. (Официальное описание: GLM-4.6V is a large multimodal model designed for high-fidelity visual understanding and long-context reasoning across images, documents, and mixed media.)	Z-ai	$0.30	$0.90	131K	Смотреть →
xAI: Grok 3 Mini xAI: Grok 3 Mini — ИИ-модель для универсального чата от xAI, с быстрый отклик. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.3/млн токенов, выход $0.5/млн токенов. (Официальное описание: A lightweight model that thinks before responding.)	xAI	$0.30	$0.50	131K	Смотреть →
xAI: Grok 3 Mini Beta xAI: Grok 3 Mini Beta — ИИ-модель для универсального чата от xAI, с быстрый отклик. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.3/млн токенов, выход $0.5/млн токенов. (Официальное описание: Grok 3 Mini is a lightweight, smaller thinking model.)	xAI	$0.30	$0.50	131K	Смотреть →
Qwen: Qwen3.6 27B Qwen: Qwen3.6 27B — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 262К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.32/млн токенов, выход $3.2/млн токенов. (Официальное описание: Qwen3.6 27B is a dense 27-billion-parameter language model from the Qwen Team at Alibaba, released in April 2026.)	Alibaba	$0.32	$3.20	262K	Смотреть →
DeepSeek: DeepSeek V3 DeepSeek: DeepSeek V3 — ИИ-модель для универсального чата от DeepSeek, с средняя скорость. Контекстное окно до 164К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.32/млн токенов, выход $0.89/млн токенов. (Официальное описание: DeepSeek-V3 is the latest model from the DeepSeek team, building upon the instruction following and coding abilities of the previous versions.)	DeepSeek	$0.32	$0.89	164K	Смотреть →
Qwen: Qwen3.6 Plus Qwen: Qwen3.6 Plus — ИИ-модель для универсального чата от Alibaba, с медленная, но мощная обработка. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.325/млн токенов, выход $1.95/млн токенов. (Официальное описание: Qwen 3.6 Plus builds on a hybrid architecture that combines efficient linear attention with sparse mixture-of-experts routing, enabling strong scalability and high-performance inference.)	Alibaba	$0.325	$1.95	1.0M	Смотреть →
Mistral: Mistral Small 3.1 24B Mistral: Mistral Small 3.1 24B — ИИ-модель для универсального чата от Mistral AI, с быстрый отклик. Контекстное окно до 128К токенов. Возможности: анализ изображений, доступ к API. Цена: вход $0.35/млн токенов, выход $0.56/млн токенов. (Официальное описание: Mistral Small 3.1 24B Instruct is an upgraded variant of Mistral Small 3 (2501), featuring 24 billion parameters with advanced multimodal capabilities.)	Mistral AI	$0.35	$0.56	128K	Смотреть →
Qwen2.5 72B Instruct Qwen2.5 72B Instruct — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 33К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.36/млн токенов, выход $0.4/млн токенов. (Официальное описание: Qwen2.5 72B is the latest series of Qwen large language models.)	Alibaba	$0.36	$0.40	33K	Смотреть →
Qwen: Qwen3.5 397B A17B Qwen: Qwen3.5 397B A17B — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 262К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.39/млн токенов, выход $2.34/млн токенов. (Официальное описание: The Qwen3.5 series 397B-A17B native vision-language model is built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency.)	Alibaba	$0.39	$2.34	262K	Смотреть →
Z.ai: GLM 4.6 Z.ai: GLM 4.6 — ИИ-модель для универсального чата от Z-ai, с средняя скорость. Контекстное окно до 205К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.39/млн токенов, выход $1.9/млн токенов. (Официальное описание: Compared with GLM-4.5, this generation brings several key improvements: Longer context window: The context window has been expanded from 128K to 200K tokens, enabling the model to handle more complex)	Z-ai	$0.39	$1.90	205K	Смотреть →
Qwen: Qwen3.5 Plus 2026-04-20 Qwen: Qwen3.5 Plus 2026-04-20 — ИИ-модель для универсального чата от Alibaba, с медленная, но мощная обработка. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.4/млн токенов, выход $2.4/млн токенов. (Официальное описание: Qwen3.5 Plus (April 2026) is a large-scale multimodal language model from Alibaba.)	Alibaba	$0.40	$2.40	1.0M	Смотреть →
Meta: Llama 3.1 70B Instruct Meta: Llama 3.1 70B Instruct — ИИ-модель для универсального чата от Meta, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.4/млн токенов, выход $0.4/млн токенов. (Официальное описание: Meta's latest class of model (Llama 3.1) launched with a variety of sizes & flavors.)	Meta	$0.40	$0.40	131K	Смотреть →
MiniMax: MiniMax M1 MiniMax: MiniMax M1 — ИИ-модель для универсального чата от MiniMax, с быстрый отклик. Контекстное окно до 1М токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.4/млн токенов, выход $2.2/млн токенов. (Официальное описание: MiniMax-M1 is a large-scale, open-weight reasoning model designed for extended context and high-efficiency inference.)	MiniMax	$0.40	$2.20	1.0M	Смотреть →
Mistral: Devstral 2 2512 Mistral: Devstral 2 2512 — ИИ-модель для универсального чата от Mistral AI, с средняя скорость. Контекстное окно до 262К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.4/млн токенов, выход $2/млн токенов. (Официальное описание: Devstral 2 is a state-of-the-art open-source model by Mistral AI specializing in agentic coding.)	Mistral AI	$0.40	$2.00	262K	Смотреть →
Mistral: Devstral Medium Mistral: Devstral Medium — ИИ-модель для универсального чата от Mistral AI, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.4/млн токенов, выход $2/млн токенов. (Официальное описание: Devstral Medium is a high-performance code generation and agentic reasoning model developed jointly by Mistral AI and All Hands AI.)	Mistral AI	$0.40	$2.00	131K	Смотреть →
Mistral: Mistral Medium 3 Mistral: Mistral Medium 3 — ИИ-модель для универсального чата от Mistral AI, с средняя скорость. Контекстное окно до 131К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.4/млн токенов, выход $2/млн токенов. (Официальное описание: Mistral Medium 3 is a high-performance enterprise-grade language model designed to deliver frontier-level capabilities at significantly reduced operational cost.)	Mistral AI	$0.40	$2.00	131K	Смотреть →
Mistral: Mistral Medium 3.1 Mistral: Mistral Medium 3.1 — ИИ-модель для универсального чата от Mistral AI, с средняя скорость. Контекстное окно до 131К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.4/млн токенов, выход $2/млн токенов. (Официальное описание: Mistral Medium 3.1 is an updated version of Mistral Medium 3, which is a high-performance enterprise-grade language model designed to deliver frontier-level capabilities at significantly reduced operational cost.)	Mistral AI	$0.40	$2.00	131K	Смотреть →
MoonshotAI: Kimi K2 0905 MoonshotAI: Kimi K2 0905 — ИИ-модель для универсального чата от Moonshotai, с средняя скорость. Контекстное окно до 262К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.4/млн токенов, выход $2/млн токенов. (Официальное описание: Kimi K2 0905 is the September update of Kimi K2 0711.)	Moonshotai	$0.40	$2.00	262K	Смотреть →
MoonshotAI: Kimi K2.5 MoonshotAI: Kimi K2.5 — ИИ-модель для универсального чата от Moonshotai, с средняя скорость. Контекстное окно до 262К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.4/млн токенов, выход $1.98/млн токенов. (Официальное описание: Kimi K2.5 is Moonshot AI's native multimodal model, delivering state-of-the-art visual coding capability and a self-directed agent swarm paradigm.)	Moonshotai	$0.40	$1.98	262K	Смотреть →
OpenAI: GPT-4.1 Mini OpenAI: GPT-4.1 Mini — ИИ-модель для универсального чата от OpenAI, с быстрый отклик. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.4/млн токенов, выход $1.6/млн токенов. (Официальное описание: GPT-4.1 Mini is a mid-sized model delivering performance competitive with GPT-4o at substantially lower latency and cost.)	OpenAI	$0.40	$1.60	1.0M	Смотреть →
TheDrummer: UnslopNemo 12B TheDrummer: UnslopNemo 12B — ИИ-модель для универсального чата от TheDrummer, с средняя скорость. Контекстное окно до 33К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.4/млн токенов, выход $0.4/млн токенов. (Официальное описание: UnslopNemo v4.1 is the latest addition from the creator of Rocinante, designed for adventure writing and role-play scenarios.)	TheDrummer	$0.40	$0.40	33K	Смотреть →
Xiaomi: MiMo-V2-Omni Xiaomi: MiMo-V2-Omni — ИИ-модель для универсального чата от Xiaomi, с средняя скорость. Контекстное окно до 262К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.4/млн токенов, выход $2/млн токенов. (Официальное описание: MiMo-V2-Omni is a frontier omni-modal model that natively processes image, video, and audio inputs within a unified architecture.)	Xiaomi	$0.40	$2.00	262K	Смотреть →
Xiaomi: MiMo-V2.5 Xiaomi: MiMo-V2.5 — ИИ-модель для универсального чата от Xiaomi, с средняя скорость. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.4/млн токенов, выход $2/млн токенов. (Официальное описание: MiMo-V2.5 is a native omnimodal model by Xiaomi.)	Xiaomi	$0.40	$2.00	1.0M	Смотреть →
Z.ai: GLM 4.7 Z.ai: GLM 4.7 — ИИ-модель для универсального чата от Z-ai, с средняя скорость. Контекстное окно до 203К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.4/млн токенов, выход $1.75/млн токенов. (Официальное описание: GLM-4.7 is Z.ai’s latest flagship model, featuring upgrades in two key areas: enhanced programming capabilities and more stable multi-step reasoning/execution.)	Z-ai	$0.40	$1.75	203K	Смотреть →
Baidu: ERNIE 4.5 VL 424B A47B Baidu: ERNIE 4.5 VL 424B A47B — ИИ-модель для универсального чата от Baidu, с средняя скорость. Контекстное окно до 123К токенов. Возможности: анализ изображений, доступ к API. Цена: вход $0.42/млн токенов, выход $1.25/млн токенов. (Официальное описание: ERNIE-4.5-VL-424B-A47B is a multimodal Mixture-of-Experts (MoE) model from Baidu’s ERNIE 4.5 series, featuring 424B total parameters with 47B active per token.)	Baidu	$0.42	$1.25	123K	Смотреть →
DeepSeek: DeepSeek V4 Pro DeepSeek: DeepSeek V4 Pro — ИИ-модель для универсального чата от DeepSeek, с средняя скорость. Контекстное окно до 1М токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.435/млн токенов, выход $0.87/млн токенов. (Официальное описание: DeepSeek V4 Pro is a large-scale Mixture-of-Experts model from DeepSeek with 1.6T total parameters and 49B activated parameters, supporting a 1M-token context window.)	DeepSeek	$0.435	$0.87	1.0M	Смотреть →
ReMM SLERP 13B ReMM SLERP 13B — ИИ-модель для универсального чата от Undi95, с средняя скорость. Контекстное окно до 6К токенов. Возможности: доступ к API. Цена: вход $0.45/млн токенов, выход $0.65/млн токенов. (Официальное описание: A recreation trial of the original MythoMax-L2-B13 but with updated models.)	Undi95	$0.45	$0.65	6K	Смотреть →
Qwen: Qwen3 235B A22B Qwen: Qwen3 235B A22B — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.455/млн токенов, выход $1.82/млн токенов. (Официальное описание: Qwen3-235B-A22B is a 235B parameter mixture-of-experts (MoE) model developed by Qwen, activating 22B parameters per forward pass.)	Alibaba	$0.455	$1.82	131K	Смотреть →
Llama Guard 3 8B Llama Guard 3 8B — ИИ-модель для универсального чата от Meta, с средняя скорость. Контекстное окно до 131К токенов. Возможности: доступ к API. Цена: вход $0.48/млн токенов, выход $0.03/млн токенов. (Официальное описание: Llama Guard 3 is a Llama-3.1-8B pretrained model, fine-tuned for content safety classification.)	Meta	$0.48	$0.03	131K	Смотреть →
Google: Gemini 3 Flash Preview Google: Gemini 3 Flash Preview — ИИ-модель для универсального чата от Google, с быстрый отклик. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.5/млн токенов, выход $3/млн токенов. (Официальное описание: Gemini 3 Flash Preview is a high speed, high value thinking model designed for agentic workflows, multi turn chat, and coding assistance.)	Google	$0.50	$3.00	1.0M	Смотреть →
Mistral: Mistral Large 3 2512 Mistral: Mistral Large 3 2512 — ИИ-модель для универсального чата от Mistral AI, с медленная, но мощная обработка. Контекстное окно до 262К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.5/млн токенов, выход $1.5/млн токенов. (Официальное описание: Mistral Large 3 2512 is Mistral’s most capable model to date, featuring a sparse mixture-of-experts architecture with 41B active parameters (675B total), and released under the Apache 2.0 license.)	Mistral AI	$0.50	$1.50	262K	Смотреть →
OpenAI: GPT-3.5 Turbo OpenAI: GPT-3.5 Turbo — ИИ-модель для универсального чата от OpenAI, с быстрый отклик. Контекстное окно до 16К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.5/млн токенов, выход $1.5/млн токенов. (Официальное описание: GPT-3.5 Turbo is OpenAI's fastest model.)	OpenAI	$0.50	$1.50	16K	Смотреть →
Google Gemini Flash Latest Google Gemini Flash Latest — ИИ-модель для универсального чата от ~google, с быстрый отклик. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.5/млн токенов, выход $3/млн токенов. (Официальное описание: This model always redirects to the latest model in the Google Gemini Flash family.)	~google	$0.50	$3.00	1.0M	Смотреть →
Meta: Llama 3 70B Instruct Meta: Llama 3 70B Instruct — ИИ-модель для универсального чата от Meta, с средняя скорость. Контекстное окно до 8К токенов. Возможности: доступ к API. Цена: вход $0.51/млн токенов, выход $0.74/млн токенов. (Официальное описание: Meta's latest class of model (Llama 3) launched with a variety of sizes & flavors.)	Meta	$0.51	$0.74	8K	Смотреть →
Qwen: Qwen VL Max Qwen: Qwen VL Max — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 131К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.52/млн токенов, выход $2.08/млн токенов. (Официальное описание: Qwen VL Max is a visual understanding model with 7500 tokens context length.)	Alibaba	$0.52	$2.08	131K	Смотреть →
TheDrummer: Skyfall 36B V2 TheDrummer: Skyfall 36B V2 — ИИ-модель для универсального чата от TheDrummer, с средняя скорость. Контекстное окно до 33К токенов. Возможности: доступ к API. Цена: вход $0.55/млн токенов, выход $0.8/млн токенов. (Официальное описание: Skyfall 36B v2 is an enhanced iteration of Mistral Small 2501, specifically fine-tuned for improved creativity, nuanced writing, role-playing, and coherent storytelling.)	TheDrummer	$0.55	$0.80	33K	Смотреть →
MoonshotAI: Kimi K2 0711 MoonshotAI: Kimi K2 0711 — ИИ-модель для универсального чата от Moonshotai, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.57/млн токенов, выход $2.3/млн токенов. (Официальное описание: Kimi K2 Instruct is a large-scale Mixture-of-Experts (MoE) language model developed by Moonshot AI, featuring 1 trillion total parameters with 32 billion active per forward pass.)	Moonshotai	$0.57	$2.30	131K	Смотреть →
OpenAI: GPT Audio Mini OpenAI: GPT Audio Mini — ИИ-модель для универсального чата от OpenAI, с быстрый отклик. Контекстное окно до 128К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.6/млн токенов, выход $2.4/млн токенов. (Официальное описание: A cost-efficient version of GPT Audio.)	OpenAI	$0.60	$2.40	128K	Смотреть →
Writer: Palmyra X5 Writer: Palmyra X5 — ИИ-модель для универсального чата от Writer, с средняя скорость. Контекстное окно до 1М токенов. Возможности: доступ к API. Цена: вход $0.6/млн токенов, выход $6/млн токенов. (Официальное описание: Palmyra X5 is Writer's most advanced model, purpose-built for building and scaling AI agents across the enterprise.)	Writer	$0.60	$6.00	1.0M	Смотреть →
Z.ai: GLM 4.5 Z.ai: GLM 4.5 — ИИ-модель для универсального чата от Z-ai, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.6/млн токенов, выход $2.2/млн токенов. (Официальное описание: GLM-4.5 is our latest flagship foundation model, purpose-built for agent-based applications.)	Z-ai	$0.60	$2.20	131K	Смотреть →
Z.ai: GLM 4.5V Z.ai: GLM 4.5V — ИИ-модель для универсального чата от Z-ai, с средняя скорость. Контекстное окно до 66К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.6/млн токенов, выход $1.8/млн токенов. (Официальное описание: GLM-4.5V is a vision-language foundation model for multimodal agent applications.)	Z-ai	$0.60	$1.80	66K	Смотреть →
Z.ai: GLM 5 Z.ai: GLM 5 — ИИ-модель для универсального чата от Z-ai, с средняя скорость. Контекстное окно до 203К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.6/млн токенов, выход $1.92/млн токенов. (Официальное описание: GLM-5 is Z.ai’s flagship open-source foundation model engineered for complex systems design and long-horizon agent workflows.)	Z-ai	$0.60	$1.92	203K	Смотреть →
WizardLM-2 8x22B WizardLM-2 8x22B — ИИ-модель для универсального чата от Microsoft, с средняя скорость. Контекстное окно до 66К токенов. Возможности: доступ к API. Цена: вход $0.62/млн токенов, выход $0.62/млн токенов. (Официальное описание: WizardLM-2 8x22B is Microsoft AI's most advanced Wizard model.)	Microsoft	$0.62	$0.62	66K	Смотреть →
Google: Gemma 2 27B Google: Gemma 2 27B — ИИ-модель для универсального чата от Google, с средняя скорость. Контекстное окно до 8К токенов. Возможности: доступ к API. Цена: вход $0.65/млн токенов, выход $0.65/млн токенов. (Официальное описание: Gemma 2 27B by Google is an open model built from the same research and technology used to create the Gemini models.)	Google	$0.65	$0.65	8K	Смотреть →
Sao10K: Llama 3.3 Euryale 70B Sao10K: Llama 3.3 Euryale 70B — ИИ-модель для универсального чата от Sao10K, с средняя скорость. Контекстное окно до 131К токенов. Возможности: доступ к API. Цена: вход $0.65/млн токенов, выход $0.75/млн токенов. (Официальное описание: Euryale L3.3 70B is a model focused on creative roleplay from Sao10k.)	Sao10K	$0.65	$0.75	131K	Смотреть →
AionLabs: Aion-1.0-Mini AionLabs: Aion-1.0-Mini — ИИ-модель для универсального чата от Aion-labs, с быстрый отклик. Контекстное окно до 131К токенов. Возможности: доступ к API. Цена: вход $0.7/млн токенов, выход $1.4/млн токенов. (Официальное описание: Aion-1.0-Mini 32B parameter model is a distilled version of the DeepSeek-R1 model, designed for strong performance in reasoning domains such as mathematics, coding, and logic.)	Aion-labs	$0.70	$1.40	131K	Смотреть →
MoonshotAI: Kimi K2.6 MoonshotAI: Kimi K2.6 — ИИ-модель для универсального чата от Moonshotai, с средняя скорость. Контекстное окно до 33К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.74/млн токенов, выход $3.5/млн токенов. (Официальное описание: Kimi K2.6 is Moonshot AI's next-generation multimodal model, designed for long-horizon coding, coding-driven UI/UX generation, and multi-agent orchestration.)	Moonshotai	$0.74	$3.50	33K	Смотреть →
MoonshotAI Kimi Latest MoonshotAI Kimi Latest — ИИ-модель для универсального чата от ~moonshotai, с средняя скорость. Контекстное окно до 33К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.74/млн токенов, выход $3.5/млн токенов. (Официальное описание: This model always redirects to the latest model in the MoonshotAI Kimi family.)	~moonshotai	$0.74	$3.50	33K	Смотреть →
Arcee AI: Virtuoso Large Arcee AI: Virtuoso Large — ИИ-модель для универсального чата от Arcee-ai, с медленная, но мощная обработка. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.75/млн токенов, выход $1.2/млн токенов. (Официальное описание: Virtuoso‑Large is Arcee's top‑tier general‑purpose LLM at 72 B parameters, tuned to tackle cross‑domain reasoning, creative writing and enterprise QA.)	Arcee-ai	$0.75	$1.20	131K	Смотреть →
Mancer: Weaver (alpha) Mancer: Weaver (alpha) — ИИ-модель для универсального чата от Mancer, с средняя скорость. Контекстное окно до 8К токенов. Возможности: доступ к API. Цена: вход $0.75/млн токенов, выход $1/млн токенов. (Официальное описание: An attempt to recreate Claude-style verbosity, but don't expect the same level of coherence or memory.)	Mancer	$0.75	$1.00	8K	Смотреть →
OpenAI: GPT-5.4 Mini OpenAI: GPT-5.4 Mini — ИИ-модель для универсального чата от OpenAI, с быстрый отклик. Контекстное окно до 400К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.75/млн токенов, выход $4.5/млн токенов. (Официальное описание: GPT-5.4 mini brings the core capabilities of GPT-5.4 to a faster, more efficient model optimized for high-throughput workloads.)	OpenAI	$0.75	$4.50	400K	Смотреть →
OpenAI GPT Mini Latest OpenAI GPT Mini Latest — ИИ-модель для универсального чата от ~openai, с быстрый отклик. Контекстное окно до 400К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.75/млн токенов, выход $4.5/млн токенов. (Официальное описание: This model always redirects to the latest model in the OpenAI GPT Mini family.)	~openai	$0.75	$4.50	400K	Смотреть →
Qwen: Qwen3 Max Qwen: Qwen3 Max — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 262К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.78/млн токенов, выход $3.9/млн токенов. (Официальное описание: Qwen3-Max is an updated release built on the Qwen3 series, offering major improvements in reasoning, instruction following, multilingual support, and long-tail knowledge coverage compared to the January 2025 version.)	Alibaba	$0.78	$3.90	262K	Смотреть →
Claude Haiku 4.5 Claude Haiku — самая быстрая и компактная модель Anthropic, обеспечивающая почти мгновенный отклик.	Anthropic	$0.80	$4.00	200K	Смотреть →
AionLabs: Aion-2.0 AionLabs: Aion-2.0 — ИИ-модель для универсального чата от Aion-labs, с средняя скорость. Контекстное окно до 131К токенов. Возможности: доступ к API. Цена: вход $0.8/млн токенов, выход $1.6/млн токенов. (Официальное описание: Aion-2.0 is a variant of DeepSeek V3.2 optimized for immersive roleplaying and storytelling.)	Aion-labs	$0.80	$1.60	131K	Смотреть →
AionLabs: Aion-RP 1.0 (8B) AionLabs: Aion-RP 1.0 (8B) — ИИ-модель для универсального чата от Aion-labs, с средняя скорость. Контекстное окно до 33К токенов. Возможности: доступ к API. Цена: вход $0.8/млн токенов, выход $1.6/млн токенов. (Официальное описание: Aion-RP-Llama-3.1-8B ranks the highest in the character evaluation portion of the RPBench-Auto benchmark, a roleplaying-specific variant of Arena-Hard-Auto, where LLMs evaluate each other’s responses.)	Aion-labs	$0.80	$1.60	33K	Смотреть →
AlfredPros: CodeLLaMa 7B Instruct Solidity AlfredPros: CodeLLaMa 7B Instruct Solidity — ИИ-модель для универсального чата от Alfredpros, с средняя скорость. Контекстное окно до 4К токенов. Возможности: доступ к API. Цена: вход $0.8/млн токенов, выход $1.2/млн токенов. (Официальное описание: A finetuned 7 billion parameters Code LLaMA - Instruct model to generate Solidity smart contract using 4-bit QLoRA finetuning provided by PEFT library.)	Alfredpros	$0.80	$1.20	4K	Смотреть →
Amazon: Nova Pro 1.0 Amazon: Nova Pro 1.0 — ИИ-модель для универсального чата от Amazon, с средняя скорость. Контекстное окно до 300К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.8/млн токенов, выход $3.2/млн токенов. (Официальное описание: Amazon Nova Pro 1.0 is a capable multimodal model from Amazon focused on providing a combination of accuracy, speed, and cost for a wide range of tasks.)	Amazon	$0.80	$3.20	300K	Смотреть →
Anthropic: Claude 3.5 Haiku Anthropic: Claude 3.5 Haiku — ИИ-модель для универсального чата от Anthropic, с быстрый отклик. Контекстное окно до 200К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $0.8/млн токенов, выход $4/млн токенов. (Официальное описание: Claude 3.5 Haiku features offers enhanced capabilities in speed, coding accuracy, and tool use.)	Anthropic	$0.80	$4.00	200K	Смотреть →
Morph: Morph V3 Fast Morph: Morph V3 Fast — ИИ-модель для универсального чата от Morph, с быстрый отклик. Контекстное окно до 82К токенов. Возможности: доступ к API. Цена: вход $0.8/млн токенов, выход $1.2/млн токенов. (Официальное описание: Morph's fastest apply model for code edits.)	Morph	$0.80	$1.20	82K	Смотреть →
Relace: Relace Apply 3 Relace: Relace Apply 3 — ИИ-модель для универсального чата от Relace, с средняя скорость. Контекстное окно до 256К токенов. Возможности: доступ к API. Цена: вход $0.85/млн токенов, выход $1.25/млн токенов. (Официальное описание: Relace Apply 3 is a specialized code-patching LLM that merges AI-suggested edits straight into your source files.)	Relace	$0.85	$1.25	256K	Смотреть →
Sao10K: Llama 3.1 Euryale 70B v2.2 Sao10K: Llama 3.1 Euryale 70B v2.2 — ИИ-модель для универсального чата от Sao10K, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.85/млн токенов, выход $0.85/млн токенов. (Официальное описание: Euryale L3.1 70B v2.2 is a model focused on creative roleplay from Sao10k.)	Sao10K	$0.85	$0.85	131K	Смотреть →
Switchpoint Router Switchpoint Router — ИИ-модель для универсального чата от Switchpoint, с средняя скорость. Контекстное окно до 131К токенов. Возможности: доступ к API. Цена: вход $0.85/млн токенов, выход $3.4/млн токенов. (Официальное описание: Switchpoint AI's router instantly analyzes your request and directs it to the optimal AI from an ever-evolving library.)	Switchpoint	$0.85	$3.40	131K	Смотреть →
Arcee AI: Maestro Reasoning Arcee AI: Maestro Reasoning — ИИ-модель для универсального чата от Arcee-ai, с средняя скорость. Контекстное окно до 131К токенов. Возможности: доступ к API. Цена: вход $0.9/млн токенов, выход $3.3/млн токенов. (Официальное описание: Maestro Reasoning is Arcee's flagship analysis model: a 32 B‑parameter derivative of Qwen 2.5‑32 B tuned with DPO and chain‑of‑thought RL for step‑by‑step logic.)	Arcee-ai	$0.90	$3.30	131K	Смотреть →
Morph: Morph V3 Large Morph: Morph V3 Large — ИИ-модель для универсального чата от Morph, с медленная, но мощная обработка. Контекстное окно до 262К токенов. Возможности: доступ к API. Цена: вход $0.9/млн токенов, выход $1.9/млн токенов. (Официальное описание: Morph's high-accuracy apply model for complex code edits.)	Morph	$0.90	$1.90	262K	Смотреть →
Z.ai: GLM 5.1 Z.ai: GLM 5.1 — ИИ-модель для универсального чата от Z-ai, с средняя скорость. Контекстное окно до 203К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $0.98/млн токенов, выход $3.08/млн токенов. (Официальное описание: GLM-5.1 delivers a major leap in coding capability, with particularly significant gains in handling long-horizon tasks.)	Z-ai	$0.98	$3.08	203K	Смотреть →
Nous: Hermes 3 405B Instruct Nous: Hermes 3 405B Instruct — ИИ-модель для универсального чата от Nous Research, с средняя скорость. Контекстное окно до 131К токенов. Возможности: доступ к API. Цена: вход $1/млн токенов, выход $1/млн токенов. (Официальное описание: Hermes 3 is a generalist language model with many improvements over Hermes 2, including advanced agentic capabilities, much better roleplaying, reasoning, multi-turn conversation, long context coherence, and improvements across the)	Nous Research	$1.00	$1.00	131K	Смотреть →
Nous: Hermes 4 405B Nous: Hermes 4 405B — ИИ-модель для универсального чата от Nous Research, с средняя скорость. Контекстное окно до 131К токенов. Возможности: доступ к API. Цена: вход $1/млн токенов, выход $3/млн токенов. (Официальное описание: Hermes 4 is a large-scale reasoning model built on Meta-Llama-3.1-405B and released by Nous Research.)	Nous Research	$1.00	$3.00	131K	Смотреть →
OpenAI: GPT-3.5 Turbo (older v0613) OpenAI: GPT-3.5 Turbo (older v0613) — ИИ-модель для универсального чата от OpenAI, с быстрый отклик. Контекстное окно до 4К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $1/млн токенов, выход $2/млн токенов. (Официальное описание: GPT-3.5 Turbo is OpenAI's fastest model.)	OpenAI	$1.00	$2.00	4K	Смотреть →
Perplexity: Sonar Perplexity: Sonar — ИИ-модель для универсального чата от Perplexity, с средняя скорость. Контекстное окно до 127К токенов. Возможности: анализ изображений, доступ к API. Цена: вход $1/млн токенов, выход $1/млн токенов. (Официальное описание: Sonar is lightweight, affordable, fast, and simple to use — now featuring citations and the ability to customize sources.)	Perplexity	$1.00	$1.00	127K	Смотреть →
Relace: Relace Search Relace: Relace Search — ИИ-модель для универсального чата от Relace, с средняя скорость. Контекстное окно до 256К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $1/млн токенов, выход $3/млн токенов. (Официальное описание: The relace-search model uses 4-12 `view_file` and `grep` tools in parallel to explore a codebase and return relevant files to the user request.)	Relace	$1.00	$3.00	256K	Смотреть →
Xiaomi: MiMo-V2-Pro Xiaomi: MiMo-V2-Pro — ИИ-модель для универсального чата от Xiaomi, с средняя скорость. Контекстное окно до 1М токенов. Возможности: использование инструментов, доступ к API. Цена: вход $1/млн токенов, выход $3/млн токенов. (Официальное описание: MiMo-V2-Pro is Xiaomi's flagship foundation model, featuring over 1T total parameters and a 1M context length, deeply optimized for agentic scenarios.)	Xiaomi	$1.00	$3.00	1.0M	Смотреть →
Xiaomi: MiMo-V2.5-Pro Xiaomi: MiMo-V2.5-Pro — ИИ-модель для универсального чата от Xiaomi, с средняя скорость. Контекстное окно до 1М токенов. Возможности: использование инструментов, доступ к API. Цена: вход $1/млн токенов, выход $3/млн токенов. (Официальное описание: MiMo-V2.5-Pro is Xiaomi’s flagship model, delivering strong performance in general agentic capabilities, complex software engineering, and long-horizon tasks, with top rankings on benchmarks such as ClawEval, GDPVal, and SWE-bench Pro)	Xiaomi	$1.00	$3.00	1.0M	Смотреть →
Anthropic Claude Haiku Latest Anthropic Claude Haiku Latest — ИИ-модель для универсального чата от ~anthropic, с быстрый отклик. Контекстное окно до 200К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $1/млн токенов, выход $5/млн токенов. (Официальное описание: This model always redirects to the latest model in the Anthropic Claude Haiku family.)	~anthropic	$1.00	$5.00	200K	Смотреть →
Qwen: Qwen-Max Qwen: Qwen-Max — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 33К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $1.04/млн токенов, выход $4.16/млн токенов. (Официальное описание: Qwen-Max, based on Qwen2.5, provides the best inference performance among Qwen models, especially for complex multi-step tasks.)	Alibaba	$1.04	$4.16	33K	Смотреть →
Qwen: Qwen3.6 Max Preview Qwen: Qwen3.6 Max Preview — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 262К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $1.04/млн токенов, выход $6.24/млн токенов. (Официальное описание: Qwen3.6-Max-Preview is a proprietary frontier model from Alibaba Cloud built on a sparse mixture-of-experts architecture with approximately 1 trillion total parameters.)	Alibaba	$1.04	$6.24	262K	Смотреть →
Z.ai: GLM 5 Turbo Z.ai: GLM 5 Turbo — ИИ-модель для универсального чата от Z-ai, с быстрый отклик. Контекстное окно до 203К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $1.2/млн токенов, выход $4/млн токенов. (Официальное описание: GLM-5 Turbo is a new model from Z.ai designed for fast inference and strong performance in agent-driven environments such as OpenClaw scenarios.)	Z-ai	$1.20	$4.00	203K	Смотреть →
Z.ai: GLM 5V Turbo Z.ai: GLM 5V Turbo — ИИ-модель для универсального чата от Z-ai, с быстрый отклик. Контекстное окно до 203К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $1.2/млн токенов, выход $4/млн токенов. (Официальное описание: GLM-5V-Turbo is Z.ai’s first native multimodal agent foundation model, built for vision-based coding and agent-driven tasks.)	Z-ai	$1.20	$4.00	203K	Смотреть →
Deep Cogito: Cogito v2.1 671B Deep Cogito: Cogito v2.1 671B — ИИ-модель для универсального чата от Deepcogito, с средняя скорость. Контекстное окно до 128К токенов. Возможности: доступ к API. Цена: вход $1.25/млн токенов, выход $1.25/млн токенов. (Официальное описание: Cogito v2.1 671B MoE represents one of the strongest open models globally, matching performance of frontier closed and open models.)	Deepcogito	$1.25	$1.25	128K	Смотреть →
Google: Gemini 2.5 Pro Google: Gemini 2.5 Pro — ИИ-модель для универсального чата от Google, с быстрый отклик. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $1.25/млн токенов, выход $10/млн токенов. (Официальное описание: Gemini 2.5 Pro is Google’s state-of-the-art AI model designed for advanced reasoning, coding, mathematics, and scientific tasks.)	Google	$1.25	$10.00	1.0M	Смотреть →
Google: Gemini 2.5 Pro Preview 05-06 Google: Gemini 2.5 Pro Preview 05-06 — ИИ-модель для универсального чата от Google, с быстрый отклик. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $1.25/млн токенов, выход $10/млн токенов. (Официальное описание: Gemini 2.5 Pro is Google’s state-of-the-art AI model designed for advanced reasoning, coding, mathematics, and scientific tasks.)	Google	$1.25	$10.00	1.0M	Смотреть →
Google: Gemini 2.5 Pro Preview 06-05 Google: Gemini 2.5 Pro Preview 06-05 — ИИ-модель для универсального чата от Google, с быстрый отклик. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $1.25/млн токенов, выход $10/млн токенов. (Официальное описание: Gemini 2.5 Pro is Google’s state-of-the-art AI model designed for advanced reasoning, coding, mathematics, and scientific tasks.)	Google	$1.25	$10.00	1.0M	Смотреть →
OpenAI: GPT-5 Chat OpenAI: GPT-5 Chat — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 128К токенов. Возможности: анализ изображений, доступ к API. Цена: вход $1.25/млн токенов, выход $10/млн токенов. (Официальное описание: GPT-5 Chat is designed for advanced, natural, multimodal, and context-aware conversations for enterprise applications.)	OpenAI	$1.25	$10.00	128K	Смотреть →
OpenAI: GPT-5 Codex OpenAI: GPT-5 Codex — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 400К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $1.25/млн токенов, выход $10/млн токенов. (Официальное описание: GPT-5-Codex is a specialized version of GPT-5 optimized for software engineering and coding workflows.)	OpenAI	$1.25	$10.00	400K	Смотреть →
OpenAI: GPT-5.1 OpenAI: GPT-5.1 — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 400К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $1.25/млн токенов, выход $10/млн токенов. (Официальное описание: GPT-5.1 is the latest frontier-grade model in the GPT-5 series, offering stronger general-purpose reasoning, improved instruction adherence, and a more natural conversational style compared to GPT-5.)	OpenAI	$1.25	$10.00	400K	Смотреть →
OpenAI: GPT-5.1 Chat OpenAI: GPT-5.1 Chat — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 128К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $1.25/млн токенов, выход $10/млн токенов. (Официальное описание: GPT-5.1 Chat (AKA Instant is the fast, lightweight member of the 5.1 family, optimized for low-latency chat while retaining strong general intelligence.)	OpenAI	$1.25	$10.00	128K	Смотреть →
OpenAI: GPT-5.1-Codex OpenAI: GPT-5.1-Codex — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 400К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $1.25/млн токенов, выход $10/млн токенов. (Официальное описание: GPT-5.1-Codex is a specialized version of GPT-5.1 optimized for software engineering and coding workflows.)	OpenAI	$1.25	$10.00	400K	Смотреть →
OpenAI: GPT-5.1-Codex-Max OpenAI: GPT-5.1-Codex-Max — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 400К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $1.25/млн токенов, выход $10/млн токенов. (Официальное описание: GPT-5.1-Codex-Max is OpenAI’s latest agentic coding model, designed for long-running, high-context software development tasks.)	OpenAI	$1.25	$10.00	400K	Смотреть →
xAI: Grok 4.20 xAI: Grok 4.20 — ИИ-модель для универсального чата от xAI, с средняя скорость. Контекстное окно до 2М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $1.25/млн токенов, выход $2.5/млн токенов. (Официальное описание: Grok 4.20 is a reasoning model from xAI with industry-leading speed and agentic tool calling capabilities.)	xAI	$1.25	$2.50	2.0M	Смотреть →
xAI: Grok 4.3 xAI: Grok 4.3 — ИИ-модель для универсального чата от xAI, с средняя скорость. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $1.25/млн токенов, выход $2.5/млн токенов. (Официальное описание: Grok 4.3 is a reasoning model from xAI.)	xAI	$1.25	$2.50	1.0M	Смотреть →
Sao10k: Llama 3 Euryale 70B v2.1 Sao10k: Llama 3 Euryale 70B v2.1 — ИИ-модель для универсального чата от Sao10K, с средняя скорость. Контекстное окно до 8К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $1.48/млн токенов, выход $1.48/млн токенов. (Официальное описание: Euryale 70B v2.1 is a model focused on creative roleplay from Sao10k.)	Sao10K	$1.48	$1.48	8K	Смотреть →
Mistral: Mistral Medium 3.5 Mistral: Mistral Medium 3.5 — ИИ-модель для универсального чата от Mistral AI, с средняя скорость. Контекстное окно до 262К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $1.5/млн токенов, выход $7.5/млн токенов. (Официальное описание: Mistral Medium 3.5 is a dense 128B instruction-following model from Mistral AI.)	Mistral AI	$1.50	$7.50	262K	Смотреть →
OpenAI: GPT-3.5 Turbo Instruct OpenAI: GPT-3.5 Turbo Instruct — ИИ-модель для универсального чата от OpenAI, с быстрый отклик. Контекстное окно до 4К токенов. Возможности: доступ к API. Цена: вход $1.5/млн токенов, выход $2/млн токенов. (Официальное описание: This model is a variant of GPT-3.5 Turbo tuned for instructional prompts and omitting chat-related optimizations.)	OpenAI	$1.50	$2.00	4K	Смотреть →
OpenAI: GPT-5.2 OpenAI: GPT-5.2 — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 400К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $1.75/млн токенов, выход $14/млн токенов. (Официальное описание: GPT-5.2 is the latest frontier-grade model in the GPT-5 series, offering stronger agentic and long context perfomance compared to GPT-5.1.)	OpenAI	$1.75	$14.00	400K	Смотреть →
OpenAI: GPT-5.2 Chat OpenAI: GPT-5.2 Chat — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 128К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $1.75/млн токенов, выход $14/млн токенов. (Официальное описание: GPT-5.2 Chat (AKA Instant) is the fast, lightweight member of the 5.2 family, optimized for low-latency chat while retaining strong general intelligence.)	OpenAI	$1.75	$14.00	128K	Смотреть →
OpenAI: GPT-5.2-Codex OpenAI: GPT-5.2-Codex — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 400К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $1.75/млн токенов, выход $14/млн токенов. (Официальное описание: GPT-5.2-Codex is an upgraded version of GPT-5.1-Codex optimized for software engineering and coding workflows.)	OpenAI	$1.75	$14.00	400K	Смотреть →
OpenAI: GPT-5.3 Chat OpenAI: GPT-5.3 Chat — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 128К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $1.75/млн токенов, выход $14/млн токенов. (Официальное описание: GPT-5.3 Chat is an update to ChatGPT's most-used model that makes everyday conversations smoother, more useful, and more directly helpful.)	OpenAI	$1.75	$14.00	128K	Смотреть →
OpenAI: GPT-5.3-Codex OpenAI: GPT-5.3-Codex — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 400К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $1.75/млн токенов, выход $14/млн токенов. (Официальное описание: GPT-5.3-Codex is OpenAI’s most advanced agentic coding model, combining the frontier software engineering performance of GPT-5.2-Codex with the broader reasoning and professional knowledge capabilities of GPT-5.2.)	OpenAI	$1.75	$14.00	400K	Смотреть →
GPT-4.1最新 GPT-4.1 — последнее поколение от OpenAI с контекстом в миллион токенов и улучшенным следованием инструкциям.	OpenAI	$2.00	$8.00	1.0M	Смотреть →
AI21: Jamba Large 1.7 AI21: Jamba Large 1.7 — ИИ-модель для универсального чата от AI21 Labs, с медленная, но мощная обработка. Контекстное окно до 256К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $2/млн токенов, выход $8/млн токенов. (Официальное описание: Jamba Large 1.7 is the latest model in the Jamba open family, offering improvements in grounding, instruction-following, and overall efficiency.)	AI21 Labs	$2.00	$8.00	256K	Смотреть →
Google: Gemini 3.1 Pro Preview Google: Gemini 3.1 Pro Preview — ИИ-модель для универсального чата от Google, с быстрый отклик. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $2/млн токенов, выход $12/млн токенов. (Официальное описание: Gemini 3.1 Pro Preview is Google’s frontier reasoning model, delivering enhanced software engineering performance, improved agentic reliability, and more efficient token usage across complex workflows.)	Google	$2.00	$12.00	1.0M	Смотреть →
Google: Gemini 3.1 Pro Preview Custom Tools Google: Gemini 3.1 Pro Preview Custom Tools — ИИ-модель для универсального чата от Google, с быстрый отклик. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $2/млн токенов, выход $12/млн токенов. (Официальное описание: Gemini 3.1 Pro Preview Custom Tools is a variant of Gemini 3.1 Pro that improves tool selection behavior by preventing overuse of a general bash tool when more efficient third-party)	Google	$2.00	$12.00	1.0M	Смотреть →
Mistral Large Mistral Large — ИИ-модель для универсального чата от Mistral AI, с медленная, но мощная обработка. Контекстное окно до 128К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $2/млн токенов, выход $6/млн токенов. (Официальное описание: This is Mistral AI's flagship model, Mistral Large 2 (version `mistral-large-2407`).)	Mistral AI	$2.00	$6.00	128K	Смотреть →
Mistral Large 2407 Mistral Large 2407 — ИИ-модель для универсального чата от Mistral AI, с медленная, но мощная обработка. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $2/млн токенов, выход $6/млн токенов. (Официальное описание: This is Mistral AI's flagship model, Mistral Large 2 (version mistral-large-2407).)	Mistral AI	$2.00	$6.00	131K	Смотреть →
Mistral Large 2411 Mistral Large 2411 — ИИ-модель для универсального чата от Mistral AI, с медленная, но мощная обработка. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $2/млн токенов, выход $6/млн токенов. (Официальное описание: Mistral Large 2 2411 is an update of Mistral Large 2 released together with Pixtral Large 2411 It provides a significant upgrade on the previous Mistral Large 24.07, with notable)	Mistral AI	$2.00	$6.00	131K	Смотреть →
Mistral: Mixtral 8x22B Instruct Mistral: Mixtral 8x22B Instruct — ИИ-модель для универсального чата от Mistral AI, с средняя скорость. Контекстное окно до 66К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $2/млн токенов, выход $6/млн токенов. (Официальное описание: Mistral's official instruct fine-tuned version of Mixtral 8x22B.)	Mistral AI	$2.00	$6.00	66K	Смотреть →
Mistral: Pixtral Large 2411 Mistral: Pixtral Large 2411 — ИИ-модель для универсального чата от Mistral AI, с медленная, но мощная обработка. Контекстное окно до 131К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $2/млн токенов, выход $6/млн токенов. (Официальное описание: Pixtral Large is a 124B parameter, open-weight, multimodal model built on top of Mistral Large 2.)	Mistral AI	$2.00	$6.00	131K	Смотреть →
OpenAI: GPT-4.1 OpenAI: GPT-4.1 — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $2/млн токенов, выход $8/млн токенов. (Официальное описание: GPT-4.1 is a flagship large language model optimized for advanced instruction following, real-world software engineering, and long-context reasoning.)	OpenAI	$2.00	$8.00	1.0M	Смотреть →
Perplexity: Sonar Deep Research Perplexity: Sonar Deep Research — ИИ-модель для универсального чата от Perplexity, с средняя скорость. Контекстное окно до 128К токенов. Возможности: доступ к API. Цена: вход $2/млн токенов, выход $8/млн токенов. (Официальное описание: Sonar Deep Research is a research-focused model designed for multi-step retrieval, synthesis, and reasoning across complex topics.)	Perplexity	$2.00	$8.00	128K	Смотреть →
Perplexity: Sonar Reasoning Pro Perplexity: Sonar Reasoning Pro — ИИ-модель для универсального чата от Perplexity, с средняя скорость. Контекстное окно до 128К токенов. Возможности: анализ изображений, доступ к API. Цена: вход $2/млн токенов, выход $8/млн токенов. (Официальное описание: Note: Sonar Pro pricing includes Perplexity search pricing.)	Perplexity	$2.00	$8.00	128K	Смотреть →
xAI: Grok 4.20 Multi-Agent xAI: Grok 4.20 Multi-Agent — ИИ-модель для универсального чата от xAI, с средняя скорость. Контекстное окно до 2М токенов. Возможности: анализ изображений, доступ к API. Цена: вход $2/млн токенов, выход $6/млн токенов. (Официальное описание: Grok 4.20 Multi-Agent is a variant of xAI’s Grok 4.20 designed for collaborative, agent-based workflows.)	xAI	$2.00	$6.00	2.0M	Смотреть →
Google Gemini Pro Latest Google Gemini Pro Latest — ИИ-модель для универсального чата от ~google, с быстрый отклик. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $2/млн токенов, выход $12/млн токенов. (Официальное описание: This model always redirects to the latest model in the Google Gemini Pro family.)	~google	$2.00	$12.00	1.0M	Смотреть →
Amazon: Nova Premier 1.0 Amazon: Nova Premier 1.0 — ИИ-модель для универсального чата от Amazon, с средняя скорость. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $2.5/млн токенов, выход $12.5/млн токенов. (Официальное описание: Amazon Nova Premier is the most capable of Amazon’s multimodal models for complex reasoning tasks and for use as the best teacher for distilling custom models.)	Amazon	$2.50	$12.50	1.0M	Смотреть →
Cohere: Command A Cohere: Command A — ИИ-модель для универсального чата от Cohere, с средняя скорость. Контекстное окно до 256К токенов. Возможности: доступ к API. Цена: вход $2.5/млн токенов, выход $10/млн токенов. (Официальное описание: Command A is an open-weights 111B parameter model with a 256k context window focused on delivering great performance across agentic, multilingual, and coding use cases.)	Cohere	$2.50	$10.00	256K	Смотреть →
Cohere: Command R+ (08-2024) Cohere: Command R+ (08-2024) — ИИ-модель для универсального чата от Cohere, с средняя скорость. Контекстное окно до 128К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $2.5/млн токенов, выход $10/млн токенов. (Официальное описание: command-r-plus-08-2024 is an update of the Command R+ with roughly 50% higher throughput and 25% lower latencies as compared to the previous Command R+ version, while keeping the hardware footprint)	Cohere	$2.50	$10.00	128K	Смотреть →
Inflection: Inflection 3 Pi Inflection: Inflection 3 Pi — ИИ-модель для универсального чата от Inflection, с средняя скорость. Контекстное окно до 8К токенов. Возможности: доступ к API. Цена: вход $2.5/млн токенов, выход $10/млн токенов. (Официальное описание: Inflection 3 Pi powers Inflection's Pi chatbot, including backstory, emotional intelligence, productivity, and safety.)	Inflection	$2.50	$10.00	8K	Смотреть →
Inflection: Inflection 3 Productivity Inflection: Inflection 3 Productivity — ИИ-модель для универсального чата от Inflection, с средняя скорость. Контекстное окно до 8К токенов. Возможности: доступ к API. Цена: вход $2.5/млн токенов, выход $10/млн токенов. (Официальное описание: Inflection 3 Productivity is optimized for following instructions.)	Inflection	$2.50	$10.00	8K	Смотреть →
OpenAI: GPT Audio OpenAI: GPT Audio — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 128К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $2.5/млн токенов, выход $10/млн токенов. (Официальное описание: The gpt-audio model is OpenAI's first generally available audio model.)	OpenAI	$2.50	$10.00	128K	Смотреть →
OpenAI: GPT-4o (2024-08-06) OpenAI: GPT-4o (2024-08-06) — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 128К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $2.5/млн токенов, выход $10/млн токенов. (Официальное описание: The 2024-08-06 version of GPT-4o offers improved performance in structured outputs, with the ability to supply a JSON schema in the respone_format.)	OpenAI	$2.50	$10.00	128K	Смотреть →
OpenAI: GPT-4o (2024-11-20) OpenAI: GPT-4o (2024-11-20) — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 128К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $2.5/млн токенов, выход $10/млн токенов. (Официальное описание: The 2024-11-20 version of GPT-4o offers a leveled-up creative writing ability with more natural, engaging, and tailored writing to improve relevance & readability.)	OpenAI	$2.50	$10.00	128K	Смотреть →
OpenAI: GPT-4o Audio OpenAI: GPT-4o Audio — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 128К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $2.5/млн токенов, выход $10/млн токенов. (Официальное описание: The gpt-4o-audio-preview model adds support for audio inputs as prompts.)	OpenAI	$2.50	$10.00	128K	Смотреть →
OpenAI: GPT-4o Search Preview OpenAI: GPT-4o Search Preview — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 128К токенов. Возможности: доступ к API. Цена: вход $2.5/млн токенов, выход $10/млн токенов. (Официальное описание: GPT-4o Search Previewis a specialized model for web search in Chat Completions.)	OpenAI	$2.50	$10.00	128K	Смотреть →
OpenAI: GPT-5.4 OpenAI: GPT-5.4 — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $2.5/млн токенов, выход $15/млн токенов. (Официальное описание: GPT-5.4 is OpenAI’s latest frontier model, unifying the Codex and GPT lines into a single system.)	OpenAI	$2.50	$15.00	1.1M	Смотреть →
Claude Sonnet 4.6最新 Claude Sonnet обеспечивает оптимальный баланс интеллекта и скорости для высокопроизводительных задач.	Anthropic	$3.00	$15.00	200K	Смотреть →
Magnum v4 72B Magnum v4 72B — ИИ-модель для универсального чата от Anthracite-org, с средняя скорость. Контекстное окно до 16К токенов. Возможности: доступ к API. Цена: вход $3/млн токенов, выход $5/млн токенов. (Официальное описание: This is a series of models designed to replicate the prose quality of the Claude 3 models, specifically Sonnet(https://openrouter.ai/anthropic/claude-3.5-sonnet) and Opus(https://openrouter.ai/anthropic/claude-3-opus).)	Anthracite-org	$3.00	$5.00	16K	Смотреть →
Anthropic: Claude Sonnet 4 Anthropic: Claude Sonnet 4 — ИИ-модель для универсального чата от Anthropic, с средняя скорость. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $3/млн токенов, выход $15/млн токенов. (Официальное описание: Claude Sonnet 4 significantly enhances the capabilities of its predecessor, Sonnet 3.7, excelling in both coding and reasoning tasks with improved precision and controllability.)	Anthropic	$3.00	$15.00	1.0M	Смотреть →
Anthropic: Claude Sonnet 4.5 Anthropic: Claude Sonnet 4.5 — ИИ-модель для универсального чата от Anthropic, с средняя скорость. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $3/млн токенов, выход $15/млн токенов. (Официальное описание: Claude Sonnet 4.5 is Anthropic’s most advanced Sonnet model to date, optimized for real-world agents and coding workflows.)	Anthropic	$3.00	$15.00	1.0M	Смотреть →
OpenAI: GPT-3.5 Turbo 16k OpenAI: GPT-3.5 Turbo 16k — ИИ-модель для универсального чата от OpenAI, с быстрый отклик. Контекстное окно до 16К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $3/млн токенов, выход $4/млн токенов. (Официальное описание: This model offers four times the context length of gpt-3.5-turbo, allowing it to support approximately 20 pages of text in a single request at a higher cost.)	OpenAI	$3.00	$4.00	16K	Смотреть →
Perplexity: Sonar Pro Perplexity: Sonar Pro — ИИ-модель для универсального чата от Perplexity, с средняя скорость. Контекстное окно до 200К токенов. Возможности: анализ изображений, доступ к API. Цена: вход $3/млн токенов, выход $15/млн токенов. (Официальное описание: Note: Sonar Pro pricing includes Perplexity search pricing.)	Perplexity	$3.00	$15.00	200K	Смотреть →
Perplexity: Sonar Pro Search Perplexity: Sonar Pro Search — ИИ-модель для универсального чата от Perplexity, с средняя скорость. Контекстное окно до 200К токенов. Возможности: анализ изображений, доступ к API. Цена: вход $3/млн токенов, выход $15/млн токенов. (Официальное описание: Exclusively available on the OpenRouter API, Sonar Pro's new Pro Search mode is Perplexity's most advanced agentic search system.)	Perplexity	$3.00	$15.00	200K	Смотреть →
Sao10K: Llama 3.1 70B Hanami x1 Sao10K: Llama 3.1 70B Hanami x1 — ИИ-модель для универсального чата от Sao10K, с средняя скорость. Контекстное окно до 16К токенов. Возможности: доступ к API. Цена: вход $3/млн токенов, выход $3/млн токенов. (Официальное описание: This is Sao10K's experiment over Euryale v2.2.)	Sao10K	$3.00	$3.00	16K	Смотреть →
xAI: Grok 3 xAI: Grok 3 — ИИ-модель для универсального чата от xAI, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $3/млн токенов, выход $15/млн токенов. (Официальное описание: Grok 3 is the latest model from xAI.)	xAI	$3.00	$15.00	131K	Смотреть →
xAI: Grok 3 Beta xAI: Grok 3 Beta — ИИ-модель для универсального чата от xAI, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $3/млн токенов, выход $15/млн токенов. (Официальное описание: Grok 3 is the latest model from xAI.)	xAI	$3.00	$15.00	131K	Смотреть →
xAI: Grok 4 xAI: Grok 4 — ИИ-модель для универсального чата от xAI, с средняя скорость. Контекстное окно до 256К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $3/млн токенов, выход $15/млн токенов. (Официальное описание: Grok 4 is xAI's latest reasoning model with a 256k context window.)	xAI	$3.00	$15.00	256K	Смотреть →
Anthropic Claude Sonnet Latest Anthropic Claude Sonnet Latest — ИИ-модель для универсального чата от ~anthropic, с средняя скорость. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $3/млн токенов, выход $15/млн токенов. (Официальное описание: This model always redirects to the latest model in the Anthropic Claude Sonnet family.)	~anthropic	$3.00	$15.00	1.0M	Смотреть →
AionLabs: Aion-1.0 AionLabs: Aion-1.0 — ИИ-модель для универсального чата от Aion-labs, с средняя скорость. Контекстное окно до 131К токенов. Возможности: доступ к API. Цена: вход $4/млн токенов, выход $8/млн токенов. (Официальное описание: Aion-1.0 is a multi-model system designed for high performance across various tasks, including reasoning and coding.)	Aion-labs	$4.00	$8.00	131K	Смотреть →
Anthropic: Claude Opus 4.5 Anthropic: Claude Opus 4.5 — ИИ-модель для универсального чата от Anthropic, с медленная, но мощная обработка. Контекстное окно до 200К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $5/млн токенов, выход $25/млн токенов. (Официальное описание: Claude Opus 4.5 is Anthropic’s frontier reasoning model optimized for complex software engineering, agentic workflows, and long-horizon computer use.)	Anthropic	$5.00	$25.00	200K	Смотреть →
Anthropic: Claude Opus 4.6 Anthropic: Claude Opus 4.6 — ИИ-модель для универсального чата от Anthropic, с медленная, но мощная обработка. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $5/млн токенов, выход $25/млн токенов. (Официальное описание: Opus 4.6 is Anthropic’s strongest model for coding and long-running professional tasks.)	Anthropic	$5.00	$25.00	1.0M	Смотреть →
OpenAI: GPT Chat Latest OpenAI: GPT Chat Latest — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 400К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $5/млн токенов, выход $30/млн токенов. (Официальное описание: GPT Chat Latest points to OpenAI's stable API alias `chat-latest` that always resolves to the latest Instant chat model used in ChatGPT.)	OpenAI	$5.00	$30.00	400K	Смотреть →
OpenAI: GPT-4o (2024-05-13) OpenAI: GPT-4o (2024-05-13) — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 128К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $5/млн токенов, выход $15/млн токенов. (Официальное описание: GPT-4o ("o" for "omni") is OpenAI's latest AI model, supporting both text and image inputs with text outputs.)	OpenAI	$5.00	$15.00	128K	Смотреть →
OpenAI: GPT-5.5 OpenAI: GPT-5.5 — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $5/млн токенов, выход $30/млн токенов. (Официальное описание: GPT-5.5 is OpenAI’s frontier model designed for complex professional workloads, building on GPT-5.4 with stronger reasoning, higher reliability, and improved token efficiency on hard tasks.)	OpenAI	$5.00	$30.00	1.1M	Смотреть →
Anthropic: Claude Opus Latest Anthropic: Claude Opus Latest — ИИ-модель для универсального чата от ~anthropic, с медленная, но мощная обработка. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $5/млн токенов, выход $25/млн токенов. (Официальное описание: This model always redirects to the latest model in the Claude Opus family.)	~anthropic	$5.00	$25.00	1.0M	Смотреть →
OpenAI GPT Latest OpenAI GPT Latest — ИИ-модель для универсального чата от ~openai, с средняя скорость. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $5/млн токенов, выход $30/млн токенов. (Официальное описание: This model always redirects to the latest model in the OpenAI GPT family.)	~openai	$5.00	$30.00	1.1M	Смотреть →
OpenAI: GPT-4 Turbo OpenAI: GPT-4 Turbo — ИИ-модель для универсального чата от OpenAI, с быстрый отклик. Контекстное окно до 128К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $10/млн токенов, выход $30/млн токенов. (Официальное описание: The latest GPT-4 Turbo model with vision capabilities.)	OpenAI	$10.00	$30.00	128K	Смотреть →
OpenAI: GPT-4 Turbo (older v1106) OpenAI: GPT-4 Turbo (older v1106) — ИИ-модель для универсального чата от OpenAI, с быстрый отклик. Контекстное окно до 128К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $10/млн токенов, выход $30/млн токенов. (Официальное описание: The latest GPT-4 Turbo model with vision capabilities.)	OpenAI	$10.00	$30.00	128K	Смотреть →
OpenAI: GPT-4 Turbo Preview OpenAI: GPT-4 Turbo Preview — ИИ-модель для универсального чата от OpenAI, с быстрый отклик. Контекстное окно до 128К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $10/млн токенов, выход $30/млн токенов. (Официальное описание: The preview GPT-4 model with improved instruction following, JSON mode, reproducible outputs, parallel function calling, and more.)	OpenAI	$10.00	$30.00	128K	Смотреть →
Anthropic: Claude Opus 4 Anthropic: Claude Opus 4 — ИИ-модель для универсального чата от Anthropic, с медленная, но мощная обработка. Контекстное окно до 200К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $15/млн токенов, выход $75/млн токенов. (Официальное описание: Claude Opus 4 is benchmarked as the world’s best coding model, at time of release, bringing sustained performance on complex, long-running tasks and agent workflows.)	Anthropic	$15.00	$75.00	200K	Смотреть →
Anthropic: Claude Opus 4.1 Anthropic: Claude Opus 4.1 — ИИ-модель для универсального чата от Anthropic, с медленная, но мощная обработка. Контекстное окно до 200К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $15/млн токенов, выход $75/млн токенов. (Официальное описание: Claude Opus 4.1 is an updated version of Anthropic’s flagship model, offering improved performance in coding, reasoning, and agentic tasks.)	Anthropic	$15.00	$75.00	200K	Смотреть →
OpenAI: GPT-5 Pro OpenAI: GPT-5 Pro — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 400К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $15/млн токенов, выход $120/млн токенов. (Официальное описание: GPT-5 Pro is OpenAI’s most advanced model, offering major improvements in reasoning, code quality, and user experience.)	OpenAI	$15.00	$120.00	400K	Смотреть →
OpenAI: GPT-5.2 Pro OpenAI: GPT-5.2 Pro — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 400К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $21/млн токенов, выход $168/млн токенов. (Официальное описание: GPT-5.2 Pro is OpenAI’s most advanced model, offering major improvements in agentic coding and long context performance over GPT-5 Pro.)	OpenAI	$21.00	$168.00	400K	Смотреть →
Anthropic: Claude Opus 4.6 (Fast) Anthropic: Claude Opus 4.6 (Fast) — ИИ-модель для универсального чата от Anthropic, с быстрый отклик. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $30/млн токенов, выход $150/млн токенов. (Официальное описание: Fast-mode variant of Opus 4.6 - identical capabilities with higher output speed at premium 6x pricing.)	Anthropic	$30.00	$150.00	1.0M	Смотреть →
OpenAI: GPT-4 OpenAI: GPT-4 — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 8К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $30/млн токенов, выход $60/млн токенов. (Официальное описание: OpenAI's flagship model, GPT-4 is a large-scale multimodal language model capable of solving difficult problems with greater accuracy than previous models due to its broader general knowledge and advanced reasoning)	OpenAI	$30.00	$60.00	8K	Смотреть →
OpenAI: GPT-4 (older v0314) OpenAI: GPT-4 (older v0314) — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 8К токенов. Возможности: использование инструментов, доступ к API. Цена: вход $30/млн токенов, выход $60/млн токенов. (Официальное описание: GPT-4-0314 is the first version of GPT-4 released, with a context length of 8,192 tokens, and was supported until June 14.)	OpenAI	$30.00	$60.00	8K	Смотреть →
OpenAI: GPT-5.4 Pro OpenAI: GPT-5.4 Pro — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $30/млн токенов, выход $180/млн токенов. (Официальное описание: GPT-5.4 Pro is OpenAI's most advanced model, building on GPT-5.4's unified architecture with enhanced reasoning capabilities for complex, high-stakes tasks.)	OpenAI	$30.00	$180.00	1.1M	Смотреть →
OpenAI: GPT-5.5 Pro OpenAI: GPT-5.5 Pro — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 1М токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: вход $30/млн токенов, выход $180/млн токенов. (Официальное описание: GPT-5.5 Pro is OpenAI’s high-capability model optimized for deep reasoning and accuracy on complex, high-stakes workloads.)	OpenAI	$30.00	$180.00	1.1M	Смотреть →
Qwen: Qwen3 Next 80B A3B Instruct (free) Qwen: Qwen3 Next 80B A3B Instruct (free) — ИИ-модель для универсального чата от Alibaba, с средняя скорость. Контекстное окно до 262К токенов. Возможности: использование инструментов, доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: Qwen3-Next-80B-A3B-Instruct is an instruction-tuned chat model in the Qwen3-Next series optimized for fast, stable responses without “thinking” traces.)	Alibaba	Без токенной тарификации	—	262K	Смотреть →
Baidu Qianfan: CoBuddy (free) Baidu Qianfan: CoBuddy (free) — ИИ-модель для универсального чата от Baidu, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: CoBuddy is a code generation model from Baidu, optimized for coding tasks and AI Agent workflows.)	Baidu	Без токенной тарификации	—	131K	Смотреть →
Baidu: Qianfan-OCR-Fast (free) Baidu: Qianfan-OCR-Fast (free) — ИИ-модель для универсального чата от Baidu, с быстрый отклик. Контекстное окно до 66К токенов. Возможности: анализ изображений, доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: Qianfan-OCR-Fast is a domain-specific multimodal large model purpose-built for OCR.)	Baidu	Без токенной тарификации	—	66K	Смотреть →
Venice: Uncensored (free) Venice: Uncensored (free) — ИИ-модель для универсального чата от Cognitive Computations, с средняя скорость. Контекстное окно до 33К токенов. Возможности: доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: Venice Uncensored Dolphin Mistral 24B Venice Edition is a fine-tuned variant of Mistral-Small-24B-Instruct-2501, developed by dphn.ai in collaboration with Venice.ai.)	Cognitive Computations	Без токенной тарификации	—	33K	Смотреть →
Google: Gemma 4 26B A4B (free) Google: Gemma 4 26B A4B (free) — ИИ-модель для универсального чата от Google, с средняя скорость. Контекстное окно до 262К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: Gemma 4 26B A4B IT is an instruction-tuned Mixture-of-Experts (MoE) model from Google DeepMind.)	Google	Без токенной тарификации	—	262K	Смотреть →
Google: Gemma 4 31B (free) Google: Gemma 4 31B (free) — ИИ-модель для универсального чата от Google, с средняя скорость. Контекстное окно до 262К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: Gemma 4 31B Instruct is Google DeepMind's 30.7B dense multimodal model supporting text and image input with text output.)	Google	Без токенной тарификации	—	262K	Смотреть →
Google: Lyria 3 Clip Preview Google: Lyria 3 Clip Preview — ИИ-модель для универсального чата от Google, с средняя скорость. Контекстное окно до 1М токенов. Возможности: анализ изображений, доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: 30 second duration clips are priced at $0.04 per clip.)	Google	Без токенной тарификации	—	1.0M	Смотреть →
Google: Lyria 3 Pro Preview Google: Lyria 3 Pro Preview — ИИ-модель для универсального чата от Google, с средняя скорость. Контекстное окно до 1М токенов. Возможности: анализ изображений, доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: Full-length songs are priced at $0.08 per song.)	Google	Без токенной тарификации	—	1.0M	Смотреть →
inclusionAI: Ring-2.6-1T (free) inclusionAI: Ring-2.6-1T (free) — ИИ-модель для универсального чата от Inclusionai, с средняя скорость. Контекстное окно до 262К токенов. Возможности: использование инструментов, доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: Ring-2.6-1T is a 1T-parameter-scale thinking model with 63B active parameters, built for real-world agent workflows that require both strong capability and operational efficiency.)	Inclusionai	Без токенной тарификации	—	262K	Смотреть →
LiquidAI: LFM2.5-1.2B-Instruct (free) LiquidAI: LFM2.5-1.2B-Instruct (free) — ИИ-модель для универсального чата от Liquid AI, с средняя скорость. Контекстное окно до 33К токенов. Возможности: доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: LFM2.5-1.2B-Instruct is a compact, high-performance instruction-tuned model built for fast on-device AI.)	Liquid AI	Без токенной тарификации	—	33K	Смотреть →
Meta: Llama 3.2 3B Instruct (free) Meta: Llama 3.2 3B Instruct (free) — ИИ-модель для универсального чата от Meta, с средняя скорость. Контекстное окно до 131К токенов. Возможности: доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: Llama 3.2 3B is a 3-billion-parameter multilingual large language model, optimized for advanced natural language processing tasks like dialogue generation, reasoning, and summarization.)	Meta	Без токенной тарификации	—	131K	Смотреть →
Meta: Llama 3.3 70B Instruct (free) Meta: Llama 3.3 70B Instruct (free) — ИИ-модель для универсального чата от Meta, с средняя скорость. Контекстное окно до 66К токенов. Возможности: использование инструментов, доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: The Meta Llama 3.3 multilingual large language model (LLM) is a pretrained and instruction tuned generative model in 70B (text in/text out).)	Meta	Без токенной тарификации	—	66K	Смотреть →
MiniMax: MiniMax M2.5 (free) MiniMax: MiniMax M2.5 (free) — ИИ-модель для универсального чата от MiniMax, с быстрый отклик. Контекстное окно до 197К токенов. Возможности: использование инструментов, доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: MiniMax-M2.5 is a SOTA large language model designed for real-world productivity.)	MiniMax	Без токенной тарификации	—	197K	Смотреть →
NVIDIA: Nemotron 3 Nano 30B A3B (free) NVIDIA: Nemotron 3 Nano 30B A3B (free) — ИИ-модель для универсального чата от NVIDIA, с быстрый отклик. Контекстное окно до 256К токенов. Возможности: использование инструментов, доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: NVIDIA Nemotron 3 Nano 30B A3B is a small language MoE model with highest compute efficiency and accuracy for developers to build specialized agentic AI systems.)	NVIDIA	Без токенной тарификации	—	256K	Смотреть →
NVIDIA: Nemotron 3 Nano Omni (free) NVIDIA: Nemotron 3 Nano Omni (free) — ИИ-модель для универсального чата от NVIDIA, с быстрый отклик. Контекстное окно до 256К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: NVIDIA Nemotron™ 3 Nano Omni is a 30B-A3B open multimodal model designed to function as a perception and context sub-agent in enterprise agent systems.)	NVIDIA	Без токенной тарификации	—	256K	Смотреть →
NVIDIA: Nemotron 3 Super (free) NVIDIA: Nemotron 3 Super (free) — ИИ-модель для универсального чата от NVIDIA, с средняя скорость. Контекстное окно до 262К токенов. Возможности: использование инструментов, доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: NVIDIA Nemotron 3 Super is a 120B-parameter open hybrid MoE model, activating just 12B parameters for maximum compute efficiency and accuracy in complex multi-agent applications.)	NVIDIA	Без токенной тарификации	—	262K	Смотреть →
NVIDIA: Nemotron Nano 12B 2 VL (free) NVIDIA: Nemotron Nano 12B 2 VL (free) — ИИ-модель для универсального чата от NVIDIA, с быстрый отклик. Контекстное окно до 128К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: NVIDIA Nemotron Nano 2 VL is a 12-billion-parameter open multimodal reasoning model designed for video understanding and document intelligence.)	NVIDIA	Без токенной тарификации	—	128K	Смотреть →
NVIDIA: Nemotron Nano 9B V2 (free) NVIDIA: Nemotron Nano 9B V2 (free) — ИИ-модель для универсального чата от NVIDIA, с быстрый отклик. Контекстное окно до 128К токенов. Возможности: использование инструментов, доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: NVIDIA-Nemotron-Nano-9B-v2 is a large language model (LLM) trained from scratch by NVIDIA, and designed as a unified model for both reasoning and non-reasoning tasks.)	NVIDIA	Без токенной тарификации	—	128K	Смотреть →
Nous: Hermes 3 405B Instruct (free) Nous: Hermes 3 405B Instruct (free) — ИИ-модель для универсального чата от Nous Research, с средняя скорость. Контекстное окно до 131К токенов. Возможности: доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: Hermes 3 is a generalist language model with many improvements over Hermes 2, including advanced agentic capabilities, much better roleplaying, reasoning, multi-turn conversation, long context coherence, and improvements across the)	Nous Research	Без токенной тарификации	—	131K	Смотреть →
OpenAI: gpt-oss-120b (free) OpenAI: gpt-oss-120b (free) — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: gpt-oss-120b is an open-weight, 117B-parameter Mixture-of-Experts (MoE) language model from OpenAI designed for high-reasoning, agentic, and general-purpose production use cases.)	OpenAI	Без токенной тарификации	—	131K	Смотреть →
OpenAI: gpt-oss-20b (free) OpenAI: gpt-oss-20b (free) — ИИ-модель для универсального чата от OpenAI, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: gpt-oss-20b is an open-weight 21B parameter model released by OpenAI under the Apache 2.0 license.)	OpenAI	Без токенной тарификации	—	131K	Смотреть →
Free Models Router Free Models Router — ИИ-модель для универсального чата от Openrouter, с средняя скорость. Контекстное окно до 200К токенов. Возможности: анализ изображений, использование инструментов, доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: The simplest way to get free inference.)	Openrouter	Без токенной тарификации	—	200K	Смотреть →
Owl Alpha Owl Alpha — ИИ-модель для универсального чата от Openrouter, с средняя скорость. Контекстное окно до 1М токенов. Возможности: использование инструментов, доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: Owl Alpha is a high-performance foundation model designed for agentic workloads.)	Openrouter	Без токенной тарификации	—	1.0M	Смотреть →
Poolside: Laguna M.1 (free) Poolside: Laguna M.1 (free) — ИИ-модель для универсального чата от Poolside, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: Laguna M.1 is the flagship coding agent model from Poolside, optimized for complex software engineering tasks.)	Poolside	Без токенной тарификации	—	131K	Смотреть →
Poolside: Laguna XS.2 (free) Poolside: Laguna XS.2 (free) — ИИ-модель для универсального чата от Poolside, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: Laguna XS.2 is the second-generation model in the XS size class from Poolside, their efficient coding agent series.)	Poolside	Без токенной тарификации	—	131K	Смотреть →
Z.ai: GLM 4.5 Air (free) Z.ai: GLM 4.5 Air (free) — ИИ-модель для универсального чата от Z-ai, с средняя скорость. Контекстное окно до 131К токенов. Возможности: использование инструментов, доступ к API. Цена: бесплатно через OpenRouter. (Официальное описание: GLM-4.5-Air is the lightweight variant of our latest flagship model family, also purpose-built for agent-centric applications.)	Z-ai	Без токенной тарификации	—	131K	Смотреть →

💻Модели для кода →🧠Модели рассуждений →🖼️Генерация изображений →🎬Генерация видео →