deepseek-v3.1

chat

Провайдер: Deepseek

Контекст: 128000 tokens

Цена входа

44 ₽

за 1M токенов

Цена выхода

132 ₽

за 1M токенов

DeepSeek V3.1 — гибридная reasoning‑модель 2025 для кода, агентов и длинного контекста

DeepSeek V3.1 — флагманское обновление линейки DeepSeek, объединяющее два режима работы в одной модели: быстрые ответы без «размышлений» и детальные рассуждения с включаемым «thinking mode». Обновление приносит заметный рост в агентных сценариях, ускорение рассуждений, расширение контекста до уровня 128–163K токенов (в зависимости от облачного провайдера), а также корпоративную доступность через крупные платформы ИИ. Модель поставляется как управляемый сервис в Amazon Bedrock и доступна на Google Cloud Vertex AI и в Azure AI Foundry. (aws.amazon.com)

Ключевые преимущества DeepSeek V3.1

Гибридная архитектура рассуждений: одна модель поддерживает «thinking» и «non‑thinking» режимы через шаблон чата, упрощая переключение между быстрыми ответами и детальным пошаговым анализом. На Bedrock режим рассуждений можно включать/выключать в интерфейсе; в Azure и Vertex AI модель прямо позиционируется как гибрид. (aws.amazon.com)
Длинный контекст: расширение окна до 128K токенов (и до 163 840 в Vertex AI), что позволяет обрабатывать большие документы, кодовые базы и длинные диалоги без потери целостности. (infoq.com)
Сильная инженерия под капотом: двухфазное расширение контекста, FP8 UE8M0 для эффективности и Mixture‑of‑Experts со 671B общих параметров и ≈37B активных на токен. Это сочетает выразительность «большой» модели с ценой инференса среднего класса. (infoq.com)
Агентные возможности и tool‑calling: пост‑обучение усилило работу с инструментами и сценарии агентов; доступна строгая схема function calling (strict mode) в API. (ai.azure.com)
Доступность в облаках: управляемая модель в Amazon Bedrock (сентябрь 18, 2025), GA‑запуск на Vertex AI (август 28, 2025), каталог Azure AI Foundry — единый путь внедрения в корпоративные пайплайны. (aws.amazon.com)
Прозрачное ценообразование в официальном API: унифицированные тарифы для чата и «reasoner», кэш‑хиты ещё дешевле; отмена «ночных» скидок с сентября 2025 упрощает планирование затрат. (api-docs.deepseek.com)

Подтверждённые метрики, контекст и инженерные детали

Контекст и обучение: V3.1 построена поверх V3‑Base и расширена двумя фазами (до 32K на 630B токенов и до 128K на ещё 209B токенов), что обеспечивает устойчивую работу с длинными последовательностями. Применён формат FP8 UE8M0 для веса/активаций. (infoq.com)
Параметры: 671B общих параметров с ≈37B активных на токен (MoE‑архитектура). (infoq.com)
Бенчмарки: улучшения на SWE/Terminal‑Bench и в задачах многошагового поиска; в агрегаторах модель показывает конкурентные результаты по ряду академических метрик и QA‑тестов. (api-docs.deepseek.com)

Что нового вокруг DeepSeek V3.1 (экосистема и дистрибуция)

Amazon Bedrock: полностью управляемая модель с «переключателем рассуждений», доступна в регионах США (Oregon), Европа (Лондон, Стокгольм) и Азия (Токио, Мумбаи). Поддерживаются InvokeModel и Converse API. (aws.amazon.com)
Google Cloud Vertex AI: deepseek-v3.1-maas в статусе GA (релиз 28 августа 2025), контекст до 163 840 токенов, поддержка структурированного вывода и function calling. (cloud.google.com)
Azure AI Foundry: карточка модели с упором на гибридный «thinking», повышенную эффективность рассуждений и улучшенный tool‑calling. (ai.azure.com)
NVIDIA NIM: страница справки отмечает глобальную доступность и типовые сценарии — от анализа длинных документов до агентных приложений. (docs.api.nvidia.com)

Сферы применения и готовые сценарии

1) Разработка ПО и DevEx

Длинные рефакторинги и анализ монорепозиториев благодаря большому контексту; гибридный режим ускоряет поиск решений и валидацию. (infoq.com)
Примеры промптов:
«Проанализируй этот стек Python, предложи фикс и напиши тесты pytest; сохрани совместимость по API.»
«Составь план миграции с Jest на Vitest в монорепозитории, укажи риски и стратегии отката.»

2) Агентные сценарии и tool‑augmented рабочие процессы

Улучшенный tool‑calling, строгая валидация схем и поддержка функций позволяют строить надёжных агентов: от код‑агентов до поисковых и интеграционных ботов. (api-docs.deepseek.com)
Примеры промптов:
«Выполни многошаговой поиск по 5 источникам, сведи вывод в JSON по схеме, отметь противоречия и приложи ссылки.»
«Составь PR‑описание на основе diff и автогенерируй чек‑лист ревью.»

3) Аналитика, финансы и документы

Обработка длинных корпоративных отчётов (до 128–163K токенов), построение сводок, сценариев и таблиц рисков; поддержка структурированного вывода облегчает интеграцию с DWH/BI. (cloud.google.com)
Пример промпта:
«Суммаризируй три отчёта (PDF), построй сценарный анализ и выдай JSON со сводными метриками.»

4) Исследования и техписьмо

Многошаговые рассуждения, научный бри́финг, проверка цепочек выводов; переключение «thinking» помогает балансировать цену/скорость/качество. (aws.amazon.com)

5) Поддержка «офиса» и интеграции

Автоматизация подготовки презентаций/документов, заполнение форм и табличных реестров агентом с инструментами; доступность через Bedrock/Vertex/Azure упрощает внедрение в существующие ИТ‑ландшафты. (aws.amazon.com)

Практические советы по внедрению

Включайте/выключайте «thinking» там, где это экономически оправдано: быстрые CRUD‑ответы — без рассуждений; сложные задачи — с «thinking». На Bedrock это отдельный переключатель. (aws.amazon.com)
Экономьте на токенах с кэшем: официальные тарифы различают cache hit/miss; планируйте промпт‑шаблоны и повторное использование контекста. (api-docs.deepseek.com)
Используйте строгий function calling и схемы JSON для надёжных агентов; фиксируйте контракты ответов и валидируйте действия. (api-docs.deepseek.com)
Учитывайте различия провайдеров: на Vertex AI доступен увеличенный лимит контекста (до 163 840), что полезно для «длинных» кейсов; на Bedrock/ Azure проще интеграция с текущими DevOps‑процессами. (cloud.google.com)

Чем DeepSeek V3.1 отличается от DeepSeek V3 и R1

Единая гибридная модель вместо раздельных эндпойнтов: «чат» и «reasoner» конвергируют по функционалу и цене; это упрощает расчёт и архитектуру приложений. (api-docs.deepseek.com)
Длинный контекст (до 128K/163K) против прежних значений; улучшения на SWE/Terminal‑Bench и в задачах сложного поиска. (infoq.com)
Эффективность рассуждений: «V3.1‑Think» достигает качества уровня R1‑0528 при более быстром отклике (по данным карточек/каталогов провайдеров). (ai.azure.com)

Вопросы и ответы (FAQ)

Где модель уже доступна «из коробки»?
Amazon Bedrock (с 18 сентября 2025), Google Cloud Vertex AI (GA с 28 августа 2025) и Azure AI Foundry. Можно также развернуть через NVIDIA NIM. (aws.amazon.com)
Как включать/выключать «thinking mode»?
В Amazon Bedrock режим можно переключать прямо в консоли; в API и у других провайдеров — через шаблон чата/параметры. (aws.amazon.com)
Как устроено ценообразование в официальном API DeepSeek?
С 5 сентября 2025 (16:00 UTC) — унифицированные цены: $0.56 за 1M входных токенов (cache miss), $0.07 (cache hit) и $1.68 за 1M выходных токенов; отменены «ночные» скидки. Уточняйте текущий прайс в документации. (api-docs.deepseek.com)
Можно ли работать с очень длинными документами?
Да. Контекст до 128K токенов (и до 163 840 на Vertex AI) позволяет обрабатывать большие файлы и длинные диалоги. (infoq.com)
Насколько «открыта» модель?
Базовые веса V3.1‑Base опубликованы на Hugging Face; подробности и лицензирование см. в репозиториях и карточках моделей. (api-docs.deepseek.com)

Источники

AWS News Blog: DeepSeek‑V3.1 в Amazon Bedrock; переключение reasoning‑режима и API InvokeModel/Converse, регионы запуска. Обновлено 19 сентября 2025. (aws.amazon.com)
AWS «What’s new»: анонс управляемой модели DeepSeek‑V3.1 (18 сентября 2025). (aws.amazon.com)
Google Cloud Vertex AI: карточка deepseek-v3.1-maas (GA; релиз 28 августа 2025; контекст до 163 840 токенов). Обновлено 24 октября 2025. (cloud.google.com)
Azure AI Foundry Model Catalog: DeepSeek‑V3.1 — гибридный режим, улучшенный tool‑calling и эффективность. (ai.azure.com)
InfoQ: архитектура V3.1 — двухфазное расширение контекста, FP8 UE8M0, 671B total/≈37B active. (infoq.com)
DeepSeek API Docs — Pricing: унифицированные тарифы, cache hit/miss. (api-docs.deepseek.com)
DeepSeek API Docs — News (21 августа 2025): выпуск V3.1, улучшения в SWE/Terminal‑Bench, окончание «ночных» скидок. (api-docs.deepseek.com)
Reuters (21 августа 2025): релиз V3.1, гибридная структура и корректировка цен с 6 сентября 2025. (reuters.com)
NVIDIA NIM Reference: страница модели DeepSeek‑V3.1 — области применения и доступность. (docs.api.nvidia.com)

Примеры кода и API для deepseek-v3.1

Ptolemy нормализует запросы и ответы всех провайдеров для вас.

from openai import OpenAI

client = OpenAI(
    base_url="https://www.ptolemy.ru/api/v1",
    api_key="YOUR_PTOLEMY_API_KEY",
)

completion = client.chat.completions.create(
    model="deepseek-v3.1",
    messages=[
        {
            "role": "user",
            "content": "What is the meaning of life?"
        }
    ]
)

print(completion.choices[0].message.content)

import OpenAI from "openai";

const client = new OpenAI({
    baseURL: "https://www.ptolemy.ru/api/v1",
    apiKey: "YOUR_PTOLEMY_API_KEY",
});

const completion = await client.chat.completions.create({
    model: "deepseek-v3.1",
    messages: [
        {
            role: "user",
            content: "What is the meaning of life?"
        }
    ]
});

console.log(completion.choices[0].message.content);

curl https://www.ptolemy.ru/api/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_PTOLEMY_API_KEY" \
  -d '{
    "model": "deepseek-v3.1",
    "messages": [
      {
        "role": "user",
        "content": "What is the meaning of life?"
      }
    ]
  }'

Готовы использовать deepseek-v3.1?

Начните с получения API ключа

Получить API ключ