DeepSeek V3 — языковая модель от китайской компании DeepSeek, которая произвела настоящий фурор в индустрии. Модель с 671 миллиардом параметров (из которых активны 37 млрд благодаря архитектуре Mixture of Experts) показала результаты на уровне GPT-4o при значительно меньшей стоимости обучения и инференса. Через ModelSwitch вы можете подключить DeepSeek V3 API без ограничений и с оплатой в рублях.
Характеристики DeepSeek V3
| Параметр | Значение |
|---|---|
| Параметры (всего) | 671 млрд |
| Активные параметры | 37 млрд (MoE) |
| Контекстное окно | 128 000 токенов |
| Input (за 1M токенов) | $0.27 |
| Output (за 1M токенов) | $1.10 |
| Архитектура | Mixture of Experts (MoE) |
| Лицензия | Open-source (MIT) |
Архитектура Mixture of Experts (MoE) позволяет модели иметь 671 млрд параметров, но активировать только 37 млрд для каждого запроса. Это даёт качество большой модели при скорости и стоимости маленькой.
Подключение DeepSeek V3 через ModelSwitch
Прямой доступ к DeepSeek API может быть нестабильным из-за географических факторов. ModelSwitch обеспечивает надёжный доступ через свою инфраструктуру:
from openai import OpenAI
client = OpenAI(
base_url="https://api.modelswitch.ru/v1",
api_key="msk_ваш_ключ"
)
response = client.chat.completions.create(
model="deepseek/deepseek-chat",
messages=[
{"role": "system", "content": "Ты помощник программиста. Объясняй концепции чётко и с примерами."},
{"role": "user", "content": "Объясни паттерн Observer в Python с примером кода."}
],
temperature=0.5,
max_tokens=2500
)
print(response.choices[0].message.content)
DeepSeek V3 особенно хорошо справляется с задачами программирования и математики. Для задач, требующих глубокого рассуждения, доступна модель DeepSeek-R1:
# DeepSeek-R1 — модель с расширенным рассуждением
response = client.chat.completions.create(
model="deepseek/deepseek-reasoner",
messages=[
{"role": "user", "content": "Реши задачу: в треугольнике ABC угол A = 60°, сторона a = 7, сторона b = 5. Найди сторону c."}
],
max_tokens=3000
)
print(response.choices[0].message.content)
Преимущества DeepSeek V3
- Цена — в 10 раз дешевле GPT-4o ($0.27 vs $2.50 за 1M input токенов)
- Качество — сопоставимо с GPT-4o на большинстве бенчмарков
- Код и математика — одни из лучших результатов на MATH и HumanEval
- Open-source — модель доступна под MIT-лицензией
Заключение
DeepSeek V3 — это прорыв в соотношении цена/качество для LLM. Модель конкурирует с GPT-4o при стоимости в 10 раз ниже. Через ModelSwitch вы получаете стабильный доступ к DeepSeek API с оплатой в рублях. Зарегистрируйтесь на modelswitch.ru и протестируйте DeepSeek V3.