OpenAI o1 — принципиально новый класс языковых моделей, представленный OpenAI в сентябре 2024 года. В отличие от GPT-4o, которая генерирует ответ сразу, o1 сначала «думает» — выстраивает цепочку рассуждений (chain-of-thought) перед тем, как дать финальный ответ. Это позволяет модели решать задачи, недоступные для обычных LLM: олимпиадную математику, сложное программирование и научные задачи.
Характеристики o1 и o1-mini
| Параметр | o1 | o1-mini | GPT-4o (для сравнения) |
|---|---|---|---|
| Контекст | 200 000 | 128 000 | 128 000 |
| Input ($/1M) | $15.00 | $3.00 | $2.50 |
| Output ($/1M) | $60.00 | $12.00 | $10.00 |
| Reasoning tokens | Да (скрытые) | Да (скрытые) | Нет |
| AIME 2024 | 83.3% | 70.0% | 13.4% |
| Codeforces | 89-й перцентиль | 86-й перцентиль | 11-й перцентиль |
Обратите внимание на стоимость: o1 значительно дороже GPT-4o. Модель генерирует «скрытые» reasoning-токены, за которые тоже нужно платить. Однако для задач, требующих глубокого рассуждения, o1 даёт качественно иной результат.
Как работает глубокое рассуждение
Когда вы отправляете запрос к o1, модель выполняет многоэтапный процесс:
- Анализ задачи — модель определяет тип задачи и выбирает стратегию решения
- Декомпозиция — сложная задача разбивается на подзадачи
- Последовательное решение — каждая подзадача решается по шагам
- Проверка — модель проверяет промежуточные результаты и исправляет ошибки
- Формирование ответа — финальный ответ компилируется из результатов рассуждения
Этот процесс генерирует reasoning-токены, которые не отображаются в ответе, но оплачиваются. На сложных задачах модель может «думать» тысячи токенов перед ответом.
Подключение o1 через ModelSwitch
from openai import OpenAI
client = OpenAI(
base_url="https://api.modelswitch.ru/v1",
api_key="msk_ваш_ключ"
)
# o1-mini — для математики и программирования
response = client.chat.completions.create(
model="openai/o1-mini",
messages=[
{"role": "user", "content": """Напиши алгоритм на Python для поиска всех простых чисел до N,
используя решето Эратосфена. Оптимизируй по памяти, используя bitarray.
Проведи анализ сложности по времени и памяти."""}
]
# Внимание: o1 не поддерживает system message и temperature
)
print(response.choices[0].message.content)
Важные отличия API o1 от GPT-4o: модели o1 не поддерживают параметр system в messages, не поддерживают temperature (всегда 1), не поддерживают streaming, и время ответа может составлять 10-60 секунд из-за фазы рассуждения.
Когда использовать o1 vs GPT-4o
Используйте o1 для задач, где GPT-4o ошибается:
- Олимпиадная математика и физика
- Сложные алгоритмические задачи (Codeforces, LeetCode Hard)
- Многоэтапные рассуждения с логическими зависимостями
- Планирование сложных систем с учётом множества ограничений
Используйте GPT-4o для всего остального — модель быстрее, дешевле и поддерживает streaming.
Заключение
OpenAI o1 — это не замена GPT-4o, а новый инструмент для задач, требующих глубокого рассуждения. Используйте o1 для сложных задач, GPT-4o — для типовых, и GPT-4o-mini — для массовых. Все три модели доступны через единый API на modelswitch.ru.