# llm
Cursor Composer 2 — собственная модель, которая бьёт Claude Opus 4.6 за десятую часть цены. Но пользователи уже просят вернуть старую версию
Cursor выпустил Composer 2 — первую in-house модель для кодинга, обученную исключительно на коде. Бьёт Claude Opus 4.6 на двух бенчмарках из трёх и стоит в 10-30 раз дешевле. Но архитектуру не раскрывают, а часть разработчиков откатывается на 1.5.
GPT-5.4 mini и nano — mini кодит почти как флагман, nano описывает 76 000 фотографий за $52, а цены выросли втрое
OpenAI выпустила GPT-5.4 mini и nano — маленькие модели, которые на бенчмарках догоняют флагман. Mini набирает 54.4% на SWE-Bench Pro, nano стоит $0.20 за миллион токенов. Но цены выросли в 3-4 раза по сравнению с предшественниками.
1 миллион токенов — и что дальше? Гонка контекстных окон уже не про размер, а про то, что с ним делать
Claude Opus 4.6 получил 1M контекст без наценки, Meta заявляет 10M, Magic.dev — 100M. Но реальная битва уже не за размер окна, а за context engineering — умение набить контекст правильными токенами вместо мусора.
Hindsight — open-source память для AI-агентов, которая учится как человеческий мозг, а не как тупой поиск по векторам
Hindsight — open-source система памяти для AI-агентов от Vectorize.io. Три операции (Retain, Recall, Reflect), четыре стратегии поиска, SOTA на LongMemEval — и всё это через Docker за 60 секунд.
Claude Code v2.1.75 — Opus 4.6 получил 1M контекст по умолчанию, и за это не берут ни цента сверху
Opus 4.6 и Sonnet 4.6 получили 1M контекст как стандарт — без beta-заголовков, без доплат, без конфигурации. Разбираем, что изменилось в Claude Code v2.1.75 и кому это реально пригодится.
Autoresearch — Karpathy выложил фреймворк, где AI-агент ночью гоняет 100 ML-экспериментов на одной GPU
Andrej Karpathy упаковал autoresearch — фреймворк, где AI-агент сам модифицирует код обучения LLM, запускает 5-минутные тренировки и за ночь прогоняет ~100 экспериментов. 4.2K звёзд за два дня.
GPT-5.4 — миллион токенов, computer use быстрее человека и плагины для Excel, которые превращают ChatGPT в офисного работника
GPT-5.4 — первая mainline-модель OpenAI с нативным computer use и контекстом на 1M токенов. На OSWorld обогнала людей, на задачах инвестбанковского аналитика в Excel набирает 87.3%. Разбираем, что это значит для разработчиков.
Gemini 3.1 Flash-Lite — $0.25 за миллион токенов, качество взрослого Flash и 363 токена в секунду
Google выпустила Gemini 3.1 Flash-Lite — самую быструю и дешёвую модель серии Gemini 3. $0.25 за миллион входных токенов, 363 tok/s, quality на уровне 2.5 Flash, thinking levels и мультимодальность. Разбираем, кому стоит мигрировать.
OpenAI WebSocket mode — Responses API переезжает на постоянное соединение, и агенты ускоряются на 40%
OpenAI добавил WebSocket mode в Responses API — постоянное соединение, инкрементальные запросы и до 40% ускорения для агентских цепочек с десятками tool-вызовов.
Кто лучше гуглит: Claude Opus 4.6, GPT-5.3 Codex или Gemini 3.1 Pro
Три топовые модели февраля 2026 — и вопрос, который мучает всех: кто из них лучше ищет информацию в интернете? Разбираем бенчмарки, продукты Deep Research и реальные сценарии.