$ grep -r "agents" ./posts/

# agents

claude-code-future-autonomous-coding.md
От 30 секунд до 14 часов — и это не предел. Как Claude Code и новые модели переписывают правила кодинга
> · 8 мин

От 30 секунд до 14 часов — и это не предел. Как Claude Code и новые модели переписывают правила кодинга

4% коммитов на GitHub уже пишет Claude Code. К концу 2026 будет 20%. METR показывает: AI удваивает горизонт задач каждые 4-7 месяцев. Что это значит для разработчиков и что принесёт Claude 5.

ai agents coding anthropic
perplexity-computer-digital-worker.md
Perplexity Computer — 19 моделей, один цифровой работник и $200 в месяц за оркестр, который кодит за тебя
> · 6 мин

Perplexity Computer — 19 моделей, один цифровой работник и $200 в месяц за оркестр, который кодит за тебя

Perplexity запустил Computer — облачного AI-агента, который оркестрирует 19 моделей от Anthropic, Google, OpenAI и xAI. Claude Opus 4.6 дирижирует, субагенты работают параллельно часами. Стоит ли $200 в месяц?

ai agents productivity perplexity
openai-websocket-responses-api.md
OpenAI WebSocket mode — Responses API переезжает на постоянное соединение, и агенты ускоряются на 40%
> · 5 мин

OpenAI WebSocket mode — Responses API переезжает на постоянное соединение, и агенты ускоряются на 40%

OpenAI добавил WebSocket mode в Responses API — постоянное соединение, инкрементальные запросы и до 40% ускорения для агентских цепочек с десятками tool-вызовов.

agents llm api openai
openclaw-personal-ai-assistant.md
OpenClaw — open-source AI-ассистент с 216K звёздами, который живёт в твоих мессенджерах и делает за тебя всё
> · 6 мин

OpenClaw — open-source AI-ассистент с 216K звёздами, который живёт в твоих мессенджерах и делает за тебя всё

OpenClaw — open-source персональный AI-ассистент, который работает локально, подключается к WhatsApp, Telegram, Slack и ещё десятку мессенджеров, и реально выполняет задачи: от разбора почты до деплоя проектов. 216 тысяч звёзд на GitHub и создатель, которого забрал себе OpenAI.

ai agents open-source assistant
skillsbench-agent-skills.md
SkillsBench — первый бенчмарк, где тестируют не модели, а скиллы для AI-агентов
> · 5 мин

SkillsBench — первый бенчмарк, где тестируют не модели, а скиллы для AI-агентов

SkillsBench — бенчмарк из 84 задач в 11 доменах. Skills поднимают pass rate на 16.2%, но самогенерация не работает. Haiku со скиллами бьёт Opus без них.

ai agents llm benchmark
superpowers-claude-code-skills.md
Superpowers — фреймворк, который превращает Claude Code в синьора с дисциплиной
> · 5 мин

Superpowers — фреймворк, который превращает Claude Code в синьора с дисциплиной

Superpowers — open-source фреймворк из 15+ скиллов для Claude Code: TDD, планирование, дебаг, параллельные субагенты. 56K звёзд на GitHub.

ai agents open-source claude-code
opus-codex-gemini-coding-workflow.md
Opus vs Codex vs Gemini — три AI-модели, один workflow, ноль хаоса
> · 6 мин

Opus vs Codex vs Gemini — три AI-модели, один workflow, ноль хаоса

Claude Opus 4.6 и GPT-5.3 Codex вышли в один день и оказались не конкурентами, а напарниками. Разбираю, как строить workflow из трёх моделей — с Gemini 3.1 Pro в комплекте.

ai agents llm gemini
cursor-25-marketplace-composer-agents.md
Cursor 2.5 — маркетплейс плагинов, собственный LLM и агенты, которые кодят двое суток без перерыва
> · 6 мин

Cursor 2.5 — маркетплейс плагинов, собственный LLM и агенты, которые кодят двое суток без перерыва

Cursor выпустил версию 2.5 с маркетплейсом плагинов (Figma, Stripe, AWS), собственной моделью Composer 1.5 с RL×20 и long-running агентами, которые автономно работают до 52 часов.

ai cursor ide coding-assistant
qwen-35-visual-agents-moe.md
Qwen 3.5 — 397 миллиардов параметров, 17 активных, и визуальный агент, который сам кликает кнопки
> · 5 мин

Qwen 3.5 — 397 миллиардов параметров, 17 активных, и визуальный агент, который сам кликает кнопки

Qwen 3.5: 397B параметров, 17B активных, визуальные агенты, 201 язык, Apache 2.0. В 12 раз дешевле Claude Opus. Обзор, бенчмарки, как запустить.

ai agents llm open-source
gpt-53-codex-spark.md
GPT-5.3-Codex — первый кодинг-агент, которым можно рулить на лету
> · 6 мин

GPT-5.3-Codex — первый кодинг-агент, которым можно рулить на лету

OpenAI объединили мощь GPT-5.2-Codex и reasoning GPT-5.2 в одном агенте: steering в реальном времени, 77.3% Terminal-Bench, а Codex-Spark на Cerebras выдаёт 1000 tok/s. API пока нет — но CLI и IDE уже работают.

ai agents llm coding