Эпоха ИИ-агентов уже близко. Как не стать в ней аутсайдером
ИИ-агенты перестанут работать в одиночку. Они станут командой, где каждая модель выполняет свою задачу, а вместе они решают сложные задачи. Что стоит на пути этого будущего и как не стать в нем аутсайдером, рассказывает Владислав Балаев, эксперт ЛАНИТ
Изображение взято с сайта freepik.com
Почему ИИ-проекты не окупаются
Согласно исследованию Массачусетского технологического института (MIT) за 2025 год, до 95% пилотных проектов с генеративным ИИ в бизнесе не обеспечивают ощутимой финансовой выгоды. Ключевые причины, которые мешают массовому внедрению нейротехнологий в компаниях:
- статичность решений: ИИ-системы слабо адаптируются к изменениям рынка и внутренних процессов компаний;
- высокие издержки: самостоятельная разработка ИИ-моделей экономически невыгодна, компаниям приходится покупать готовые решения, которые также стоят немало;
- проблемы с масштабированием: полноценное внедрение требует организационных изменений, к которым компании часто не готовы.
Однако игнорировать ИИ невозможно. И сейчас лучшее время задуматься о том, как грамотно вписаться в новую ИИ-реальность.
Чего ждать от ИИ в 2026 году
Gartner предсказывает, что роль ИИ в бизнес-инфраструктуре будет расти. Среди ключевых тенденций на 2026 год:
• развитие ИИ-native-платформ, где разработка строится на совместной работе человека и ИИ;
• распространение суперкомпьютеров с аппаратным ускорением для сложных задач машинного обучения — например, для распознавания лиц, анализа речи;
• рост значимости конфиденциальных вычислений, чтобы посторонние не могли увидеть приватные данные во время их обработки;
• повышение роли доменных языковых моделей — ИИ-систем, обученных решать задачи в определенной области (например, медицина, финансы или юриспруденция);
• появление физического ИИ — роботов и устройств, действующих в реальном мире (примеры: беспилотные авто, бытовые, медицинские и промышленные роботы);
• продвижение упреждающих ИИ-решений для кибербезопасности, которые умеют заранее предсказывать атаки хакеров и защищать от них компьютеры и сети.
Стратегии выживания и успеха в ИИ-мире
Совсем скоро мы увидим формирование экосистем агентов, где специализированные ИИ-модели (для аналитики, клиентского сервиса, логистики) взаимодействуют между собой. Компаниям придется пересмотреть бизнес-стратегии, опираясь на следующие тенденции:
• разработка с ИИ становится стандартом — специалисты, не освоившие еe, теряют конкурентоспособность на рынке;
• аппаратное ускорение выходит на новый уровень — компании вроде Groq, Cerebras и Etched предлагают энергоэффективные чипы для повышения производительности больших языковых моделей (LLM);
• мультиагентные системы — однозначный тренд и наиболее перспективное направление, которое при этом требует адаптации для корпоративного использования;
• протокол MCP (Model Context Protocol — протокол контекста модели) — позволяет легко подключать к LLM различные инструменты.
Технологические прорывы ближайшего будущего
Мы все ближе к "агентскому" будущему, но на пути еще много сложностей. На этом фоне появляются новые технологические решения.
DeepSeek OCR: визуальная компрессия контекста
Одна из ключевых сложностей — ограничение на количество токенов (единиц текста), которые модель может обработать за один раз. Модели не запоминают детали длинного разговора. В отдельных случаях это критично — например, если агент перепутал номер карты при переводе денег.
DeepSeek уже представила революционный подход к управлению длинными диалогами через визуальное сжатие. Вместо традиционной токенизации система преобразует данные в компактные визуальные "схемы". Это позволяет сохранить смысл и структуру информации при резком снижении объема данных.
DeepSeek OCR может также работать с формулами, таблицами и диаграммами. На тестах производительности достигает точности до 97% при десяти-двадцатикратной компрессии.
Заметный тренд — развитие визуально-языковых моделей. Такие модели могут анализировать сложные документы и многостраничные отчеты с точностью, ранее недоступной. Решения вроде DeepSeek OCR, dots.ocr и paddleocr-vl могут стать базовым элементом корпоративных ИИ-систем — подобно тому, как OCR (оптическое распознавание символов) когда-то стало частью цифровизации. Этот технологический прорыв позволит:
• значительно снизить использование токенов за счет оптимизации (например, исключения пустых областей в таблицах);
• сохранять структурную целостность документов;
• автоматизировать рутинные задачи ввода данных.
Хочется надеяться, что скоро специалистам больше не придется вручную перебивать значения из документов, заполняя карточку в какой-нибудь системе. Правда, возникнут новые вопросы — как проверять точность значений и как перестроить свое восприятие. Мы уже смирились с тем, что человек может ошибиться. Теперь придется принять, что ИИ тоже ошибается.
Cache-to-Cache: "телепатия" для искусственного интеллекта
ИИ-системы общаются друг с другом так же, как люди в чатах, — путем генерации и чтения текста. Это медленно и неэффективно. Технология Cache-to-Cache, разработанная исследователями Университета Цинхуа, позволяет моделям обмениваться своими выводами напрямую, без текстового посредника.
Представьте, что вместо долгого объяснения сложной идеи коллеге вы можете просто передать ему свое понимание — именно так работает новая технология. Ее ключевой элемент — Projection Module (проекционный модуль), который преобразует внутренние представления одной модели в понятный формат для другой.
Прямой обмен представлениями между ИИ-моделями — шаг к созданию эффективных мультиагентных систем. Особенно перспективно сочетание такого обмена с визуальными моделями (работающими с изображениями и текстом) типа DeepSeek OCR.
В перспективе могут появиться платформы, где десятки "цифровых сотрудников" будут слаженно решать сквозные бизнес-задачи, от обработки сложного клиентского запроса до управления цепочками поставок в реальном времени.
Экономия на излишней вежливости
ИИ-системы часто тратят ресурсы на генерацию вежливых фраз вроде "пожалуйста" и "спасибо", что увеличивает стоимость их эксплуатации.
Исследователи из IT-компании JFrog разработали методику раннего обнаружения шаблонных ответов (boilerplate responses) больших языковых моделей после генерации всего одного токена. Она помогает с точностью 99,8% определить, когда ответ становится несодержательным.
Это позволяет:
• прерывать ненужные ответы,
• переключать простые задачи на более дешевые модели,
• экономить до 30% на эксплуатационных расходах.
Революция в браузерных технологиях
На наших глазах разворачивается одна из главных технологических битв десятилетия — битва за браузер будущего.
Крупнейшие игроки, включая Google и "Яндекс", понимают, что новый этап веб-взаимодействия будет не человекоцентричным, а агентоцентричным. То есть браузер перестанет быть окном в интернет для человека и станет рабочей средой для ИИ-агента.
Ключевые разработки:
• OpenAI представила ChatGPT Atlas — браузер со встроенным ИИ-ассистентом, способный самостоятельно выполнять задачи на посещаемых страницах.
• Perplexity запустил Comet — браузер для исследовательских задач с поддержкой различных языковых моделей.
• Google Gemini интегрирует Gemini в браузер Chrome, предлагая AI Mode для контекстуального поиска и Gemini Live для голосового взаимодействия.
• "Яндекс" представил браузер с "ИИ-Алисой".
Все это не просто новые функции браузеров, а смена парадигмы взаимодействия с цифровым пространством, где ИИ становится активным участником, а не инструментом.
Для компаний критически важным становится переход от SEO (оптимизации для поисковых систем) к GEO (оптимизации для генеративных ИИ).
Рост объема ИИ-контента и ужесточение правил
Согласно исследованию аналитической платформы Graphite, человечество достигло переломного момента: количество статей, созданных искусственным интеллектом, уже превысило объем человеческого контента.
На эти вызовы активно реагирует научное сообщество. Платформа arXiv (крупнейший архив научных статей) вводит новые требования для работ по компьютерным наукам — теперь работы будут приниматься только в том случае, если они были предварительно рецензированы и приняты академическим журналом или конференцией.
Мы вступаем в эпоху, когда:
• поиск информации будет осуществляться преимущественно через ИИ-агентов, способных быстро анализировать огромные объемы данных;
• создание контента сместится в сторону максимальной сжатости и информационной плотности;
• дедупликация (исключение дублирующей информации) станет критически важным навыком.
Нас ждет переизобретение систем верификации информации. Как в свое время появился антиплагиат, теперь понадобятся инструменты для автоматизированного рецензирования и оценки качества ИИ-контента. В будущем важнее будет не авторитет источника, а возможность доказать достоверность данных. Бизнесу уже сейчас стоит создавать системы, которые умеют это делать.
Вывод: эпоха экспериментов с искусственным интеллектом закончилась. На смену разрозненным пилотам приходит стратегия построения целостной ИИ-инфраструктуры. Платформенный подход, оптимизированные агенты и готовые решения становятся основой реальной окупаемости и конкурентных преимуществ. Выиграют не компании с самым "продвинутым" ИИ, а те, кто выстраивает целостную ИИ-инфраструктуру. Простые шаги, которые помогут бизнесу подготовиться к эпохе агентов:
• фокусироваться на интеграции ИИ в ежедневные процессы, а не гнаться за самыми мощными алгоритмами;
• постепенно внедрять простую автоматизацию повседневных задач;
• переходить на единые платформы для работы с разными моделями.