Расходы на ИИ резко выросли, и компании ищут способы их сократить
«Это будет настоящий кошмар», — утверждает руководитель одной из крупных американских технологических компаний. Он имеет в виду возникающую проблему для компаний, использующих искусственный интеллект. Агенты ИИ — боты, способные читать, интерпретировать и действовать, — потребляют огромные вычислительные ресурсы и уже приводят к астрономическим счетам. По мере их роста проблема будет усугубляться. Крупные компании, отмечает руководитель, обычно используют сотни программ. Если каждая из них будет предлагать своих агентов (что, вероятно, и произойдет), затраты на ИИ могут легко взлететь до заоблачных высот. «Управление бюджетом стало новой проблемой для тех, кто внедряет ИИ. Еще недавно сотрудников поощряли массово инвестировать в эту технологию, поскольку руководители и инвесторы рассматривали такие расходы как признак инновационности. Чрезмерное потребление токенов — фрагментов текста, которые обрабатывают модели и которые часто используются в качестве единицы цены, — стало символом престижа; технологические эксперты прозвали это явление «tokenmaxxing». Компании демонстрировали использование ИИ своими сотрудниками в внутренних рейтингах. Платформа Meta награждала лучших пользователей такими званиями, как «Легенда токенов». «Такие стимулы отчасти объясняют рост расходов на ИИ. Еще одним фактором является изменение подхода компаний к использованию этой технологии». Приложения, потребляющие большое количество токенов, такие как модели логического вывода и агенты, становятся всё более популярными. В некоторых случаях агенты создают собственных агентов, что ещё больше увеличивает расходы. Ramp, поставщик корпоративных кредитных карт, анализирует данные о транзакциях своих клиентов, чтобы выяснить, как они используют ИИ. По его подсчётам, общие расходы за последний год выросли в 13 раз. В апреле компания Uber сообщила, что уже за четыре месяца израсходовала свой годовой бюджет на ИИ. Другие компании сталкиваются с аналогичными проблемами. По имеющимся данным, одна из них потратила 500 млн долларов США на токены ИИ за один месяц. Сэм Альтман, глава OpenAI, охарактеризовал растущие затраты для клиентов как «огромную проблему». «Пока что проблема носит точечный характер. Больше всего тратят, как правило, технологические компании, поскольку они первыми внедряют эту технологию и поскольку ИИ особенно хорошо подходит для написания программного обеспечения. По подсчётам Ramp, 1 % клиентов, тратящих на ИИ больше всего на одного сотрудника, в среднем получают счета на сумму около 7450 долларов США на человека в месяц. Для сравнения: у среднего клиента Ramp этот показатель составляет всего 11 долларов. И хотя счета за ИИ у крупных клиентов невелики по сравнению со стоимостью найма разработчика в Сан-Франциско, они высоки по сравнению с наймом такого же специалиста в Дели (Индия). «Компании реагируют на это по-разному. Хотя компании, отстающие в области ИИ, по-прежнему спешат внедрять эту технологию, для наиболее активных пользователей эпоха «токенмаксинга» подошла к концу. Некоторые, в том числе Meta и Amazon, удалили свои рейтинговые таблицы. Многие стали более тщательно подходить к выбору модели. Для выполнения многих задач не требуются дорогостоящие передовые модели. Аран Кханна из Archera.ai, которая помогает компаниям сокращать расходы на облачные услуги, отмечает, что в некоторых случаях Sonnet — модель компании Anthropic, не относящаяся к числу передовых, — может стоить в двадцать раз дешевле, чем Opus, одна из передовых моделей. А Kimi — модель с открытым исходным кодом от китайского стартапа Moonshot AI — может стоить в двадцать раз дешевле». Еще один подход — установление лимитов на расходы. Uber ограничил своим сотрудникам использование токенов на сумму 1500 долларов США в месяц на каждый инструмент для программирования. То, как компании решают распределять токены, зависит от того, где ИИ может принести наибольшую пользу, говорит Рэйчел Лэйкок из консалтинговой компании Thoughtworks. Это часто означает, что компании выделяют наибольшее количество токенов на свою основную коммерческую функцию, например, на инженеров в технологической компании, добавляет она. «Некоторые поставщики программного обеспечения, интегрирующие ИИ в свои продукты, экспериментируют с новыми ценовыми планами, такими как планы, основанные на результатах, чтобы развеять опасения клиентов по поводу затрат». Intercom, поставщик программного обеспечения, предлагает услугу, при которой клиент платит только за те запросы, которые решаются его специалистом службы технической поддержки. Крупные облачные провайдеры также запустили сервисы управления затратами, включающие инструменты для составления бюджета и способы распределения запросов по наиболее подходящей модели. «Для разработчиков моделей поиск баланса сложнее. Они хотят, чтобы их ключевые клиенты использовали как можно больше токенов, не испытывая при этом сопротивления из-за стоимости. Сегодня затраты на предоставление ИИ-услуг субсидируются лабораториями. Фактически, план OpenAI по привлечению клиентов Anthropic, как предполагается, предполагает резкое снижение цен. Но в конечном итоге разработчикам моделей нужно будет получать прибыль, а это означает повышение цен. Давление в этом направлении только усилится в конце этого года, если, как ожидается, Anthropic и OpenAI выйдут на биржу. Тогда их клиентам придётся рассчитывать на ещё более ошеломляющие счета за ИИ».
