DeepSeek выбила из колеи ИИ, но пока не стоит считать, что большие технологии уже закончились

28.01.2025 18:47

Генеральный директор OpenAI Сэм Альтман написал в X в конце самого знаменательного дня для ИИ с тех пор, как его компания выпустила ChatGPT в декабре 2022 года. Его сообщение в понедельник стало подтверждением иерарха ИИ, что разрушители были уничтожены. «Deepseek's r1 - впечатляющая модель, особенно с точки зрения того, что они могут предложить за свою цену», - написал он, давая наводку на конкурента, которого еще несколько недель назад никто не видел. «Очевидно, что мы будем выпускать гораздо более совершенные модели, и, кроме того, это очень здорово - иметь нового конкурента! Мы подтянем несколько релизов». DeepSeek, неожиданно популярная китайская модель искусственного интеллекта, которая в понедельник потрясла американские рынки, стала известна в последние несколько дней: ее ИИ-помощник занял первое место в App Store Apple и вызвал реакцию президента Дональда Трампа и лидеров технологического сектора. Внезапное появление DeepSeek взбудоражило Кремниевую долину так, как раньше она взбудоражила всех остальных. Горстка талантливых программистов, работающих в Китае, разрушила предположения, господствовавшие в Больших Технологиях относительно будущего ИИ, которое для многих в технологиях является единственным будущим, о котором стоит думать. В центре этих предположений были деньги, энергия и модели. Мысль была примерно такой: Лучший способ построить модель ИИ - это тренировать ее снова и снова, используя самые мощные компьютерные чипы для оттачивания ее математических тонкостей. Постройте более мощный движок ИИ (он же центр обработки данных, который может занять площадь размером с большую часть Манхэттена). Это дорогостоящее и ресурсоемкое предложение. И почти все в технологическом секторе с этим согласны. Именно поэтому Goldman Sachs прогнозирует более 1 триллиона долл. инвестиций в ИИ в ближайшие годы, а Марк Цукерберг заявил о 60 миллиардах долл. только в этом году, в то время как Элон Маск и Альтман спорили о проекте Stargate стоимостью 500 миллиардов долл. DeepSeek пошла другим путем. Используя передовые (но известные) концепции повышения эффективности, команда отпетых юнцов - генеральный директор заявил, что нанимает студентов прямо из китайских университетов, - занялась созданием модели без модных чипов и энергоемкого обучения, которая могла бы конкурировать с крупными американскими моделями. Эта альтернатива ставит под сомнение целый ряд предположений Больших Технологий, в которые уже вложены миллиарды долларов. Что, если модели ИИ не так уж сложно построить? Что, если модели ИИ не так уж дороги или сложны для запуска, даже на таком маленьком устройстве, как смартфон? Что, если чипы ИИ не так уж важны, как считалось раньше? Как Китаю удалось обойти экспортный контроль, призванный помешать развитию ИИ? Предвидела ли Кремниевая долина - и технологический рынок в целом - такое развитие событий? Идея о том, что пограничные, или самые передовые, модели ИИ становятся менее дифференцированными, все чаще звучит в мире ИИ. В сентябре соучредитель технологической консалтинговой компании Infosys заявил CNBC, что они находятся на пути к превращению в товар и взаимозаменяемость. Слабый шум о DeepSeek можно проследить до 2023 года, когда модель кодирования компании была опробована людьми из сообщества ИИ. В 2024 году, когда компания выпустила еще несколько моделей, обсуждение активизировалось. К концу года4 некоторые предупреждали, что DeepSeek уже демонстрирует признаки того, что ввергнет индустрию в хаос. «Решающее значение более дешевых методов обучения DeepSeek заключается в том, что они открывают путь для более широкого внедрения и инноваций - особенно за пределами устоявшихся технологических центров», - написал 31 декабря Азим Ажар, технологический предприниматель. Если передовые магистратуры можно будет строить с меньшим бюджетом, то усилия Запада по контролю или замедлению развития ИИ окажутся тщетными». Ограничения порождают изобретательность; по иронии судьбы, экспортный контроль, похоже, подстегнул китайские команды ИИ к разработке более компактных и эффективных решений». Не совсем понятно, действительно ли это удар по большим технологиям. Да, Nvidia потеряла рекордную сумму рыночной стоимости, но она все еще стоит почти 3 триллиона долл. (а ее акции во вторник отскочили почти на 9 %). Технологические аналитики отмечают, что удешевление технологии искусственного интеллекта имеет большие преимущества, в том числе для компаний, работающих над созданием потребительских платформ. Бен Томпсон, аналитик в области бизнеса и технологий, написал в своем блоге Stratechery, что появление DeepSeek и его первоначальный шок могут привести к будущему, в котором Big Tech окажется в выигрыше. «В долгосрочной перспективе коммерциализация моделей и удешевление выводов - что также продемонстрировала DeepSeek - отлично подходит для Big Tech», - написал Томпсон. «Мир, в котором Microsoft может предоставлять выводы своим клиентам за долю стоимости, означает, что Microsoft придется тратить меньше средств на центры обработки данных и графические процессоры, или, что не менее вероятно, она получит значительно более высокий уровень использования, учитывая, что выводы стали намного дешевле». В понедельник вечером Трамп согласился с этой оценкой в своем собственном заявлении о DeepSeek, сказав, что «вместо того чтобы тратить миллиарды и миллиарды, вы потратите меньше, и, надеюсь, придете к такому же решению». Кристофер Акерман, независимый исследователь ИИ, ранее работавший в Google, в своем сообщении отметил, что компании, сосредоточенные на создании передовых моделей ИИ, могут столкнуться с трудностями, в частности OpenAI и Anthropic, два крупнейших стартапа в области ИИ, но чипы все равно будут необходимы даже при создании более эффективных моделей, что дает Nvidia некоторую уверенность. Компания DeepSeek заявила, что ее собственные модели были обучены с помощью менее продвинутых чипов Nvidia. «Рынок сейчас не согласен, но рынок реагирует», - написал он. Некоторые обеспокоены еще меньше. Дэн Айвз, аналитик финансовой компании Wedbush Securities, написал во вторник в аналитической записке, что реакция на DeepSeek была чрезмерной и что парадокс Джевонса, о котором недавно говорил генеральный директор Microsoft Сатья Наделла в связи с DeepSeek, означает, что этот эпизод будет рассматриваться как положительный для Big Tech. «Мы ожидаем новых инноваций в области ИИ и снижения стоимости LLM-моделей», - написал Айвз. «В конечном счете это положительно скажется на вычислительных мощностях, вариантах использования и на том, куда движется мир технологий в этой 4-й промышленной революции».