Южная Америка

Все больше компаний из Кремниевой долины опираются на бесплатные китайские технологии искусственного интеллекта

Все больше компаний из Кремниевой долины опираются на бесплатные китайские технологии искусственного интеллекта
Оценивая состояние американской индустрии искусственного интеллекта в начале этого года, Миша Ласкин был обеспокоен. Ласкин, теоретический физик и инженер по машинному обучению, который помог создать некоторые из самых мощных моделей ИИ Google, заметил, что американские компании, занимающиеся ИИ, все чаще используют бесплатные, настраиваемые и все более мощные «открытые» модели ИИ. Но большинство этих моделей создавалось в Китае, и эти системы быстро набирали популярность по сравнению с их американскими конкурентами. «Эти модели не так уж сильно отставали от передовых. На самом деле, они были удивительно близки к передовым. Те, которые появляются сейчас», — сказал Ласкин, сделав небольшую паузу, — «ну, они явно близки к передовым». Ласкин основал стартап под названием Reflection AI, недавно оцененный в 8 миллиардов долл., чтобы предоставить американскую альтернативу с открытым исходным кодом этим все более мощным китайским моделям, которые завоевали популярность в Кремниевой долине. «Вы начинаете видеть, как компании с открытыми моделями фактически продвигают границы интеллекта в Китае и в целом границы интеллекта», — сказал Ласкин. За последний год все большее число самых популярных американских стартапов в области ИИ обращаются к открытым китайским моделям ИИ, которые все чаще конкурируют с дорогостоящими американскими системами и иногда заменяют их в качестве основы для американских продуктов ИИ. NBC News поговорила с более чем 15 основателями стартапов в области искусственного интеллекта, инженерами по машинному обучению, отраслевыми экспертами и инвесторами, которые заявили, что, хотя модели американских компаний по-прежнему задают темп прогресса на передовых рубежах возможностей искусственного интеллекта, многие китайские системы дешевле в доступе, более настраиваемы и за последний год стали достаточно функциональными для многих применений. Растущая популярность может создать проблему для американской индустрии искусственного интеллекта. Инвесторы вложили десятки миллиардов в OpenAI и Anthropic, сделав ставку на то, что ведущие американские компании в области искусственного интеллекта будут доминировать на мировом рынке ИИ. Но все более широкое использование бесплатных китайских моделей американскими компаниями вызывает вопросы о том, насколько эти модели действительно исключительны, и не является ли стремление Америки к закрытым моделям в целом ошибочным. Майкл Файн, руководитель отдела машинного обучения в Exa, поисковой компании, специализирующейся на ИИ, оцениваемой в 700 миллионов долл. и поддерживаемой такими гигантами Кремниевой долины, как Lightspeed Venture Partners и Nvidia, сказал, что во многих случаях запуск китайских моделей на собственном оборудовании Exa оказался значительно быстрее и дешевле, чем использование более крупных моделей, таких как GPT-5 от OpenAI или Gemini от Google. «Часто бывает так, что мы получаем функцию, работающую с закрытой моделью, и понимаем, что она слишком дорогая или слишком медленная, и задаемся вопросом: «Какие рычаги у нас есть, чтобы сделать ее быстрее и дешевле?» «Обычно это означает замену закрытой модели эквивалентной открытой моделью, а затем запуск ее на нашей собственной инфраструктуре», — сказал Файн. Китайские модели, такие как R1 от DeepSeek и Qwen от Alibaba, бесплатны и считаются «открытыми» или «открытыми по весу», потому что любой может их загрузить, скопировать, изменить и использовать. Они отличаются от ведущих американских систем, таких как Claude от Anthropic или самые популярные модели GPT от OpenAI, которые являются «закрытыми» или проприетарными и доступны через центры обработки данных и конвейеры, контролируемые крупными технологическими гигантами. В течение многих лет американские модели с закрытым исходным кодом от OpenAI и Anthropic значительно превосходили как американские, так и китайские открытые альтернативы. Даже хорошо обеспеченные внутренние усилия по использованию моделей с открытым исходным кодом столкнулись с трудностями: Bloomberg попытался создать внутренний инструмент BloombergGPT, используя модели с открытым исходным кодом, обученные на своей обширной коллекции финансовых новостей и документов, но в итоге он уступал закрытым моделям OpenAI в области финансовых знаний. Однако в прошлом году китайские компании, такие как DeepSeek и Alibaba, добились огромных технологических успехов. Согласно показателям, отслеживаемым независимой компанией Artificial Analysis, занимающейся тестированием ИИ, их продукты с открытым исходным кодом теперь близко приближаются или даже превосходят по производительности ведущие американские модели с закрытым исходным кодом во многих областях. «Разрыв действительно сокращается», — сказал Лин Цяо, генеральный директор Fireworks AI и соавтор PyTorch, доминирующей платформы для обучения моделей искусственного интеллекта, о различиях в возможностях между американскими моделями с закрытым исходным кодом и китайскими моделями с открытым исходным кодом. В результате такого повышения производительности некоторые платформы, позволяющие пользователям выбирать между разными моделями, такие как OpenRouter, наблюдают тенденцию к переходу пользователей на китайские модели с открытым исходным кодом. Джерри Лю, основатель Dayflow — приложения для повышения продуктивности — оценивает, что примерно 40 % пользователей Dayflow сейчас выбирают модели с открытым исходным кодом. Dayflow построено вокруг нескольких основных задач, таких как сканирование скриншотов и обобщение активности пользователей. Приложение позволяет пользователям выбирать из нескольких моделей искусственного интеллекта для выполнения этих задач, включая Gemini от Google и более мелкие варианты с открытым исходным кодом, такие как Qwen от Alibaba. По словам Лю, для таких задач, как описание экрана пользователя, Qwen демонстрирует замечательную стабильность. «Qwen так же хорош, как GPT-5, для моего случая использования», — сказал Лю. И в отличие от GPT-5 или Gemini, более мелкая версия Qwen может работать при относительно низких затратах или бесплатно. Лю сказал, что оплата использования закрытых моделей пользователями может стоить Dayflow до 1000 долл. на человека, что делает более дешевые модели с открытым исходным кодом важными для жизнеспособности Dayflow. Модели Dayflow с открытым исходным кодом также выполняют всю обработку на индивидуальном компьютере каждого пользователя, что, по словам Лю, привлекательно для тех, кто не хочет отправлять свои данные в облако из соображений конфиденциальности. Лиу предпочитает хранить данные на своем устройстве с помощью моделей с открытым исходным кодом: «Стал бы я использовать продукт, при котором весь мой экран транслировался бы в облако какого-то случайного человека? Конечно, нет». Помимо повышенной производительности, более высокого уровня конфиденциальности и более низкой стоимости, модели с открытым исходным кодом также завоевывают популярность благодаря преимуществам экосистемы. Расширение использования открытых источников и создание ресурсов с открытым исходным кодом разработчиками побуждают все больше разработчиков использовать эти модели. Антонио Весполи, соучредитель стартапа Circlemind AI, занимающегося браузерными агентами, сказал, что китайские модели сейчас доминируют в онлайн-ресурсах для разработчиков. Причина практическая: китайские модели, такие как Qwen, на которую, по словам генерального директора Брайана Чески, «в значительной степени» полагается Airbnb, имеют обширные учебные руководства и поддержку сообщества. Чарльз Зедлевски, директор по продуктам в компании Together AI, занимающейся инфраструктурой искусственного интеллекта, сказал, что разработчики теперь считают более простым и эффективным начинать с открытых моделей и адаптировать их с помощью своих собственных данных, добавляя «навыки или знания, которые не доступны в любой из существующих сегодня моделей». По его словам, по мере выпуска своих первых приложений искусственного интеллекта компании получают четкое представление о своих потребностях. Для разработчиков, желающих настроить модели, эти ресурсы делают китайские варианты исходной точкой по умолчанию. Kilo Code, популярное приложение для программирования, которое помогает разработчикам писать программное обеспечение с использованием искусственного интеллекта, позволяет пользователям выбирать из множества моделей. Из 20 лучших моделей среди пользователей Kilo Code семь являются китайскими, причем шесть из них являются открытыми. Китай поддерживает открытый исходный код В то время как большая часть разработок в области искусственного интеллекта в США осуществляется в частном секторе под руководством таких гигантов индустрии, как OpenAI и Anthropic, которые придерживаются закрытого подхода, правительство Китая более активно участвует в разработке стратегии развития искусственного интеллекта в стране. В своем экономическом обращении 1 ноября президент Китая Си Цзиньпин призвал к более тесному «сотрудничеству в области технологий с открытым исходным кодом». А в марте высший орган экономического планирования Китая заявил о намерении поддерживать экосистему моделей с открытым исходным кодом. Китайские лаборатории, как правило, открыто публикуют свои модели, в то время как американские компании, такие как OpenAI, добились раннего успеха с закрытыми моделями и остались верны подходу с закрытым исходным кодом. Многие китайские компании также выпускают продукты быстрее, чем их американские коллеги: в этом году Alibaba выпускала новую модель примерно каждые 20 дней, в то время как Anthropic выпускала новые модели в среднем каждые 47 дней. Натан Ламберт, старший научный сотрудник Института искусственного интеллекта имени Аллена и эксперт по экосистеме искусственного интеллекта с открытыми моделями, сказал NBC News, что недавний прогресс китайских моделей не является случайностью. «Китайцы — настоящие новаторы в области ИИ», — сказал Ламберт. «В последние 12 месяцев баланс сил быстро меняется», — добавил Ламберт. Он много писал о развитии искусственного интеллекта в Китае на своем Substack и считается экспертом по экосистеме открытого исходного кода в Китае. Преимущество США в области искусственного интеллекта Некоторые в Кремниевой долине поспешно отмечают, что американские модели сохраняют значительное преимущество в передовых технологиях искусственного интеллекта, и что эти закрытые американские модели обеспечивают удобство и простоту использования, с которыми громоздкие открытые модели не могут сравниться. Тим Тулли, партнер венчурной компании Menlo Ventures из Кремниевой долины, сказал, что закрытые модели по-прежнему значительно более функциональны и часто более полезны: «Инструментарий просто лучше, производительность просто лучше, агентские фреймворки, которые созданы и используются всеми, просто лучше с Anthropic и OpenAI. Они просто работают лучше. Так что экосистема просто сильнее в среде с закрытым исходным кодом». Кроме того, многие компании могут уклоняться от использования китайских моделей из-за риска — реального или мнимого — связанного с использованием продукта, основанного на китайской платформе. «Существует воспринимаемый риск, что покупатели, как из частного, так и из государственного сектора, будут колебаться при покупке продукта, основанного на китайской модели с открытым исходным кодом», — сказал Тулли. Menlo Ventures является инвестором Anthropic, одной из ведущих мировых компаний, работающих с закрытыми моделями. В конце сентября США Центр стандартов и инноваций в области искусственного интеллекта (Center for AI Standards and Innovation) опубликовал отчет, в котором описываются риски, связанные с популярными моделями DeepSeek, и отмечается ослабление протоколов безопасности и увеличение прокитайских результатов по сравнению с американскими моделями с закрытым исходным кодом. В недавнем меморандуме Белого дома компания Alibaba, разработчик Qwen, также была обвинена в поддержке китайских вооруженных сил, что создало политический барьер для внедрения этих систем искусственного интеллекта в предприятия. В ответ Alibaba заявила Financial Times, что эти утверждения являются «полной ерундой» и «явно представляют собой попытку манипулировать общественным мнением и очернить Alibaba». Многие наблюдатели также отмечают, что несколько китайских моделей, выпущенных в течение последнего года, по-видимому, в значительной степени заимствованы из американских моделей. Некоторые наблюдатели считают, что быстрый прогресс DeepSeek мог быть достигнут только за счет копирования большей части сложной фундаментальной работы американских компаний, таких как OpenAI и Anthropic. Эта динамика вызывает вопросы о том, будут ли китайские открытые модели продолжать сближаться с американскими закрытыми моделями, не говоря уже о том, чтобы превзойти их по производительности. В течение последнего года эксперты заявляли, что китайские модели могут оставаться высокоэффективными «быстрыми последователями», зависящими от прогресса американского ИИ. Между тем китайские компании также исследуют модели с закрытым исходным кодом. В октябре Alibaba выпустила только версию с закрытым исходным кодом самой большой из своих новых систем Qwen, решив не делиться версией с открытым исходным кодом. Кто контролирует будущее? Американские компании, занимающиеся искусственным интеллектом, и федеральное правительство обратили внимание на недавний рост популярности китайских моделей, а эксперты даже назвали отсутствие в США мощных моделей с открытым исходным кодом «существенной» угрозой для демократии. Хотя высокопрофильная серия моделей с открытым исходным кодом Llama от Meta исторически лидировала в американских усилиях по созданию открытого исходного кода, генеральный директор Марк Цукерберг заявил о намерении Meta не открывать исходный код всех своих моделей искусственного интеллекта «суперинтеллекта». В последние годы производительность моделей Llama также снизилась, что стало одной из причин перехода пользователей открытого исходного кода на более производительные китайские модели с открытым исходным кодом. Однако американские усилия в области открытого исходного кода могут постепенно активизироваться, поскольку американские инноваторы пытаются повысить конкурентоспособность американских моделей с открытым исходным кодом. В июле Белый дом опубликовал план действий в области искусственного интеллекта, в котором федеральному правительству было предложено «поощрять искусственный интеллект с открытым исходным кодом и открытой весовой системой». В августе производитель ChatGPT, компания OpenAI, выпустила свою первую модель с открытым исходным кодом за пять лет. Объявляя о выпуске модели, OpenAI отметила важность американских моделей с открытым исходным кодом, написав, что «широкий доступ к этим мощным моделям с открытым весом, созданным в США, помогает расширить демократический ИИ». А в конце ноября сеаттлский Институт Аллена выпустил свою новейшую модель с открытым исходным кодом под названием Olmo 3, предназначенную, согласно объявлению о запуске, для помощи пользователям в «быстром создании надежных функций для исследований, образования или приложений». Ламберт из Института Аллена также запустил «Проект ATOM» — аббревиатуру от «American Truly Open Models» (Американские действительно открытые модели). Как гласит манифест проекта ATOM: «Америка утратила лидерство в области открытых моделей — как по производительности, так и по внедрению — и продолжает отставать». «Если мы хотим быть ведущей страной в эпоху искусственного интеллекта, мы не можем уступать такую важную часть экосистемы какой-либо другой стране», — сказал Ламберт в электронном письме NBC News.