Южная Америка

Шесть лучших ИИ получили по 10 000 долларов для инвестирования в криптовалюту: посмотрите, кто из них показал лучший результат

Шесть лучших ИИ получили по 10 000 долларов для инвестирования в криптовалюту: посмотрите, кто из них показал лучший результат
В рамках беспрецедентного эксперимента шесть самых передовых моделей искусственного интеллекта в мире были подвергнуты испытанию с конкретной задачей: инвестировать 10 000 долларов США в криптовалюту и измерить их эффективность в режиме реального времени. Инициатива, продвигаемая компанией Nof1, направлена на оценку способности систем ИИ принимать эффективные финансовые решения без вмешательства человека. Результат оказался неожиданным: две китайские модели из группы, DeepSeek Chat v3.1 и Qwen 3 Max, удвоили и увеличили в 1,5 раза свою первоначальную инвестицию, в то время как американские модели, включая GPT-5 и Gemini 2.5 Pro, потеряли около 65% своего капитала всего за одиннадцать дней. Эксперимент, получивший название Alpha Arena, проводился на реальных криптовалютных рынках, и каждой модели было выделено одинаковое количество средств для автономной торговли. Участниками стали GPT-5, Gemini 2.5 Pro, Claude Sonnet 4.5, Grok 4, DeepSeek Chat v3.1 и Qwen 3 Max. Все они получили одинаковые правила и доступ к одинаковым техническим данным, с правом свободно решать, когда покупать, продавать или удерживать свои позиции. «За первые одиннадцать дней DeepSeek сумел превратить свои 10 000 долларов в почти 20 000 долларов, с доходностью 97% (которая в некоторые моменты превышала 120%). Qwen, со своей стороны, достиг 15 000 долларов с доходностью 53%. На другом конце спектра GPT-5 и Gemini 2.5 Pro упали до 3500 долларов с убытками более 65%. Claude и Grok остались стабильными, с незначительными результатами: 0,84% и -8,2% соответственно. «Эффективность измеряется не только прибылью или убытками, но и операционным поведением. GPT-5 и Gemini были наиболее активными, совершив 75 и 193 операции, в то время как DeepSeek и Qwen применили более консервативные стратегии, совершив меньше операций и продемонстрировав лучшую доходность. По словам организаторов, «те, кто совершает меньше всего операций, на данный момент зарабатывают больше всего». «Каждая модель могла инвестировать в шесть основных криптовалют — биткойн, эфир, догкойн, риппл, солана и BNB — самостоятельно определяя состав своего портфеля, объем каждой позиции и уровень левериджа. Большинство позиций удерживались в течение нескольких часов, хотя в некоторых случаях модели сохраняли операции в течение нескольких дней. Эксперимент начался 18 октября и продлится до 3 ноября, что создатели определили как «первый сезон» проекта, направленного на совершенствование финансовых возможностей ИИ. На каждом новом этапе будут корректироваться подсказки и параметры принятия решений, чтобы оценить, могут ли системы улучшить свою производительность в условиях высокой волатильности. Организаторы подчеркивают, что цель Alpha Arena не состоит в том, чтобы определить, какая модель является «лучшим трейдером», а в том, чтобы понять, как ИИ ведут себя под давлением рынка и какие переменные влияют на их решения. «Чем умнее модель, тем сложнее проводить бенчмаркинг», — объясняют в Nof1, имея в виду прогрессирующую сложность тестовой среды. «Чтобы ограничить риски, все системы работают по строгим правилам управления рисками, включая сигналы стоп-лосс и пределы доверия в своих решениях. В отличие от высокочастотной торговли, где операции выполняются за микросекунды, этот эксперимент относится к среднечастотной торговле: модели принимают решения за считанные минуты или часы, что позволяет наблюдать за их процессом рассуждений. Кроме того, каждый ИИ имеет панель прозрачности под названием «Model Chat», где можно прочитать его рассуждения перед выполнением операции. Там подробно описываются факторы, которые они учитывают — такие как исторические цены или объемы биткойна и эфириума — для обоснования своих действий. На практике модели «думают вслух», объясняя, почему они сохраняют или изменяют свою позицию. Несмотря на впечатляющие результаты, инициаторы эксперимента признают его ограничения. Период анализа краток, условия не отражают сложность реального рынка, а модели работают с неполной информацией: они не имеют доступа к новостям и внешним событиям и основывают свои решения исключительно на числовых данных и технических показателях. Поэтому руководители Nof1 предупреждают, что речь идет не о финансовом тесте, а о техническом измерении, попытке понаблюдать, как различные архитектуры ИИ реагируют на одну и ту же ситуацию. «Мы осознаем ограничения этого первого сезона: смещение ответов, небольшой объем выборки и недостаточная статистическая строгость», — поясняют они.