Пикачу на войне и Марио на улице: Sora 2 от OpenAI вызывает восторг и тревогу в интернете
Сэм Альтман поет в туалете. Джеймс Бонд играет с Альтманом в покер на высокие ставки. Пикачу штурмует пляжи Нормандии. Марио прыгает из своего виртуального мира в реальную жизнь. Это лишь некоторые из реалистичных видеороликов, которые буквально взорвали интернет на следующий день после того, как OpenAI выпустила Sora — приложение, сочетающее в себе социальные сети и генерацию медиа-контента на базе искусственного интеллекта. Приложение стало самым популярным в категории «Фото и видео» в iOS App Store в течение суток после его выпуска. Приложение, основанное на обновленной модели искусственного интеллекта Sora 2 от OpenAI, позволяет пользователям создавать видео высокого разрешения из простых текстовых подсказок. После обработки одноразовых видео- и аудиозаписей с изображением пользователей Sora позволяет им вставлять реалистичные «камео» себя, своих друзей и других людей, которые дали на это разрешение. Приложение создано для вирусного распространения. Однако многие видео, опубликованные в первый день после дебюта Sora, вызвали тревогу у экспертов по авторскому праву и дипфейкам. Пользователи сообщают, что пока что в своих творениях с помощью ИИ они могут использовать персонажей видеоигр, таких как Лара Крофт, или героев Nintendo, таких как Марио, Луиджи и даже принцесса Пич. Один пользователь вставил Рональда Макдоналда в пикантную сцену из романтического реалити-шоу «Остров любви». В понедельник The Wall Street Journal сообщил, что приложение позволит пользователям использовать материалы, защищенные авторским правом, если только владельцы авторских прав не откажутся от публикации своих работ. Однако, как отмечается в отчете, полный отказ от участия в программе не представляется возможным, и вместо этого правообладателям необходимо предоставить примеры нарушающего авторские права контента. Sora 2 основана на оригинальной модели Sora от OpenAI, которая была представлена публике в декабре. В отличие от оригинальной Sora, Sora 2 теперь позволяет пользователям создавать видео с соответствующими диалогами и звуковыми эффектами. Модели ИИ поглощают большие объемы информации в процессе «обучения», когда они учатся отвечать на запросы пользователей. Эти данные составляют основу для ответов моделей на будущие запросы пользователей. Например, модель генерации видео Veo 3 от Google была обучена на видео YouTube, что вызвало недовольство некоторых создателей YouTube. OpenAI четко не указала, из каких именно данных черпают информацию ее модели, но появление персонажей, защищенных авторским правом, указывает на то, что для разработки системы Sora 2 была использована информация, защищенная авторским правом. Китайская компания ByteDance и ее модель генерации видео Seedance также привлекли внимание органов по защите авторских прав. OpenAI грозит судебное разбирательство по искам о нарушении авторских прав, в том числе громкий судебный процесс с участием таких авторов, как Та-Нехиси Коутс и Джоди Пикоулт, а также газет, таких как The New York Times. Конкурент OpenAI, компания Anthropic, недавно согласилась выплатить 1,5 миллиарда долл. для урегулирования исков авторов, которые утверждали, что Anthropic незаконно скачивала и использовала их книги для обучения своих моделей искусственного интеллекта. В интервью Марк МакКенна, профессор права и директор факультета Института технологии, права и политики Калифорнийского университета в Лос-Анджелесе, провел четкую грань между использованием данных, защищенных авторским правом, в качестве входных данных для обучения моделей и генерацией результатов, которые отображают информацию, защищенную авторским правом. «Если OpenAI применяет агрессивный подход, заявляя, что они будут разрешать вывод результатов, защищенных вашим авторским правом, если вы не откажетесь от этого, то мне кажется, что это вряд ли сработает. Закон об авторском праве так не работает. Вы не обязаны отказываться от чужих правил», — сказал МакКенна. «Первые признаки показывают, что обучение моделей ИИ на законно приобретенных материалах, защищенных авторским правом, можно считать добросовестным использованием. Совершенно другой вопрос касается результатов работы этих систем», — продолжил он. «Вывод визуальных материалов — это более сложный вопрос авторского права, чем просто обучение моделей». По мнению МакКенны, такой подход является рассчитанным риском. «Отказ от участия — это явно подход типа «действуй быстро и ломай стереотипы», — сказал он. «А агрессивная реакция некоторых студий заключается в том, что они говорят: «Нет, мы не согласны с этим»». Disney, Warner Bros. и Sony Music Entertainment не ответили на запросы о комментарии. Помимо вопросов авторского права, некоторых наблюдателей беспокоило одно из самых популярных творений первого дня, на котором был изображен генеральный директор OpenAI Сэм Альтман, крадущий ценные компьютерные компоненты из Target — это иллюстрирует, с какой легкостью Sora 2 может создавать контент, изображающий реальных людей, совершающих преступления, которых они на самом деле не совершали. Высококачественные результаты Sora 2 появляются в то время, когда некоторые выражают обеспокоенность по поводу незаконных или вредных творений, от опасений по поводу кровавых сцен и безопасности детей до роли модели в распространении дипфейков. OpenAI включает в себя технологии, указывающие на то, что творения Sora 2 созданы с помощью ИИ, поскольку растет обеспокоенность по поводу все более размытой границы между реальностью и компьютерным контентом. Sora 2 будет включать движущиеся водяные знаки на всех видео в приложении Sora или загруженных с sora.com, а невидимые метаданные будут указывать, что видео, сгенерированные Sora, созданы системами искусственного интеллекта. Однако метаданные можно легко удалить. В собственной документации OpenAI говорится, что подход с использованием метаданных «не является панацеей для решения проблем происхождения. Их можно легко удалить случайно или намеренно», например, когда пользователи загружают изображения на сайты социальных сетей. Сивей Лю, профессор информатики и директор Лаборатории медиа-криминалистики и Центра информационной целостности Университета Буффало, согласился с тем, что многоуровневая аутентификация является ключом к подтверждению происхождения контента из Sora. «OpenAI утверждает, что у них есть другие меры ответственного использования, такие как включение видимых и невидимых водяных знаков, а также инструменты отслеживания изображений и аудио, созданных Sora. Они дополняют метаданные и обеспечивают дополнительный уровень защиты», — сказал Лю. «Однако их эффективность требует дополнительного тестирования. Невидимые водяные знаки и инструменты отслеживания можно тестировать только внутри компании, поэтому на данный момент сложно судить о том, насколько хорошо они работают», — добавил он. OpenAI обратила внимание на эти ограничения в своем техническом отчете по безопасности, написав, что «мы будем продолжать улучшать экосистему происхождения, чтобы обеспечить большую прозрачность контента, созданного с помощью наших инструментов». OpenAI не ответила сразу на запрос о комментарии. Хотя приложение Sora доступно для скачивания, доступ к услугам Sora по-прежнему предоставляется только по приглашению, поскольку OpenAI постепенно расширяет доступ.