Какие книги может прочитать искусственный интеллект, Раги Бурхум

31.12.2023 08:26

Чтобы подготовить LLM (например, ChatGPT), организации необходимо собрать и отсортировать множество данных. Представьте себе человека, который в раннем возрасте начинает познавать мир. Какую информацию он может легально использовать для обучения? Этот вопрос может показаться немного абсурдным, но в контексте искусственного интеллекта он вступает в прямое противоречие с нашим нынешним пониманием того, что такое авторское право и добросовестное использование. New York Times решила преследовать OpenAI и Microsoft за использование газетных статей для обучения своих моделей искусственного интеллекта. Это должно было произойти, и это было неизбежно, поскольку речь шла о больших деньгах. ChatGPT не может комментировать или включать в себя информацию о новостях, если он их не читает, например, о состоянии войны. Создание наиболее достоверной информации о таком событии требует финансовых затрат, например, найма журналистов и их отправки в разные уголки мира. Расходы, которые не разделяют владельцы ChatGPT, хотя они косвенно монетизируют часть этой информации. by Camila Vera,В 2006 году произошло нечто подобное между "Полем против Google", где главным вопросом было, сможет ли Google индексировать содержимое Интернета. Как многие знают, у Google есть несколько программ, которые постоянно бороздят просторы интернета, сохраняют копии важных фрагментов в своей локальной базе данных ("кэш") и создают гигантский индекс всего, что они находят. Когда мы пользуемся поисковой системой, этот индекс мгновенно выдает результаты. Если бы Google проиграла это дело, где было определено, что она индексирует контент со всего интернета - включая материалы, защищенные авторским правом, - мы бы жили в другом мире, в мире без Google. В ходе судебного разбирательства был сделан вывод, что индексирование всего подряд является "добросовестным использованием", и поэтому никто не должен получать вознаграждение. Это также стало основой для определения других правил игры, например, как попросить Google удалить контент из своего кэша. Дело NYT против OpenAI Microsoft будет не менее важным, потому что оно определит, какие документы, социальные сети или любые публикации мы можем использовать для обучения искусственного интеллекта, и результаты будут радикально отличаться",