Южная Америка

Latam-GPT, модель искусственного интеллекта, обученная понимать Латинскую Америку лучше, чем ChatGPT

Latam-GPT, модель искусственного интеллекта, обученная понимать Латинскую Америку лучше, чем ChatGPT
Latam-GPT, первая языковая модель искусственного интеллекта, созданная в Чили в союзе с Бразилией, хочет помериться силами с ChatGPT, Gemini, DeepSeek и другими технологиями. Проект, который будет ориентирован на страны Латинской Америки и Карибского бассейна, был отмечен президентом Габриэлем Бориком в его последнем публичном выступлении в воскресенье как важная веха: «Цифровое будущее должно также говорить на нашем языке, нашими голосами и для наших людей». Родриго Дуран, руководитель Национального центра искусственного интеллекта (Cenia), частной некоммерческой организации, которая координировала разработку Latam-GPT, говорит, что дух этой инициативы заключается не в прямой конкуренции с другими международными игроками, а в повышении эффективности любого технологического решения для стран региона. Руководитель поясняет, что они не стремятся просто реализовать платформу: «Мы хотим способствовать внедрению этих технологий с этической и ответственной точки зрения. В этом и заключается наша цель, чтобы искусственный интеллект был на службе у людей в Латинской Америке». Когда ChatGPT был запущен в конце 2022 года, группа исследователей Ceina уже начала работать над языковой моделью искусственного интеллекта несколькими месяцами ранее, и за два года им удалось собрать множество ключевой информации из разных стран, чтобы укрепить свой алгоритм. Отличие от других моделей в том, что она будет обучаться на большой доле данных из региона. «Она не будет лучше отвечать на такие темы, как биохимия, бизнес-модели - если только они не из Латинской Америки, - но ее большим достоинством будет знание местного контекста. Другими словами, Latam-GPT будет знать о Латинской Америке больше и лучше, чем любая другая модель, которая не была обучена на этих данных», - говорит Дуран. По словам заместителя министра науки Чили Кристиана Куэваса Веги, первая версия крупномасштабной языковой модели (LLM) будет выпущена в июне-июле, и любой желающий сможет воспользоваться этой технологией бесплатно. «Идея заключается в том, чтобы она отвечала культурному фону Латинской Америки, который отличается разнообразием. Мы также стремимся каким-то образом предложить региону технологическую независимость и суверенитет», - говорит он. Бразилия присоединилась к проекту после апрельского турне Борика, в ходе которого две страны подписали меморандум о взаимопонимании (MoU) о сотрудничестве в области развития искусственного интеллекта. Но уже есть и другие страны, такие как Колумбия и Парагвай, заинтересованные в участии в инициативе, которая опирается на сотрудничество почти тридцати учреждений из разных стран региона, а также на инвестиции Банка развития Латинской Америки и Карибского бассейна, ранее известного как Андская корпорация развития (CAF), и Фонда обсерватории данных за счет кредитов от Amazon Web Services (AWS). Наибольшие трудности возникли при создании достаточно большой и представительной базы данных по региону. В отличие от таких компаний, как Google, Meta и Open IA, у Cenia нет собственных источников информации. Поэтому они начали кампанию по обращению к исследовательским центрам, государственным учреждениям, архивам, библиотекам, университетам, общественным организациям, издателям, кинопродюсерам и людям со всего региона, имеющим доступ к большим объемам данных, с предложением сотрудничать в подготовке Latam-GPT. Данные, предоставленные этими организациями, обрабатываются и очищаются в Cenia, где работают около 12 координаторов из разных областей и 60 сотрудников. Заместитель министра Куэвас ожидает, что эта группа может быть расширена. Мы разрабатываем этот проект с открытым исходным кодом, чтобы любой человек в любой точке мира мог взаимодействовать с нашей моделью искусственного интеллекта». В Чили надеются, что модель будет адаптирована к языкам коренных народов. На самом деле исследователи уже работают над созданием программного обеспечения на таких языках, как мапудунгу, на котором говорят мапуче на юге Чили, и рапа-нуи, на котором говорят предки жителей острова Пасхи. Дуран указывает, что она может увидеть свет в марте 2026 года, что зависит от разработки переводчика: «Когда мы говорим о неграмматических языках или языках коренных народов, у которых мало письменных источников, это вызывает сложности, поскольку мы сталкиваемся со многими понятиями, не имеющими дословного перевода». На данный момент первая версия Latam-GPT будет свободно владеть испанским, португальским и английским языками. Предполагается, что вначале она будет функционировать как чат-бот, хотя в будущем может перейти и к другим функциям.