Со стороны не видно.
Эта статья написана на основе практического опыта: попыток сгенерировать изображения сельского мира с помощью инструментов искусственного интеллекта, таких как DALL-E или Midjourney. То, что должно было представлять собой узнаваемую сцену уругвайской сельской местности, в итоге оказалось смесью странных элементов: центральноамериканские здания в сельской местности, Серро-Батови на заднем плане и множество жестких стереотипов. Это выявило не только эстетическую проблему: ИИ не был обучен понимать сельскую местность. Модели ИИ обучаются на основе массивов данных, которые в подавляющем большинстве случаев представляют собой городские и оцифрованные контексты. Диспропорция огромна: количество данных о сельской жизни, которые генерируются, маркируются и доступны, ничтожно мало по сравнению с массой городской информации. Кроме того, в процессе обучения алгоритмы выполняют «чистку», отбрасывая редкие или ненормативные термины. Так, такие сельские слова, как ñandubay, verijero, tropilla, trama, estar entorado или chairado, исключаются, поскольку они не вписываются в центральный лексикон. Это явление происходит не только автоматически. Оно также воспроизводится культурно: многое из того, что обозначается как «сельское», происходит из внешних, часто городских, предвзятых представлений. В моделях сохраняется не жизненный опыт тех, кто живет в сельской местности, а его карикатура. При этом теряются знания, практика, нюансы и словари, которые отражают не только идентичность, но и способы решения производственных, экологических и социальных проблем. Недавние исследования показали, что основные наборы глобальных данных имеют тенденцию занижать численность населения, проживающего в сельской местности, на значительный процент. Эта невидимость не является нейтральной: она напрямую влияет на решения, принимаемые с помощью ИИ в таких областях, как здоровье животных, логистика, образование или развитие территорий. Исправление этого перекоса - не просто вопрос символической справедливости. Это оперативная и стратегическая необходимость. Чтобы искусственный интеллект был полезен в сельских условиях, он должен обучаться на реальных сельских данных, полученных на самих территориях, проверенных субъектами, которые знакомы с их логикой и уважают их разнообразие. Одним из возможных путей развития является содействие созданию специальных хранилищ сельской культуры, в которых собираются язык, изображения, практика, местные решения и исторический опыт. Такие хранилища не только усилят представленность сельских районов в моделях ИИ, но и послужат защитой для нематериального наследия, которому грозит исчезновение. Ведь если ИИ будет обучаться исключительно на основе того, что говорят, думают и обозначают города, риск не только в том, что он будет искажать сельскую местность. Риск состоит в том, чтобы утратить фундаментальные знания тех, кто веками кормил мир.