Южная Америка

Гигантские числа и «тёмная материя»: «чёрный ящик» измерений в области ИИ, который усложняет все расчёты

Гигантские числа и «тёмная материя»: «чёрный ящик» измерений в области ИИ, который усложняет все расчёты
Сколько весит планета Земля? Примерно один «ронна-грамм». Если так сказать, кажется, что это мало, но на самом деле это 10 в степени 27. В свою очередь, масса электрона, по оценкам, составляет около одного «квекто-грамма» (10 в минус 30-й степени). «Ронна» и «кветта» — это последние официальные единицы измерения, принятые три года назад на Международной конференции по мерам и весам в Париже. Это последние буквы греческого алфавита, которые оставались для обозначения огромных или чрезвычайно малых величин. Запросы на увеличение диапазона официальных единиц измерения всегда поступали из астрономии или химии, но на последних двух конференциях спрос в основном исходил со стороны информационных наук. Например, по оценкам, объем данных, который мы сгенерируем в 2030 году, будет равен «йотабиту»: это столько, сколько поместится на DVD-дисках, сложенных в горизонтальную стопку от Земли до Марса». Помимо официальных единиц измерения, в мире математиков и программистов бытуют и другие популярные термины, такие как «бронтобайт» (чтобы представить масштаб: сейчас в Интернете всё измеряется в зеттабайтах, а бронтобайт в миллион раз превышает эту величину).» В прошлом месяце на английском языке вышла отличная книга на эту тему, написанная Ричардом Элвесом, профессором математики Лидсского университета. Она называется «Huge Numbers» («Огромные числа») и рассказывает об количествах, начиная от 4,5 и заканчивая «Fish 7». «4,5 — это отправная точка, связанная с врождённым числовым восприятием человека, которое позволяет нам определять число, «не считая» до 4 (при числе 5 мы уже ошибаемся или нам приходится считать, в зависимости от того, как расположены объекты)». Затем Элвес переходит к астрономическим величинам или к величинам, связанным с комбинаторной вероятностью (например, Мегаминкс — двенадцатигранник Рубика, в котором у Аргентины есть чемпион мира Леандро Лопес, — имеет 10 в 68 возможных комбинаций положений, что превышает количество атомов во видимой вселенной). Общее количество атомов во Вселенной оценивается в 10 в степени 80. «В 80-е годы самым большим известным числом, занесенным в Книгу рекордов Гиннеса, было „число Грэма“, которое использовалось в математическом доказательстве. В книге также упоминается «число Райо», созданное Агустином Райо (деканом Массачусетского технологического института) с использованием теории множеств. И, наконец, «Fish 7», построенное на основе числа Райо японским геологом, использующим псевдоним «Fish» (рыба), — это самое большое число в книге. «Учитывая все, что происходит с искусственным интеллектом, нам придётся привыкнуть к гигантским числам. Достаточно только подумать о том, сколько сегодня стоят «семь великолепных» (семь компаний с самой большой рыночной капитализацией в мире, совокупная стоимость которых превышает ВВП всей Европы). Еще один пример: то, что в сфере инвестиций известно как TAM (Total Addressable Market) — это общий объем рынка, на который компания или продукт могли бы претендовать, если бы охватили 100 % существующего спроса. Это показатель, который используют инвесторы и стартапы для оценки бизнес-возможностей: не сколько они продадут, а сколько могли бы продать в наилучшем случае на данном рынке. «Благодаря ИИ TAM практически всех секторов резко расширился по нескольким причинам. Во-первых, ИИ сделал автоматизируемым (а значит, превратил в «рынок») труд, который раньше был исключительно человеческим: юридическое консультирование, медицинская диагностика, дизайн, программирование, обслуживание клиентов. Во-вторых, он снизил предельную стоимость масштабирования программных решений практически до нуля, что позволяет одной и той же компании выходить на глобальные рынки, которые раньше требовали очень крупных локальных операций. В результате секторы, TAM которых составляли десятки миллиардов долларов, теперь измеряются сотнями миллиардов, а также появились совершенно новые рынки — такие как рынок инфраструктуры моделей, автономных агентов или синтетических данных — которые пять лет назад просто не существовали». И если раньше запросы на гигантские объёмы данных поступали из астрономии, а теперь — из информационных наук, то есть одно понятие, которое связывает эти два мира: «тёмная материя». Во вселенной она занимает большую часть пространства; мы не можем её увидеть, но можем наблюдать её последствия. Все больше экономистов заговорили о «материи» или о неясных, невидимых результатах в области ИИ. «В 1987 году Роберт Солоу опубликовал в журнале „The New York Review of Books“ рецензию на книгу по экономике и почти между делом упомянул фразу, которая впоследствии стала канонической: „Эпоху компьютеров можно увидеть повсюду, кроме статистики производительности“. Парадокс Солоу остался великой загадкой макроэкономики конца века: как могла столь очевидная технологическая революция не оставить следа в официальных цифрах?» Четыре десятилетия спустя Малкольм Спиттлер и Дилан Патель, аналитики из SemiAnalysis, выдвигают гипотезу, что ИИ порождает проблему измерения гораздо большего масштаба, которую они называют «темным выпуском» (Dark Output): реальная экономическая ценность, которую генерирует искусственный интеллект, но которую национальные счета не способны учесть. Стоимость ИИ прекрасно видна в долларах, ваттах, литрах воды и потерянных рабочих местах. А вот производимый им объем — нет. «Проблема уходит корнями в прошлое и связана с природой услуг. Когда автоматизация улучшила производство товаров, статистики могли их подсчитать. Существует единица измерения. Но не существует никакой стандартной единицы измерения для «юридических услуг», библиографического рецензирования или консалтинга. Национальные счета измеряют услуги с помощью счетов, опросов о ценах и отработанных часов. Когда ИИ заменяет младшего юриста при составлении простого контракта, оплата за эту работу исчезает — поглощается в виде нескольких центов в токенах — и статистическая система фиксирует падение производительности там, где на самом деле произошло повышение производительности. Спиттлер и Патель выделяют два типа «скрытой» производительности. «Скрытое замещение» — это работа, которую раньше выполняли люди, а теперь выполняет ИИ: около 1,5 триллиона долларов в виде задач, которые современный ИИ может автоматизировать или существенно ускорить. «Новое скрытое производство» — это работа, которая раньше просто не выполнялась, поскольку была слишком дорогой: когда стоимость библиографического обзора снижается с 2000 до 2 долларов, человек не просто выполняет такое же количество обзоров и экономит деньги, а делает их перед каждым совещанием, перед каждым интервью, перед каждым решением. Со временем этот второй тип результатов будет приобретать всё большее значение. «Существует интересный методологический прецедент, о котором упоминают Спиттлер и Патель: это гендерная экономика. В 1988 году новозеландская экономистка Мэрилин Уэринг продемонстрировала, что в составе комитетов, разработавших Систему национальных счетов, 91,7 % составляли мужчины, и что всего одной фразой в основополагающем документе весь объем домашнего труда — воспитание детей, уход за больными, ведение домашнего хозяйства — был отброшен как «имеющий незначительное или никакое значение», причем объем этого труда МОТ впоследствии оценила в 11 триллионов долларов в год. Проблема системы измерения заключалась не в технических аспектах: проблема заключалась в том, что именно она решала учитывать».