Парадокс дня рождения: почему вероятность встретить кого-то с вашим днем рождения выше, чем вы думаете
Аргентина 2023-09-02 00:40:57 Телеграм-канал "Новости Аргентины"
Если вы находитесь в комнате с 22 другими людьми, то вероятность того, что у двоих из них будет общий день рождения, выше, чем у всех остальных". "Было что-то странное в женском чемпионате мира по футболу, который только что прошел в Австралии. Если вы были достаточно внимательны, вы вдруг поняли. Во многих международных командах игроки родились в один и тот же день года, т.е. у них был общий день рождения. "Что же происходит?" Существует контринтуитивное явление, известное как "проблема дня рождения" или "парадокс дня рождения", которое математики используют, чтобы удивить нас. Обычно проблема представляется следующим образом: "Сколько человек должно быть на мероприятии, чтобы вероятность того, что у кого-то из них есть общий день рождения, увеличилась более чем на 50%?". Первоначально, когда эта проблема ставится, люди склонны называть число типа 180, что составляет примерно половину количества дней в году. Это связано с тем, что мы склонны представлять себя в комнате и думать о вероятности того, что кто-то совпадет с нашим днем рождения. Но на самом деле 180 - это слишком много. "Если разумно предположить, что дни рождения в целом равномерно распределены в течение года, то ответ - всего 23 человека. Это связано с тем, что нам не важно, на какой именно день выпадает день рождения, мы просто хотим знать, есть ли такое совпадение. К моменту, когда мы достигаем 39 человек, вероятность того, что у двух человек будет одинаковый день рождения, возрастает почти до 90%. "Чтобы понять, почему требуется такое низкое число, мы могли бы начать с рассмотрения количества пар людей в комнате: ведь нас интересуют пары дней рождения, приходящиеся на один и тот же день. Если в комнате находится 23 человека, то существует 253 возможных способа объединить их в пары (как на схеме ниже). Точный расчет вероятности совпадения несколько сложнее, но в лучшем случае, когда мы понимаем, что 23 человека дают нам 253 пары, вероятность того, что хотя бы у одной из этих пар совпадает день рождения, возрастает более чем до 50%. Если в группе более 50 человек, то вероятность того, что у кого-то есть общий день рождения, возрастает более чем до 97%. "Теоретически все понятно, но работает ли это на практике? В женском чемпионате мира 2023 года участвуют 32 команды, в каждой из которых ровно по 23 игрока. Проанализировав полученные данные, я обнаружил, что в 17 (чуть более половины) из 32 команд есть как минимум два игрока, у которых день рождения совпадает. Возможно, это не совсем соответствует теории, но цифра достаточно близка к 17, которые мы могли бы ожидать в среднем, если бы эксперимент повторялся в разных случаях. "Примечательно, что только одна пара родилась в точно такой же день того же года (5 декабря 2000 г.) - панамцы Кармен Монтенегро и Линет Седеньо. У трех команд (Бразилия, Колумбия и Дания) было по две пары общих дней рождения, а у двух других (Марокко и Нигерия) - по три общих дня рождения. У одной из нигерийских пар (с особенно рождественскими именами - Глори Огбонна и Кристи Учейбе) вторая по частоте встречаемости дата среди всех команд - Рождество, которое разделяют семь человек на турнире. "Во втором полуфинале в паре с Хлоей Келли (Англия) столкнулись даты рождения: у Алекса Чидиака (Австралия) и Хлои Келли (Англия) - двух игроков, вышедших на замену в конце матча, - день рождения 15 января, хотя Келли старше Чидиака ровно на год. "Полузащитник сборной Англии Джордан Ноббс и ее соперница, испанская нападающая Эстер Гонсалес, родились в один и тот же день - 8 декабря 1992 года. Несмотря на то, что они были в своих командах, ни один из них не играл во время финала. "Всего я определил 24 пары дней рождения в командах (по совпадению, на одну больше, чем магическое число 23), поэтому "рассуждения о днях рождения" предполагают, что между этими парами также - вероятно - есть пара пар. И действительно, 3 марта - день рождения как датской пары (Симона Бойе Сёренсена и Луны Гевитц), так и колумбийской (Сандры Сепульведы и Дианы Оспины Гарсии). В итоге 3 марта оказалось самым распространенным днем рождения среди всех команд: эту дату разделили девять игроков. "Помимо футбола, те же самые рассуждения о "проблеме дня рождения" помогают объяснить кажущиеся парадоксы в других дисциплинах. В 2011 году в ходе поиска в базе данных ДНК штата Аризона (насчитывающей более 65 493 образцов) было обнаружено частичное совпадение двух неродственных профилей ДНК (не имеющих родственных связей). Для двух неродственных людей такой результат можно было бы ожидать только один раз из 31 млн. пар изученных профилей. "Это неожиданное открытие, о котором исследователи рассказали на научной конференции, послужило толчком к масштабному поиску таких совпадений. Путем сравнения всех профилей в базе данных было выявлено 122 пары людей с аналогичным (или более высоким) уровнем совпадения. "Адвокаты в разных частях США. Опираясь на это исследование, они ставят под сомнение уникальность ДНК-идентификаторов и призывают провести аналогичные сравнения в других базах данных ДНК, включая национальную, которая содержит более 11 млн. образцов. "Если 122 совпадения оказались в такой маленькой базе данных, как одна из 65 тыс. человек, то можно ли рассчитывать на то, что ДНК действительно поможет идентифицировать отдельных подозреваемых в стране с населением 300 млн. человек? Являются ли вероятности, связанные с ДНК-профилированием, ошибочными, что поставит под угрозу обвинительные приговоры, вынесенные на основе ДНК-доказательств? Некоторые адвокаты считают, что это так, и даже используют результаты, полученные в Аризоне, чтобы поставить под сомнение силу ДНК-доказательств в делах своих подзащитных: "На самом деле, мы можем посчитать и сказать, что если сравнить между собой 65 493 образца из базы данных Аризоны, то это даст нам в общей сложности более 2 млрд. уникальных пар. При вероятности совпадения, равной единице на каждые 31 млн. пар несвязанных профилей, мы должны найти 68 частичных совпадений. Разница между ожидаемыми 68 и полученными 122 легко объясняется наличием в базе данных профилей близких родственников. Профили родственников, как правило, показывают частичные совпадения гораздо чаще, чем профили неродственных родственников. Вместо того чтобы заставить нас сомневаться в доказательствах ДНК, результаты базы данных очень хорошо согласуются с "математикой дня рождения": "Неожиданно большое число парных комбинаций, которые представляют проблемы, подобные проблеме дня рождения, обычно являются той силой, которая, по-видимому, позволяет очень маловероятным событиям, происходящим по чистой случайности, быть жизнеспособными. Следует помнить, что в подобных ситуациях, когда существует достаточно возможностей для наступления события, даже если вероятности его наступления невелики, они могут объединиться и сделать крайне маловероятные события крайне вероятными".