Пример ошибки в понимании вероятности. Ниже представлен хорошо известный тест, смущающий медицинскую профессию. Следующий вопросник предлагался докторам медицины. Болезнь затрагивает 1/1000 часть населения. Тест на заболевание дает 5% ложных положительных результатов. Люди проверяются наугад, независимо от того, подозреваются ли они в наличии болезни. Тест пациента положителен. Какова вероятность, что пациент поражен болезнью? Большинство докторов ответило, что 95%, просто принимая во внимание факт, что испытание имеет степень точности 95%. Ответом является условная вероятность, что пациент является больным, и тест это показывает – близко к 2%. Меньше чем один из пяти профессионалов ответил верно. Поясню правильный ответ. Предположим, что нет ложных отрицательных результатов теста. Из 1000 пациентов, которые проходят тест, ожидается один заболевший. Из оставшихся 999 здоровых пациентов, тест выделит приблизительно 50 с болезнью (это 95%-ная точность). Правильным ответом должно быть то, что вероятность быть заболевшим для кого-то, отобранного наугад, и чей тест является положительным, определяется следующим отношением: Число заболевших людей / Число истинных и ложных положительных результатов теста. Здесь 1 к 51!
1. Есть фактор, который присутствует у 1 из 1000.
Здравый смысл подсказывает, что вероятность равна 95%. Кому верить?
John Horgan Теорема Байеса:
из-за чего весь сыр-бор?
Сначала надо понять как получаются эти 2%. Для этого приведем данные в один масштаб.
Возьмем 100 000 человек. Больных здесь будет 100 человек (0.1% = 1 на 1000).
Итого тест дает положительный диагноз в 4995+95=5 090 случаев на 100
000 тестов. 100 реальных больных / 5090 положительных тестов = 0.0196 = примерно 2% что человек болен на один положительный тест.
Без теста вероятность оказаться больным равна 0.1%.
А если два теста подряд дали диагноз? б) Но проблема! в том, что с большой вероятностью тот же тест даст тот же результат для того же человека. Что заставляет нас предположить, что первичная вероятность единичного теста либо близка к заявленным 95%, либо что тест и конкретный человек не являются случайной парой. Пока вы обдумываете ситуацию, обратим внимание на первичное восприятие задачи. Интуиция подсказывает нам 95%, а формула Байеса говорит о 2%. Дело в том, что в задаче надо учитывать и больных и здоровых, и истинные результаты и ложные – в целостном балансе. И интуиция - зачарованная больными и фактами - дает сбой. Почти в 40 раз, если сравнивать чисто арифметически. А если считать результаты конкретными объемными показателями, то линейные ошибки вырастают в 1000 раз. Другими словами, стремление к истине с одновременным фокусированием на зле/болезни/минусах дает нам ошибки интуиции в разы, десятки, сотни и тысячи раз. Это касается как диагностики болезней, так и оценки людей, так и критики их идей и результатов их деятельности. Например, судебное следствие (то есть сторона обвинения, у которой на руках все административные козыри) настроена однозначно на поиск вины, хотя и прикрывается разговорами о версиях и мотивах. Формула Байеса прямо указывает, что здесь равное внимание следует уделить пострадавшей стороне с ее свидетелями (стороне обвинения). То же следует делать при оценке любого спора.
Возвращаемся к новой проблеме. Это физическая связь теста и
тестируемого, в основе которой лежит физическая неопределенность
самого теста и его модельной внутренней структуры. Это физическая
неопределенность самих измерений и неопределенность используемой
модели интерпретации измерения. Например, электронные микроскопы
"видят" только волновые всплески тени того, что они просвечивают.
При этом там сложный механизм фокусировки потока электронов и
обратной развертки результатов в изображение. В общем, надо иметь
высшее образование и еще год учиться, чтобы работать с современным
электронным микроскопом. Можно обнаружить неопределенность и прямо.
Вот фото одного из новейших микроскопов. В описании
http://www.membrana.ru/particle/14168 сказано, что в кружочках
атомы урана. Также сказано, что разрешение микроскопа 0.1 нм. При
этом диаметр атома урана составляет 0.25 нм (что соответствует
картинке и разрешению микроскопа), а вот
диаметр ядра Урана В медицинских тестах и умственных экспериментах "физика" куда более грубая. И физическая связь теста и тестируемого довольно сильная. Так что вполне можно предположить, что в исходной задаче здравый смысл куда ближе к истине, чем теория вероятности с ее идеальными независимостями. Но если мы изменим модельную базу и физическую основу теста, то обеспечим реальную независимость и по результатам двух тестов можем диагностировать искомый фактор практически со 100%-ной точностью.
Почему же медики не протестуют против доводов математиков? Потому что проблема в полноте картины. Как и в формуле Байеса. Только здесь необходимо добавить реальную неопределенность - физики измерений и научной модели. С физикой измерений на таком грубом уровне похоже проблем немного. А вот с научной моделью большой вопрос. Если медики помалкивают, стало быть реальная погрешность академических методов и моделей сопоставима с парадоксальными оценками по формуле Байеса – разница между здравым смыслом и математикой в разы и десятки раз.
------------------------------------------- Замечания. • Статистика - широкое раздольное поле для манипулирования результатами с помощью формулы Байеса. • Политика, экономика, психология....... Эффекты приятных обещаний и плацебо.
• Важность позитива и
рассмотрения со всех сторон. • Судебная система. • Бытовые, дружеские и любовные споры..... • Паранойя обыденная. У одного человека пропал топор. Подумал он на сына своего соседа и стал к нему приглядываться: ходит, как укравший топор, глядит, как укравший топор, говорит, как укравший топор, – словом, каждый жест, каждое движение выдавало в нем вора. Но вскоре этот человек стал копать землю у себя в саду и нашел топор. На другой день он снова увидел сына своего соседа: ни жестом, ни взглядом, ни движением не походил тот на вора. • Физическая неопределенность модели (ее расхождение с материальным объектом) в целом подчиняется познавательной логике. Здесь можно выделить 4 уровня неопределенности и соответствующее число независимых неучтенных факторов, которые определяют неопределенность модели и соответствующих экспериментов. То есть на первом уровне неопределенности достаточно учесть еще один фактор. На втором - вероятностную пару факторов. На третьем - качественную объемную волну трех факторов. На четвертом - фоновую неустранимую энтропию четырех факторов. • Проблема в том, что эти факторы находятся вне зоны научных знаний, а точнее - в тени известных моделей. И требуют таланта для их открытия. • Но можно полагать, что обычно эта неопределенность составляет 2-3 независимых фактора. Отсюда можно предположить, что в исходной задаче вероятность наличия фактора при положительном тесте составит 30-40%. Тесты на качественно другой модельной основе пропорционально будут увеличивать точность диагноза. • В общем вспоминаем 4 принципа Декарта.
Подобно тому как обилие законов нередко дает повод к оправданию
пороков и государство лучше управляется, если законов немного, но
они строго соблюдаются, так и вместо большого числа правил,
составляющих логику, я заключил, что было бы достаточно четырех
следующих, лишь бы только я принял твердое решение постоянно
соблюдать их без единого отступления.
|
Посмотрим как обстоит дело в международной академической науке.
Так как история переполнена эмоциональной нетерпимостью, то лучше
начать с примеров физических. • Понятие энергии и закон ее сохранения наполовину фиктивны. А
ведь это центральная скрепа всего современного естествознания. • 95% физических сущностей в макромире и микромире носят воображаемый/виртуальный характер. Ненаблюдаемый никакими приборами. |
John Horgan
|
«» ~ ≈ ≠ ± × ÷ ° •