Книга: Достучаться до небес: Научный взгляд на устройство Вселенной
ГЛАВА 12. ИЗМЕРЕНИЕ И НЕОПРЕДЕЛЕННОСТЬ
<<< Назад ПРОГНОЗИРОВАНИЕ |
Вперед >>> НЕОПРЕДЕЛЕННОСТЬ ПО–НАУЧНОМУ |
При оценке научных измерений полезно быть на короткой ноге со статистикой и теорией вероятностей. Мне напомнил о пользе вероятностных рассуждений один случай. Несколько лет назад на вопрос, пойду ли я завтра на некое мероприятие, я честно ответила: «Не знаю». Приятель, разочарованный таким ответом, был, по счастью, любителем математики. Так что вместо того, чтобы долго и нудно настаивать на определенном ответе, он попросил меня назвать вероятности того и другого. К собственному удивлению я обнаружила, что ответить на вопрос в такой формулировке намного проще. Хотя названные мной вероятности были всего лишь грубой оценкой, они более точно отражали мои сомнения и неуверенность, чем любое «да» или «нет». В конце концов, такой ответ показался мне куда более честным.
С тех пор я неоднократно пробовала вероятностный подход на друзьях и коллегах в случаях, когда они вроде бы не могли ответить на мой вопрос. Оказалось, что большинству людей нередко проще ответить на вопрос не однозначно, а через вероятности. Человек может не знать, захочет ли он пойти на бейсбольный матч в четверг через три недели. Но если он уверен в том, что ему нравится бейсбол, и не ожидает в ближайшее время командировок, однако сомневается, потому что день будний, он может сказать, что пойдет с вероятностью 80%, хотя и не может гарантировать. Хотя это всего лишь оценка, но названная вероятность — даже такая, которую он просто придумал на месте — более точно отражает реальные ожидания человека, чем простой ответ «да» или «нет».
В разговоре о науке и о том, как действуют ученые, сценарист и режиссер Марк Висенте заметил, что его в свое время поразило, что ученые не любят делать слишком определенные, без всяких оговорок, заявления, которые большинство обычных людей делает не задумываясь. Ученые не обязательно очень уж красноречивы, но они всегда стремятся точно сказать, что они знают, а чего не знают или не понимают, по крайней мере в своей научной области. Они редко говорят «да» или «нет», потому что такой ответ не может точно отразить весь спектр возможностей. Вместо этого они говорят о вероятностях либо ограничивают свои заявления определенными условиями. По иронии судьбы, из?за такой разницы в языке люди часто неверно понимают заявления ученых или преуменьшают их значение. Несмотря на то что ученые стремятся объяснить все как можно точнее, неспециалисты зачастую просто не знают, как интерпретировать их заявления: ведь любой неученый, имея столько свидетельств в пользу своего тезиса, без колебаний сказал бы что?нибудь более определенное. Но для ученого отсутствие 100%-ной вероятности не означает отсутствия знания. Это всего лишь следствие неопределенностей, изначально присущих любым измерениям. Вот об этом мы с вами сейчас и поговорим. Вероятностное мышление помогает уяснить смысл того или иного явления и позволяет принимать взвешенные решения. В этой главе мы подумаем о том, что говорят нам измерения, и разберемся, почему именно вероятностные заявления наиболее точно отражают состояние знаний — научных или любых других — в любой конкретный момент времени.
НЕОПРЕДЕЛЕННОСТЬ ПО–НАУЧНОМУ
В Гарварде недавно прошел диспут, посвященный попыткам определить важнейшие элементы современного образования. Одной из обсуждавшихся категорий (по существу, частью обязательных научных требований) были «эмпирические рассуждения». Предложение состояло в том, что университет должен ставить перед собой цель «научить студентов собирать и оценивать эмпирические данные, взвешивать доказательства, разбираться в оценках и вероятностях, делать выводы из имеющихся данных [пока все нормально —Л. Р.], а также распознавать ситуации, в которых вопрос не может быть разрешен на базе имеющихся свидетельств».
Предложенная формулировка — позже она была изменена — была составлена с самыми лучшими намерениями, но содержала в корне неверное представление о том, как работают измерения, то есть экспериментальные данные. Как правило, наука решает вопросы с определенной степенью вероятности. Конечно, мы можем достичь высокой степени уверенности в каком?то вопросе или наблюдении и высказывать здравые суждения. Однако редко человеку удается решить вопрос полностью — научный или иной — на основании прямых доказательств. Мы можем набрать достаточно данных, чтобы можно было доверять причинно-следственным связям, можем делать необычайно точные предсказания, но, как правило, все они делаются с определенной степенью вероятности. Как говорится в главе 1, неопределенность, даже маленькая, допускает потенциальное существование новых интересных явлений, которые еще надо открыть. Мало что известно со 100%-ной точностью, и ни одна теория или гипотеза не будет гарантированно действовать в условиях, в которых еще не проводились никакие испытания.
В измерения всегда входит некоторый вероятностный компонент. Многие научные измерения опираются на предположение о том, что те или иные явления основаны на существующих физических закономерностях, которые можно открыть при помощи достаточно точных и тщательных измерений. При помощи измерений мы стараемся найти эти физические закономерности. Затем мы можем утверждать, что некий интервал, в пределах которого лежат наши измерения, содержит истинную величину измеряемого параметра с вероятностью 95%. В этом случае мы могли бы сказать, что уверены на 95%. Подобные вероятности сообщают нам достоверность любого конкретного измерения, а также полный спектр возможностей и следствий. Невозможно до конца понять смысл измерения, не зная и не оценивая связанных с ним неопределенностей.
Один из источников неопределенности — то, что в природе не существует абсолютно точных измерительных инструментов. Для измерений абсолютной точности потребовалось бы устройство, откалиброванное с точностью до бесконечного числа десятичных знаков. Экспериментаторы не в состоянии проводить такие измерения — они могут калибровать свои инструменты лишь с той точностью, которую допускают современные технологии. Чем более развиты технологии, тем точнее измерительные устройства. При всем при том измерения никогда не достигнут абсолютной точности, до каких бы вершин не поднялась техника. Некоторая систематическая погрешность, или неопределенность[41], присущая самому измерительному устройству, останется всегда.
Вездесущая неопределенность не означает, что ученые воспринимают все варианты или заявления одинаково (хотя средства массовой информации частенько совершают эту ошибку). Вероятность 50 на 50 в реальной жизни встречается очень редко. Однако все это значит, что ученые (или любой человек, стремящийся к идеальной точности) в своих заявлениях сообщают, что именно было измерено и что это означает в вероятностном смысле, даже если вероятности очень высоки.
Когда ученые и журналисты очень аккуратно выражают свои мысли, они используют в разных значениях два, казалось бы, близких слова: прецизионность и точность. Некое устройство считается прецизионным, если при повторных измерениях одной и той же величины полученные значения не будут слишком сильно отличаться друг от друга. Таким образом, прецизионность — мера уровня изменчивости и схожести результатов. Если результаты повторных измерений отличаются не сильно, то измерения прецизионны. Измеренные таким образом величины дают меньший разброс значений, поэтому среднее значение при повторных измерениях будет сходиться быстрее.
Точность, с другой стороны, говорит о том, как далеко полученное вами среднее значение отстоит от правильного результата. Иными словами, она говорит о том, вносит ли измерительная установка смещение и насколько измерения достоверны. С технической точки зрения ошибка, присущая измерительному устройству, не ухудшает его прецизионности — ведь ошибка каждый раз будет одна и та же, — хотя, безусловно, вредит точности собственно измерения. Систематическая погрешность характеризует неустранимое отклонение от истинного значения, присущее самим измерительным устройствам.
Тем не менее во многих ситуациях даже при наличии идеального измерительного инструмента вам придется проводить многократные измерения, чтобы получить корректный результат. Дело в том, что существует еще один источник неопределенности[42] — статистический; это означает, что измерения необходимо проводить многократно, чтобы результатам можно было доверять. Даже точное измерительное устройство не всякий раз будет давать верное значение, а вот среднее значение при многократных измерениях сойдется к верному ответу. Систематическая погрешность управляет точностью измерений, тогда как статистическая погрешность влияет на их прецизионность. В идеале измерения должны быть и точными, и прецизионными; тогда ожидаемая абсолютная погрешность будет мала, а полученным величинам можно будет доверять. Иначе говоря, вы должны желать, чтобы они лежали в как можно более узком диапазоне (прецизионность) и сходились в конце концов к верному результату (точность).
Приведем знакомый и весьма важный пример, на котором можно практически рассмотреть все приведенные понятия, — испытания эффективности лекарственных средств. Врачи часто не хотят раскрывать (а может быть, и не знают) соответствующую статистику. Случалось ли вам испытывать острое разочарование от слов: «Иногда это лекарство помогает, а иногда нет»? Подобное заявление скрывает от вас массу полезной информации. Так, в нем ничего не говорится о том, как часто это лекарство срабатывает и насколько статистически та часть населения, на которой его испытывали, схожа с вами. После такого заявления очень трудно принять решение. Гораздо лучше было бы, если бы вам сказали, как часто это лекарство помогает людям, близким к вам по возрасту и физическому состоянию.
Разные люди по–разному реагируют на одни и те же лекарства, и это очень усложняет вопрос о том, как подействует то или иное лекарство на конкретного человека. Давайте для начала рассмотрим более простой случай и представим, что мы проводим испытания на одном человеке. В качестве примера возьмем аспирин и проверим, помогает ли он от головной боли.
Кажется чего проще: взять аспирин и посмотреть, сработает ли он. Но на самом деле все немного сложнее. Даже если вам стало лучше, откуда вы можете знать, что вам помог именно аспирин? Чтобы убедиться в этом, то есть понять, уменьшилась ли боль быстрее, чем без лекарства, вам нужно было бы сравнить самочувствие с ним и без него. Однако, поскольку вы либо приняли аспирин, либо нет, одного измерения будет недостаточно, чтобы получить ответ на вопрос.
Но способ получить его существует. Для этого нужно провести эксперимент много раз. Всякий раз, когда у вас заболит голова, вам следует бросить монетку и принять случайное решение о том, принимать на этот раз аспирин или нет. Результат, естественно, нужно зафиксировать. После достаточного количества испытаний вы сможете усреднить свои данные по различным типам головной боли и сопутствующим обстоятельствам (возможно, боль проходит быстрее, если вы накануне хорошо выспались); статистика поможет вам получить верный результат. Вероятно, в ваших измерениях не будет систематической погрешности, поскольку решение о приеме лекарства вы принимали на основании броска монетки, а выборка состоит из вас одного, поэтому результаты при достаточном количестве испытаний будут корректными.
Было бы здорово, если бы любое лекарство можно было испытать посредством такой простой процедуры. Однако большинство лекарств используется при лечении более серьезных заболеваний, чем головная боль, иногда даже смертельно опасных. А у многих лекарств есть долгосрочные последствия, поэтому провести много коротких испытаний на одном человеке невозможно, даже если очень хочется.
Так что обычно, когда биологи или врачи хотят проверить, насколько хорошо действует лекарство, они не испытывают его на одном–единственном человеке, хотя с точки зрения науки такой вариант был бы оптимальным. Им приходится мириться с тем фактом, что люди по–разному реагируют на один и тот же препарат. Любое лекарство дает целый спектр реакций, даже если пробуют его на группе людей с одним заболеванием одной и той же степени тяжести. Поэтому лучшее, что могут в большинстве случаев сделать ученые, — это разработать программу испытаний для группы людей, как можно сильнее похожих на того человека, которому они в будущем намерены давать или не давать данное лекарство. На самом деле врачи, как правило, не планируют эксперименты сами, так что сходство с реальным пациентом гарантировать трудно.
Иногда вместо этого врачи используют уже существующие результаты, где никто не проводил тщательных испытаний, а просто собраны данные наблюдений за существующими группами людей, такими как жильцы одного дома. Затем им придется столкнуться с проблемой правильной интерпретации результатов. С такими исследованиями иногда трудно бывает гарантировать, что проведенные измерения отражают причинно–следственные связи, а не случайные совпадения или корреляции. Так, заметив у многих пациентов с раком легких желтые пальцы, можно сделать ошибочный вывод о том, что именно желтизна пальцев — причина рака легких.
Поэтому ученые предпочитают исследования, в которых методы лечения или дозы назначаются случайным образом. К примеру, исследование, в котором люди будут принимать лекарство по результатам броска монетки, будет меньше зависеть от выборки: ведь то, будет ли данный пациент принимать препарат, полностью зависит от случая. Точно так же при помощи рандомизированного исследования можно установить связь между курением, раком легких и желтизной пальцев. Если бы можно было случайным образом предписать, кто из членов группы будет курить, а кто нет, вы бы поняли, что курение — это по крайней мере один из факторов и желтизны пальцев у пациентов, и рака легких; при этом не важно, является ли одно причиной другого. Но, разумеется, такой эксперимент был бы неэтичным.
Везде, где это возможно, ученые стремятся упростить систему и выделить таким образом те специфические явления, которые хотят изучить. И для точности, и для прецизионности результата очень важен подбор как группы испытуемых, так и контрольной группы. Такой сложный параметр, как действие лекарства на биологию человека, определяется одновременно множеством факторов. Очень важно также, насколько достоверные результаты исследования нам нужны.
С КАКОЙ ЦЕЛЬЮ ПРОВОДЯТСЯ ИЗМЕРЕНИЯ?
Измерения не могут быть идеальными. В научных исследованиях — как и при принятии любого решения — нам приходится определять для себя приемлемый уровень неопределенности. Только в этом случае можно двигаться вперед. К примеру, если вы принимаете лекарство и надеетесь, что оно облегчит вам сильную головную боль, то вам, возможно, достаточно знать, что это лекарство помогает обычному человеку в 75% случаев. С другой стороны, если изменение стиля питания ненамного снизит ваши и без того невысокие шансы заболеть чем?нибудь сердечно–сосудистым (к примеру, с 5 до 4,9%), этого может оказаться недостаточно, чтобы убедить вас отказаться от любимых пирожных.
В политике точка принятия решения еще менее определенна. Как правило, общество смутно представляет, насколько хорошо нужно изучить вопрос, прежде чем менять законы или накладывать ограничения. Необходимые расчеты здесь осложнены множеством факторов. Как говорилось в предыдущей главе, из?за неоднозначности целей и методов провести сколько?нибудь достоверный анализ «затраты — прибыли» очень сложно, а иногда вообще невозможно.
Колумнист The New York Times Николас Кристоф, ратуя за осторожность в обращении с потенциально опасными химическими веществами типа бисфенол–А (ВРА) в пище или пищевой упаковке, писал: «Исследования ВРА уже несколько десятков лет бьют тревогу, а данные до сих пор сложны и неоднозначны. Такова жизнь: в реальном мире законодательные меры, как правило, приходится принимать на основании неоднозначных и спорных данных».
Ничто из сказанного не означает, что нам не следует, определяя политический курс, стремиться к количественной оценке затрат и выгод. Однако ясно, что нам нужно четко понимать, что означает каждая оценка, как сильно она может меняться в зависимости от начальных предположений или целей, а также что при расчетах было и что не было принято во внимание. Анализ «затраты — выгоды» может быть полезен, но может и дать ложное ощущение конкретности, надежности и безопасности, которое зачастую приводит к опрометчивым решениям.
К счастью для нас, физики, как правило, ставят перед собой вопросы попроще, чем те, что приходится решать публичным политикам. Имея дело с чистым знанием, которое в ближайшее время не предполагается использовать на практике, думаешь совершенно о другом. Измерения в мире элементарных частиц тоже намного проще, по крайней мере теоретически. Все электроны по природе своей одинаковы. Проводя измерения, приходится думать о статистической и системной погрешности, зато о неоднородности популяции можно спокойно забыть. Поведение одного электрона дает нам достоверную информацию о поведении всех электронов. Тем не менее представления о статистической и системной погрешности применимы и здесь.
Однако даже в «простых» физических системах необходимо заранее решить, какая точность нам необходима, ведь идеальных измерений не бывает. На практике вопрос сводится к тому, сколько раз экспериментатор должен повторить измерение и насколько прецизионный измерительный прибор при этом использовать. Решение за ним. Приемлемый уровень неопределенности определяется задаваемыми вопросами. Разные цели предполагают разные уровни прецизионности и точности.
К примеру, атомные часы измеряют время с точностью до одной десятитриллионной, но такое точное представление о времени мало кому нужно. Исключение — эксперименты по проверке теории гравитации Эйнштейна: в них лишней прецизионности и точности быть не может. До сих пор все тесты показывают, что эта теория работает, но измерения непрерывно совершенствуются. При более высокой точности могут проявиться невиданные до сих пор отклонения, представляющие новые физические эффекты, которые невозможно было заметить в ходе прежних, менее точных экспериментов. Если это произойдет, то замеченные отклонения позволят нам заглянуть в царство новых физических явлений. Если нет, придется сделать вывод о том, что теория Эйнштейна даже точнее, чем было установлено ранее. Мы будем знать, что ее можно уверенно применять в более широком диапазоне энергий и расстояний, к тому же с большей точностью.
Если же нам нужно «всего лишь» доставить человека на Луну, то мы, естественно, не обойдемся без знания физических законов, достаточного, чтобы не промахнуться, но привлекать общую теорию относительности не обязательно, и уж тем более не требуется принимать во внимание еще более мелкие потенциальные эффекты, представляющие возможные отклонения от нее.
<<< Назад ПРОГНОЗИРОВАНИЕ |
Вперед >>> НЕОПРЕДЕЛЕННОСТЬ ПО–НАУЧНОМУ |
- НЕОПРЕДЕЛЕННОСТЬ ПО–НАУЧНОМУ
- Истинная неопределенность
- Глава 18 Подразним квантовый призрак Загадочный вопрос с измерением, и как плохо мы исследуем квантовую волновую функцию
- § 12. Ориентирование и измерение расстояний на местности
- § 11. Измерение времени
- Измерение естественного отбора сравнением последовательностей ДНК
- § 7 Измерение
- § 15 Измерение времени. Часы
- Измерение скорости света.
- 129. Когда было впервые произведено измерение глубины в открытом океане?
- Время как четвертое измерение
- Пятое измерение