1. Введение
До сих пор мы выявили четыре принципиальных этапа анализа основной задачи принятия решения, поставленной перед вами в этих лекциях^
Этап 1. Построить диаграмму рещений.
Этап 2.
Выписать денежные платежи или оценки полезностей на концах ветвей этой диаграммы.Этап 3. Оценить вероятности на всех случайных развилках.
Этап 4. Провести усреднение и свертывание.
Назовем эту четырехшаговую процедуру развернутой формой анализа. Если по тем или иным причинам вам не захо^тся оценивать некоторые субъективные вероятности, как это требуется на этапе 3, вы не сможете перейти к этапу 4. Существует другой вид анализа, так называемый анализ в нормальной форме, в котором не обязательно (по крайней мере в начале) приписывать вероятности всем случайным развилкам. При этой форме анализа мы стараемся *по возможности дольше обходиться без использования субъективных вероятностей. Эти субъективные вероятности могут быть введены в схему, если они вообще будут введены в нее, лишь в самую последнюю очередь. Поэтому с помощью анализа в нормальной форме мы можем выяснить, как далеко удается зайти без применения субъективных вероятностей, и, кроме того, с его помощью мы еще раз продемонстрируем достоинства их использования.
Вряд ли стоит особо доказывать, что слабое звена в любой цепочке аргументов никогда не должно быть в самом начале. Если вы несколько косо смотрите на субъективные вероятности, то вам придется отказаться от процедуры усреднения и свертывания в развернутой форме анализа, где без нее не обойтись. Вы можете чувствовать, что потеряли контроль за принятием решения, что математика может теперь заставить вас делать любую бес-
смыслицу, а у вас не будет никакой возможности понять это. Из тактических соображений было бы лучше, если бы вы применяли свои субъективные вероятности лишь в самом, конце так, чтобы ощущать себя полностью объективно контролирующим ситуацию.
Однако в том случае, когда вы заканчиваете свой анализ в нормальной форме заключительным введением субъективных вероятностей (что, как я
Рис. 6.1.
\
постараюсь доказать, вам и следует сделать), с помощью простого математического упражнения можно показать, что вы придете к тому же самому решению (не учитывая, естественно, арифметические ошибки, которые вы могли бы допустить), как если бы вы ввели свои субъективные вероятности.в самом начале и использовали развернутую форму анализа.
Для удобства на рис. 6.1 представлены ветЕи е0 и ег диаграммы решений. Заметим, что на этой диаграмме у нас семь случайных ходов и что вероятностные оценки любого из них прямо или косвенно требуют оценок для
Р*(0х) и Р*(02). Вероятностные оценки |0Х),
P(i?|02), |02) не появляются явно на диаграмме реше
ний. При нормальной форме анализа мы будем пользоваться этими последними четырьмя оценками, которые относятся к числу объективных. По до самого последнего момента мы обойдемся без помощи P*(0i) и Р*(02).
До того как мы начнем формальное описание анализа в нормальной форме, вам будет полезно обратиться к рис. 2ЛЗ. В пояснениях к этому рисунку мы доказывали, что наилучшая стратегия экспериментирования и действий состоит в том, чтобы выбрать es1 вынимать второй
Прекратить^
Рис. 6.2. Оптимальная стратегия для объективиста.
шар в том и только в том случае, когда первый был красным, не возвращать первый шар перед второй пробой и поступить в соответствии с а2 тогда и только тогда, когда оба шара красные. Рис. 6.2 описывает эту стратегию гораздо более четко. Это лишь одна из многих возможных стратегий, которые в вашем распоряжении, но она,оказывается лучшей для объективиста, когда Р(0Х) = 0,8.
В нормальной форме анализа мы начнем с того, что рассматриваем всевозможные стратегии для экспериментирования и действий. Грубо говоря, стратегия — это правило принятия решения, которое вы можете сообщить своему агенту; правило, которое содержит однозначные инструкции о том, что нужно делать в любой момент времени и при любых обстоятельствах. По поводу каждой подобной стратегии мы спросим: Насколько хороша именно эта стратегия, если окажется, что истинное состояние 0г? А если 02? Если мы увидим, что стратегия А лучше стратегии В независимо от того, истинно 0Х или 02, мы просто будем говорить, что А вообще лучше, чем В. Если А лучше, чем В при 0Х, а В лучше, чем А при 02, то получается ситуация, как при перетягивании каната, мы долж-
0Ы будем думать о том, на сколько одна стратегия лучше другой* когда истинно 0Х или 02. Но в конце мы увидим, что даже после того, как мы провели весь этот анализ, мы не в состоянии выбрать «лучшую» стратегию в каком-либо объективном смысле. Мы, однако, сможем выделить множество неподчиненных стратегий. А чтобы сделать больше, чтобы выделить из этого множества одну конкретную стратегию, заслуживающую эпитета «наилучшей», мы должны будем ввести несколько субъективных оценок.
Эта глава довольно длинная, и, поскольку некоторые доказательства более запутанные, чем в предыдущих главах, естественно задать вопрос, стоит ли тратить силы на эти идеи? Пока что я обещал вам только, что
а) анализ в нормальной форме позволит делать то же, что способен дать и анализ в развернутой форме;
б) используя нормальную форму, мы сможем увидеть, как далеко можно зайти в своих рассуждениях, не вводя субъективные вероятности состояния, и
в) анализ в нормальной форме даст мне возможность привести дополнительные доводы в пользу субъективных вероятностей.
Однако существуют другие, не менее убедительные причины для введения нормальной формы анализа, причины, которые я сейчас сжато перечислю.
г) С помощью анализа в нормальной форме мы можем эффективно использовать всякого рода пороговые соображения, которые накладывают менее жесткие ограничения на численные представления ваших суждений. Например, вместо того чтобы спрашивать о конкретном значении Р*(0Х), нормальная форма анализа позволит задавать вопрос, считаете ли вы, что истинная пропорция урн типа 0Х лежит в одном численном интервале скорей, чем в другом. При этом каждому такому интервалу будет поставлена в соответствие некоторая наилучшая стратегия экспериментирования и действий.
д) Предположим,, что V — это ценность, которую при
нимающий решение приписывает новой игре или задаче принятия решения при неопределенности. Например, объективист припишет нашей основной задаче V = 31,15 доллара, если = 0,8. Значение V будет зависеть
от субъективных вероятностей, которые принимающий решение приписывает состояниям задачи. С помощью 12*
нормальной формы анализа мы исследуем, насколько эта величина V чувствительна к изменениям этих вероятностных оценок.
е)' В действительно сложных задачах человек, может быть не в состоянии провести исчерпывающий анализ ни в развернутой, ни в нормальной форме. Вместо этого он может заняться поисками «хорошего» решения, даже если он не может быть уверен, что оно «лучшее». С помощью нормальной формы анализа он часто может выделить ограниченный класс потенциально хороших стратегий и затем выбрать лучшую стратегию из них. В главе 9 «Искусство моделирования» я попытаюсь рассказать, как можно использовать нормальную форму анализа вместе с развернутой при разборе довольно сложных задач.
ж) В главе 8 мы рассмотрим задачи, в которых единицей, принимающей решения, является целый коллектив. Если у его участников различные субъективные вероятности состояний, встречающихся в задаче, то для ее анализа можно рекомендовать нормальную форму, ибо это позволяет первоначально иметь дело лишь с той частью задачи, относительно которой не существует разногласий.
з) В главе 10 я опишу, как подход, применяемый в настоящих лекциях, соотносится с общепринятой методологией статистики, которая по большей части соответствует нормальной форме анализа. Материал настоящей главы облегчит это. обсуждение.
Еще по теме 1. Введение:
- Введение Литература
- ВВЕДЕНИЕ
- ВВЕДЕНИЕ В ИННОВАТИКУ
- ВВЕДЕНИЕ
- Постановление Правительства РФ от 5 августа 2008 г. № 583 «О ВВЕДЕНИИ НОВЫХ СИСТЕМ ОПЛАТЫ ТРУДА РАБОТНИКОВ ФЕДЕРАЛЬНЫХ БЮДЖЕТНЫХ УЧРЕЖДЕНИЙ И ФЕДЕРАЛЬНЫХ ГОСУДАРСТВЕННЫХ ОРГАНОВ, А ТАКЖЕ ГРАЖДАНСКОГО ПЕРСОНАЛА ВОИНСКИХ ЧАСТЕЙ, УЧРЕЖДЕНИЙ И ПОДРАЗДЕЛЕНИЙ ФЕДЕРАЛЬНЫХ ОРГАНОВ ИСПОЛНИТЕЛЬНОЙ ВЛАСТИ, В КОТОРЫХ ЗАКОНОМ ПРЕДУСМОТРЕНА ВОЕННАЯ И ПРИРАВНЕННАЯ К НЕЙ СЛУЖБА, ОПЛАТА ТРУДА КОТОРЫХ В НАСТОЯЩЕЕ ВРЕМЯ ОСУЩЕСТВЛЯЕТСЯ НА ОСНОВЕ ЕДИНОЙ ТАРИФНОЙ СЕТКИ РФ И ПО ОПЛАТЕ ТРУДА РАБОТНИКОВ ФЕДЕРАЛЬНЫХ ГОСУ
- ВВЕДЕНИЕ
- Введение
- Интрига во Введении
- Введение
- ВВЕДЕНИЕ
- ВВЕДЕНИЕ
- ВВЕДЕНИЕ
- Введение
- ВВЕДЕНИЕ