Элементы теории игр

До этого момента, рассматривая задачи принятия решений, мы предполагали, что выбор оптимального решения всегда осуществляется каким-либо одним лицом – «лицом, принимающим решение». Теперь мы рассмотрим ряд задач, которые предполагают наличие нескольких независимых, но в равной степени заинтересованных в конечном результате участников. Кроме того, все решения всеми участниками будут приниматься в условиях неопределенности, а оптимальное значение целевой функции для каждого из них будет зависеть от решений, принимаемых всеми участниками. Классы подобных задач, т.е. задач, исследующих ситуации, в которых принятие решения зависит от нескольких участников, рассматривается в специальном разделе математики – Теории игр.

Исходя из всего сказанного, можно дать следующее формальное определение Теории игр как науки. Теория игр – это раздел математики, в котором исследуются математические модели принятия оптимальных решений в условиях конфликта, т.е. в условиях столкновения сторон-участников, каждый из которых стремится повлиять на развитие конфликта в соответствии со своими собственными интересами. Примером таких ситуаций может служить маркетинговые исследования и большинство задач планирования в экономике.

Как уже отмечалось, решение в теории игр принимается, помимо всего прочего, в условиях неопределенности. На практике это означает, что лицо, принимающее решение (в дальнейшем мы будем называть его игроком), располагает информацией лишь о множестве возможных ситуаций, в которых он может оказаться, о множестве решений (в дальнейшем мы будем называть их стратегии), которые он может принять и о количественной оценке того выигрыша, который он мог бы получить, при выборе в данной ситуации данной стратегии. Неопределенность в такой ситуации является следствием деятельности других игроков по достижению их собственных целей – получение максимального выигрыша.

Все математические модели в Теории игр принято называть играми. Математическое описание игры сводится к определению ряда множеств. Во-первых, определяется множество действующих в ней игроков. Затем, для каждого игрока указываются все его стратегии и соответствующие численные выигрыши. В результате определения этих множеств достигается необходимый для дальнейших преобразований уровень математической формализации игры.

Классификация игр

Так как в задачах Теории игр решения принимаются несколькими лицами (участниками), то с учетом смысла, который мы ранее вкладывали в понятие «лицо, принимающее решение» будет не совсем верно называть участников игры лицами, принимающими решения. Поэтому в Теории игр вводится специальный термин – игрок. Кроме того, данные термин созвучен и с названием самой Теории. Целевые функции игроков получили название платежных функций.

В простых задачах, которые мы в основном и будем рассматривать, у каждого игрока может быть ограниченное, обычно небольшое число возможных линий поведения – стратегий. По количеству стратегий, имеющихся в распоряжении игроков игры делят на конечные и бесконечные. Игру называют конечной, если у каждого игрока есть конечное число стратегий. В случае, когда хотя бы у одного из игроков имеется в распоряжении бесконечное число стратегий, игру принято называть бесконечной.

Выигрыш каждого игрока определяется его платежной функцией и зависит от стратегий всех игроков данной игры. Если в игре участвует n игроков, то такую игру называют игрой с n участниками. В простейшем случае эти n участников в процессе игры ведут себя самостоятельно. Такие игры называют бескоалиционными. Под коалицией  мы будем  понимать множество игроков, действующих совместно. Таким образом, бескоалиционная игра n участников – это игра n коалиций, каждая из которых включает в себя ровно одного игрока.

Наряду с этим возможен вариант объединения групп игроков в фиксированные коалиции. В коалиции могут объединяться игроки, имеющие общую цель и координирующие свои действия. Такие игры называются коалиционными. Случаями, когда в процессе игры происходят эпизодические принятия игроками совместных решений или временные объединения игроков в коалиции с последующим разделением выигрышей, занимается так называемая кооперативная теория бескоалиционных игр.

Игры можно классифицировать и по характеру получаемой игроками информации. Играми в нормальной форме называются такие игры, в которых игроки получают всю предназначенную им информацию до начала игры. В динамических играх игроки получают информацию в процессе протекания игры.

Последней из применяемых классификаций игр является классификация по свойствам платежной функции, в соответствии с которой игры делят на антагонистические и игры с ненулевой суммой. В играх с нулевой суммой суммарный выигрыш всех игроков равен нулю. Так, например, если мы рассматриваем игру с нулевой суммой для двух игроков, то в такой игре выигрыш одного игрока будет в точности равен проигрышу другого. Именно такие игры и называются антагонистическими. Очевидно, что в таких играх всегда существует конфликт между игроками.

В играх с ненулевой суммой, или как их еще называют, играх с постоянной разностью, ситуация прямо противоположна. В этих играх возможны случаи одновременного выигрыша или проигрыша игроков, что приводит их к возможности объединения в коалиции.

Антагонистические игры в нормальной форме

Антагонистической игрой в нормальной форме будем называть следующую систему:

                                                           ,                                                       (1)

где S и R – некоторые непустые множества стратегий, а

Элементы Si и Rj называются стратегиями игроков А и В соответственно в игре G. Пары стратегий (Si, Rj), т.е. элементы декартового произведения  называются ситуациями игры G, а функция L – функция выигрыша игрока А. Так как мы рассматриваем антагонистическую игру с двумя игроками, то выигрыш игрока В может быть вычислен как выигрыш игрока А, взятый с обратным знаком, т.е. .

Часто конечные антагонистические игры двух игроков называют матричными играми. Рассмотрим некоторую произвольную матричную игру, заданную системой (1). Предположим, что игрок А в данной игре имеет в своем распоряжении n стратегий, а игрок В – m. Тогда игра G может быть полностью определена заданием матрицы выигрышей

, где ,  , 

Пример 1. Оборона города.

В качестве примера рассмотрим задачу, известную как «задача полковника Блотто». По условию задачи полковник Блотто (игрок А) имеет в своем распоряжении n полков, а его противник (игрок В) – m полков. Противник защищает две позиции. Позиция будет в итоге занята тем игроком, чьи войска окажутся на ней в численном превосходстве. Выигрыш игрока, занявшего позицию, будем считать равным числу захваченных полков противника на данной позиции плюс один. Дополнительный полк присваивается за захват самой позиции. Для выполнения боевой задачи противникам следует распределить полки между двумя позициями.

Прежде всего, давайте определим выигрыш игрока А (полковника Блотто) на  каждой позиции. Если у него на какой-либо из позиций полков больше, то он получит выигрыш, равный по условию задачи числу полков противника на данной позиции плюс один. Если же на рассматриваемой позиции количество полков противника превышает количество полков полковника Блотто, то полковник теряет все свои полки на данной позиции и еще один полк за потерю самой позиции. Если окажется, что на данной позиции обе стороны имеют одинаковое число полков, то будет ничья и каждая из сторон ничего не получит и ничего не потеряет. Общий выигрыш полковника Блотто будет равен сумме выигрышей на всех позициях.

Вероятно, ни у кого не возникнет сомнений в том, что данная игра является антагонистической. Давайте опишем стратегии игроков. Предположим, для определенности, что n > m, т.е. у полковника Блотто больше полков, чем у его противника.

Стратегии игроков будем представлять в виде пар , где x – количество полков, отправляемых игроком на первую позицию, а y – количество полков, отправляемых игроком на вторую позицию. При этом, так как условия игры не позволяют создавать резервов, справедливы следующее равенства:

С учетом введенных обозначений игрок А имеет следующие стратегии:

а игрок В следующие:

Рассмотрим теперь следующую ситуацию игры: игрок А выбрал стратегию S0, а игрок В выбрал стратегию R0. Вычислим выигрыш игрока А в данной ситуации – величину . Ввиду того, что по условию задачи n > m, игрок А выиграет на первой позиции. Его выигрыш на этой позиции будет равен: . Так как, в соответствии с выбранными стратегиями, оба противника послали все свои полки на первую позицию, то на второй позиции будет ничья, т.е. ни один из противников не получит дополнительных баллов (полков). Тогда суммарный выигрыш игрока А составит (m + 1) + 0 = m + 1.

Вычислим теперь величину  – выигрыш игрока А в ситуации, когда он применяет стратегию S0, а его противник – игрок В – стратегию R1.

На первой позиции выигрыш игрока А составит (m – 1) + 1 = m. Так как игрок А играет, используя первую стратегию, то он проиграет на позиции 2, где у него нет ни одного полка, а у его противника есть один полк. Таким образом проигрыш игрока А на второй позиции составит 1. А его суммарный выигрыш будет равен m – 1.

Рассмотрим теперь случай, когда игрок А  выбирает стратегию S1, в то время как игрок Б – стратегию R0. Выигрыш игрока А составит величину  , равную m + 1 + 1 = m + 2, если n > m + 1, или равную 1, если n = m + 1 (ситуацию n < m + 1 не рассматриваем, так как она противоречит наложенному нами ранее  условию n > m).

Проводя аналогичные рассуждения можно обнаружить следующие общие зависимости:

и так далее …

В общем случае значения  (, ) можно задать следующей системой:

Давайте проиллюстрируем полученные зависимости на конкретном примере. Пусть у игрока А в наличии имеется 4 полка, а у игрока В – 3, т.е. n = 4, а m = 3. Тогда мы получим следующую матрицу выигрышей игрока А:

 

 

 

 

R0

R1

R2

R3

 

 

 

S0

 

4

2

1

0

 

 

 

S1

 

1

3

0

-1

 

A

=

S2

 

-2

2

2

-2

 

 

 

S3

 

-1

0

3

1

 

 

 

S4

 

0

1

2

4

 

Пример 2. Игра на уклонение.

Игроки 2 и 2 выбирают целые числа i и j в интервале от 1 до n, при этом игрок 1 выигрывает величину |i - j|. Игра антагонистическая. Матрица выигрышей этой игры квадратная и имеет размерность, где . Тае, если n=4, то матрица выигрышей игры A принимает следующий вид:

 

 

 

 

1

2

3

4

 

 

 

1

 

0

1

2

3

 

A

=

2

 

1

0

1

2

 

3

 

2

1

0

1

 

 

 

4

 

3

2

1

0

 

Пример 3. Дискретная игра типа дуэли.

Игроки продвигаются навстречу друг другу на n шагов. После каждого сделанного шага игрок может выстрелить или нет, но за все время игры он может выстрелить только один раз. Будем считать, что вероятность того, что игрок попадет в своего противника, если выстрелит, продвинувшись на k шагов, равна k/n (k £n).

Стратегия игрока 1 (2) заключается в принятии решения стрелять на i-ом (j-том) шаге. Пусть i<j и игрок 1 принимает решение стрелять на i-ом шаге, а игрок 2 – на j-ом. Тогда выигрыш  игрока 1 будет определяться следующей формулой:

Таким образом, выигрыш  - это разность вероятностей поражения противника и собственной гибели на дуэли. В случае i>j первым стреляет игрок 2 и . Если же i=j, то полагаем . Так, если положить n=5, то матрица этой игры, умноженная на 25, примет вид:

 

 

 

 

1

2

3

4

5

 

 

 

1

 

0

-3

-7

-11

-15

 

 

 

2

 

3

0

1

-2

-5

 

A

=

3

 

7

-1

0

7

5

 

 

 

4

 

11

2

-7

0

15

 

 

 

5

 

15

5

-5

-15

0

 

Пример 4. Игра «нападение-защита».

Пусть игрок 1 намерен атаковать один из объектов , которые имеют положительные ценности . Игрок 2 защищает один из этих объектов. Будем считать, что если атакован незащищенный объект , то он гарантированно уничтожается (игрок 1 выигрывает ), а защищаемый поражается с вероятностью (объект  выдерживает нападение с вероятностью ), т.е. игрок 1 выигрывает в среднем .

Тогда задача выбора для игрока 1 объекта нападения и для игрока 2 объекта защиты сводится к матричной игре со следующей матрицей выигрышей:

 

 

 

 

A

=

 

 

 

 

 

 

 

 

 

Максиминные и минимаксные стратегии

Рассмотрим антагонистическую игру . Здесь каждый из игроков выбором стратегии стремится максимизировать свой выигрыш. Но для первого игрока он определяется функцией L(s,r), а для второго игрока – (-L(s,r)), то есть цели игроков прямо противоположны. При этом заметим, что выигрыш первого игрока (и, соответственно, второго) игрока определен на ситуациях (s,r)ÎSxR, складывающихся в процессе игры. Но каждая ситуация, а следовательно, и выигрыш игрока зависит не только от его выбора, но и от того, какая стратегия будет выбрана противником. Поэтому, стремясь получить возможно больший выигрыш, каждый игрок должен учитывать поведение противника.

В теории игр предполагается, что каждый из игроков действует разумно, то есть стремится к получению максимального выигрыша, считая, что соперник действует наилучшим для себя образом. Давайте разберем, что же в такой ситуации может себе гарантировать первый игрок. Пусть первый игрок выбрал стратегию s. Тогда в худшем случае он выиграет . Поэтому первый игрок всегда может себе гарантировать выигрыш . Если теперь отказаться от предположения достижимости экстремума, то первый игрок может всегда получит выигрыш сколь угодно близкий к следующей величине:

                                                                                                           (1)

Величину, определяемую выражением (1) мы будем называть нижним значением игры. Если же внешний экстремум в (1) достигается, то величина v называется также максимином, а сам принцип поиска стратегии s, основанный на максимизации минимального выигрыша – принципом максимина. Выбираемая в соответствии с этим принципом стратегия s называется максиминной стратегией  первого игрока.

Для второго игрока можно провести аналогичные рассуждения. Итак, пусть второй игрок выбрал стратегию r. Тогда в худшем случае он проиграет . Поэтому второй игрок всегда может гарантировать себе проигрыш . Если теперь опять отказаться от предположения достижимости экстремума, то второй игрок может всегда получит проигрыш сколь угодно близкий к следующей величине:

                                                       ,                                                    (2)

которая называется верхним значением игры. Если же внешний экстремум в (2) достигается, то величина верхнее значение игры называется также минимаксом, а сам принцип поиска стратегии r, основанный на минимизации максимального проигрыша – принципом минимакса. Выбираемая в соответствии с этим принципом стратегия r называется минимаксной стратегией  второго игрока. Еще раз заметим, что существование минимаксной и максиминной стратегии определяется достижимостью внешнего экстремума в (1) и (2).

 

Пример 5. Система противовоздушной обороны.

Система противовоздушной обороны прикрывает участок территории, располагая двумя зенитно-ракетными комплексами, зоны действия которых не пересекаются. Каждый зенитно-ракетный комплекс с единичной вероятностью поражает самолет противника в зоне своего действия, если его система наведения начинает отслеживать цель и вырабатывать данные для стрельбы еще за пределами зоны. Противник располагает двумя самолетами, каждый из которых может быть направлен в зону действия любого зенитно-ракетного комплекса. В момент, когда система противовоздушной обороны решает задачу целераспределения, то есть решает, какому зенитно-ракетному комплексу по какой цели стрелять, самолеты противника могут применить обманный маневр и изменить маршрут. Целью системы противовоздушной обороны является поражение как можно большего количества самолетов противника, а цель противника – преодолеть систему противовоздушной обороны, потеряв при этом как можно меньше самолетов.

В данном случае мы имеем игру двух лиц с нулевой суммой. В распоряжении первого игрока, которого в данной игре представляет система противовоздушной обороны, имеются следующие четыре стратегии:

 - система наведения каждого зенитно-ракетного комплекса отслеживает цель, направляющуюся в его зону действия, то есть k-тому зенитно-ракетному комплексу назначается k-тая цель (k-тый самолет противника), k=1,2;

 - система наведения первого зенитно-ракетного комплекса отслеживает вторую цель, а система наведения второго зенитно-ракетного комплекса отслеживает первую цель;

 - системы наведения обоих зенитно-ракетных комплексов отслеживают первую цель;

 - системы наведения обоих зенитно-ракетных комплексов отслеживают вторую цель.

У второго игрока, которого в данной игре представляют военно-воздушные силы противника, также имеются четыре стратегии:

 – оба самолета не меняют своего курса, то есть  k-тый самолет следует в зону действия k-того зенитно-ракетного комплекса, k=1,2;

 – оба самолета применяют обманный маневр и меняют курс, то есть первый самолет следует в зону действия второго зенитно-ракетного комплекса, а второй самолет, сменив курс, следует в зону действия первого зенитно-ракетного комплекса;

 – первый самолет применяет обманный маневр и меняет свой курс, в то время как второй самолет продолжает следовать старым курсом – таким образом, оба самолета противника следуют в зону действия второго зенитно-ракетного комплекса;

 – второй самолет применяет обманный маневр и меняет свой курс, в то время как первый самолет продолжает следовать старым курсом – таким образом, оба самолета противника следуют в зону действия первого зенитно-ракетного комплекса.

Составим теперь платежную матрицу сформулированной задачи:

 

 

 

2

0

1

1

 

A

=

 

0

2

1

1

 

 

1

1

1

1

 

 

 

 

1

1

1

1

 

Определим верхнюю и нижнюю цену игры, а также минимаксную и максиминную стратегию игроков.

Для первого игрока (система противовоздушной обороны) имеем:

Таким образом, верхняя цена игры равна единице, а первый игрок располагает двумя максиминными стратегиями  и .

Для второго игрока (военно-воздушные силы противника) имеем:

Таким образом, нижняя цена игры равна единице, а первый игрок располагает двумя минимаксными стратегиям  и .

В данном случае верхняя и нижняя цены игры совпадают и равны единице. Это означает, что при использовании системой противовоздушной обороны любой из максиминных стратегий она гарантированно сбивает один самолет. В то же время при использовании противником любой из своих минимаксных стратегий, он гарантированно теряет лишь один самолет.

 

В теории игр оптимальность решения связывают с такой ситуацией, в которой ни одному из игроков не выгодно изменить свою стратегию. В этом случае игра считается стабильной, или находящейся в состоянии равновесия. В только что рассмотренном примере 5 фигурировала игра, для которой нижняя цена была ранта верхней. Это равенство есть ни что иное как проявление свойства устойчивости  минимаксных и максиминных стратегий. Свойство устойчивости заключается в том, что если один из игроков придерживается своей минимаксной или максиминной стратегии, то другой игрок никак не может улучшить свое положение, отступая от своей максиминной или минимаксной стратегии. Игры, в которых нижняя цены игры равна верхней, занимают особое место в теории игр, их называют играми с седловой точкой.

В платежной матрице любой игры с седловой точкой всегда существует элемент, являющийся одновременно минимальным в своей строке и максимальным в своем столбце. Такой элемент называют седловой точкой. Следует отметить, что седловая точка может не единственной. Так, платежная матрица игры из примера 5 имеет четыре седловые точки, расположенные на пересечении двух ее последних строк и двух ее последних столбцов.

В играх с седловой точкой общее значение нижней и верхней цены игры принято называть чистой ценой игры. Очевидно, что седловой точке соответствует максиминная стратегия первого игрока и минимаксная стратегия второго. До тех пор, пока игроки не будут отходить от этих стратегий, выигрыш останется постоянным и равным чистой цене рассматриваемой игры. Если второй игрок отклонится от своей минимаксной стратегии, то первый игрок сразу получает преимущество, так как седловой элемент является минимальным в своей строке и подобное отклонение не может быть выгодным для второго игрока. Проведя аналогичные рассуждения для первого игрока, можно прийти к следующему выводу: в играх с седловой точкой максиминная стратегия первого игрока и минимаксная стратегия второго игрока являются оптимальными. В связи с этим, совокупность этих двух стратегий называют решением игры.

В играх двух противников с нулевой суммой выигрыш одного из них равен проигрышу другого. Поэтому, если целью одного из противников является максимизация своего выигрыша, то целью ворого противника автоматически становится минимизация своего проигрыша. В том случае, если фиксированная стратегия одного из игроков  не обладает свойством устойчивости, то она не может быть оптимальной, так как в этом случае второй игрок может улучшить свое положение, что приведет к ухудшению положения первого игрока.

Таким образом, среди игр двух лиц с нулевой суммой существуют игры без седловых точек. В таких играх нижняя цена игры строго меньше ее верхней цены, а минимаксные и максиминные стратегии не являются оптимальными, то есть их совокупность не является решением игры.

Задачи принятия решения в неопределенности

Ранее уже отмечалось, что в один из принципов классификации задач исследования операций тесно связан с понятием информационного состояния лица, принимающего решение. В соответствии с эти принципом все задачи исследования операций могут быть поделены на три класса: детерминированные, стохастические и неопределенные.

О принадлежности задачи исследования операций к классу детерминированных задач говорят в случае обладания лицом, принимающим решение, полного объема необходимой ему информации. Поэтому их также называют задачами принятия решений в условиях определенности.

В случае ограниченности или неточности информации возможна одна из двух ситуаций: принятие решений в условиях риска (задачи принятия решений в условиях риска) и принятие решений в условиях неопределенности (задачи принятия решений в условиях неопределенности). В первой ситуации неполнота исходной информации выражена в наличии законов распределения случайных величин, входящих в стохастические модели принятия решений. Во второй же ситуации априорная информация о законах распределения этих случайных величин не доступна.

Ниже приведены наиболее часто применимые на практике критерии принятия решений в условиях неопределенности:

1.      критерий Лапласа;

2.      критерий минимакса (максимина);

3.      критерий Сэвиджа;

4.      критерий Гурвица.

Основное различие между выше перечисленными критериями определяется стратегией поведения лица, принимающего решение, в условиях неопределенности. Так, например, критерий Лапласа основан на более оптимистичных взглядах лица, принимающего решение, чем, например, критерий минимакса, а критерий Гурвица, в свою очередь, можно использовать при различных подходах: от наиболее пессимистичного до наиболее оптимистичного. Таким образом, данные критерии, несмотря на свою количественную природу, в большой степени отражают субъективную оценку ситуации в предметной области, в которой приходится принимать решение, лица, принимающего решение.

Несмотря не бесспорную полезность и применимость выше перечисленных критериев, при их использовании оказывается довольно много подводных камней. Например, довольно серьезную проблему представляет собой отсутствие общих правил оценки применимости того или иного критерия при принятии решения в условиях неопределенности в конкретной ситуации. Это связано с тем, что поведение самого лица, принимающего решение, обусловленное неопределенностью ситуации, само по себе является наиболее важным фактором при выборе подходящего критерия принятия решений.

При рассмотрении проблем принятия решений в условиях неопределенности мы исходим из предположения, что выбор решения из множества допустимых решений осуществляется одним лицом. Специфика подобных задач состоит в отсутствии у лица, принимающего решение, разумного противника. В таких случаях, когда в роли противника лица, принимающего решение, выступает природа, по большому счету, нет оснований предполагать, что она целенаправленно стремится принести вред лицу, принимающему решение.

Информация, необходимая для принятия решений в условиях неопределенности, обычно представляется в форме матрицы, i-тая строка которой соответствует некоторому конкретному решению  из множества допустимых решение , а j-тый столбец соответствует некоторому состоянию  рассматриваемой системы  с множеством возможных состояний . Каждому допустимому решению  из множества допустимых решений и каждому возможному состоянию  изучаемой системы  соответствует некоторый результат принятия решения  в ситуации :

,

определяющий выигрыш или потери при принятии лицом, принимающим решение, данного решения и реализации данного состояния системы. Так, если множество допустимых решений состоит из n элементов, а исследуемая система может находиться в одном из возможных m состояний, то матрица

является матрицей исходных данных для процедуры принятия решений в условиях неопределенности.

Если величина  определяет выигрыш, получаемый при принятии решения  и реализации состояния  рассматриваемой системы , то матрицу  принято называть матрицей дохода. Если же величина  определяет проигрыш, получаемый при принятии решения  и реализации состояния  рассматриваемой системы , то матрицу  принято называть матрицей потерь или матрицей затрат.

Перейдем теперь непосредственно к рассмотрению наиболее широко используемых при принятии решений в условиях неопределенности критериев.

Критерий Лапласа

Для обоснования критерия Лапласа в задачах принятия решений в условиях неопределенности воспользуемся следующими соображениями, отражающими основную суть принципа недостаточного обоснования.

Так нам не известны вероятности пребывания рассматриваемой системы в каждом из ее m вероятных состояний, то мы не имеет достаточно оснований сделать утверждение о различии этих вероятностей. В противном случае имела бы место ситуация принятия решения в условиях риска. Скорее, мы можем предположить равенство вероятностей реализации любых возможных состояний изучаемой системы. Таким образом, исходную задачу можно рассматривать как задачу принятия решений в условиях риска, когда выбирают решение, обеспечивающее наибольший ожидаемый результат, то есть:

Здесь предполагается, что вероятности пребывания рассматриваемой системы во всех возможных состояниях одинаковы и равны 1/m. Данный критерий называют критерием Лапласа.

Этот критерий не слишком хорош, ибо трудно предположить, что все состояния равновероятны.

 

Пример 1.

В отдел технической экспертизы поступило на рассмотрение два проекта выпуска одного и того же изделия. Проекты ориентированы на различный объем выпуска изделия. По предварительным прогнозам емкость рынка может составить a или b единиц данного изделия. Для каждого из этих возможных емкостей рынка, существует наилучший с точки зрения прибыли проект выпуска. Матрица выигрышей в условных денежных единицах приведена ниже:

A

=

 

0,64

0,36

 

 

0,58

0,60

 

В данном случае n=m=2. Тогда имеем:

Таким образом,

и наилучшим проектом выпуска в данной ситуации в соответствии с критерием Лапласа будет второй проект.

 

Критерий минимакса (максимина)

Критерий минимакса в некотором смысле является наиболее пессимистичным критерием, поскольку его реализация предполагает выбор наилучшей из наихудших возможностей. Данных критерий часто называют критерием пессимиста. В отличие от критерия минимакса, критерий максимина значительно более оптимистичный критерий, поскольку его реализация предполагает выбор наихудшей из наилучших возможностей. Данных критерий часто называют критерием оптимиста.

Пусть - множество допустимых решений, а  - множество возможных состояний изучаемой системы. Если  - потери лица, принимающего решение, при выборе им некоторого решения  из множества  и реализации системой некоторого возможного состояния , то наибольшие потери независимо от возможных состояний будет равны следующим величинам:

В соответствии с критерием минимакса следует выбрать такое решение, которое бы обеспечивало минимальность потерь, какое бы из своих возможных состояний не реализовала бы система, то есть:

Рассуждая аналогично, в ситуации, когда  - выигрыш лица, принимающего решение, при выборе им некоторого решения  из множества  и реализации системой некоторого возможного состояния , наименьшие выигрыши независимо от возможных состояний будут равны следующим величинам:

В соответствии с критерием максимина следует выбрать такое решение, которое бы обеспечивало максимальность выигрыша, какое бы из своих возможных состояний не реализовала бы система, то есть:

Пример 1. (Продолжение)

Вернемся к рассмотрению примера 1. В соответствии с критерием максимина:

Таким образом, наилучшим проектом выпуска в данной ситуации в соответствии с критерием максимина будет второй проект.

Критерий Сэвиджа

Критерии минимакса и максимина настолько категоричны в степени пессимизма, что зачастую могут приводить к нелогичным выводам. Для устранения данного недостатка был предложен так называемый критерий Сэвиджа, который можно сформулировать следующим образом.

Найдём в каждом столбце наибольшее значение платежа  и перепишем платежную матрицу, записывая вместо  значения , которые все будут отрицательными или же равными нулю. Величину Сэвидж назвал - «сожалением» между тем выбором, на котором мы остановились и наиболее благоприятным, который сделали бы, зная о том, какая будет ситуация. Полученную матрицу, элементами которой являются «сожаления» будем называть матрицей «сожалений». К матрице «сожалений» применяем критерий максимина, в соответствии с которым необходимо выбрать в каждой строке минимальное значение «сожаления» , а затем найти строку с максимальным из них, то есть:

Пример 1. (Продолжение)

Вернемся к рассмотрению примера 1. В соответствии с критерием Сэвижда, рассчитаем, прежде всего, матрицу сожалений:

B

=

 

0

-0,24

 

 

-0,06

0

 

 

Таким образом, наилучшим проектом выпуска в данной ситуации в соответствии с критерием Сэвиджа будет второй проект.

Критерий Гурвица

Данный критерий наиболее гибкий из всех ранее рассмотренных. Он охватывает несколько подходов к принятию решений в условиях неопределенности от наиболее пессимистичного до наиболее оптимистичного. Если  - матрица выигрышей, то наиболее оптимистичному подходу соответствует критерий:

,

а наиболее пессимистичному подходу соответствует следующий критерий:

.

Критерий Гурвица устанавливает баланс между наиболее оптимистичным и наиболее пессимистичным подходами путем взвешивания обоих вариантов принятия решений в условиях неопределенности с весами a и 1-a, где 0£a£1. это значит, что если  - матрица выигрышей, то в соответствии с критерием Гурвица следует выбрать решение, обеспечивающее:

Если же  - матрица проигрышей, то в соответствии с критерием Гурвица следует выбрать решение, обеспечивающее:

Параметр  называется показателем оптимизма. Его значение выбирается лицом, принимающим решение, в зависимости от полученного им ранее опыта принятия решений в условиях неопределенности и личных склонностей к оптимизму (a®1) или пессимизму (a®0). В случае отсутствия ярко выраженных склонностей целесообразно выбрать (a=0,5).

Пример 1. (Продолжение)

Еще раз вернемся к рассмотрению примера 1. В соответствии с критерием Гурвица, при показателе оптимизма, равном 0.5:

Таким образом, наилучшим проектом выпуска в данной ситуации в соответствии с критерием Гурвица при показателе оптимизма, равном 0.5, будет второй проект.

 



Hosted by uCoz