Автор работы: Пользователь скрыл имя, 09 Апреля 2013 в 23:38, реферат
Необходимо учитывать, что при выборе решения в условиях неопределенности всегда неизбежен элемент произвола, а значит, и риска. Недостаточность информации всегда опасна, и за нее приходится платить. Однако в условиях сложной ситуации всегда полезно представить варианты решения и их возможные последствия в такой форме, чтобы сделать произвол выбора менее грубым, а риск минимальным".
Какую бы стратегию ни выбирал игрок B, выигрыш игрока A всегда должен быть не меньше цены игры v. Поэтому мы можем записать следующую систему из m неравенств (напоминаем, что m — число чистых стратегий игрока B):
a11p1+a21p2+…+an1pn≥v;
a12p1+a22p2+…+an2pn≥v;
…………………………
a1mp1+a2mp2+…+anmpn≥v.
При этом p1+p2+…+pn=1.
Введя обозначения x1=p1/v, x2=p2/v, … xn=pn/v, перепишем (1) и (2) в виде
a11x1+a21x2+…+an1xn≥1;
a12x1+a22x2+…+an2xn≥1;
…………………………
a1mx1+a2mx2+…+anmxn≥1;
x1+x2+…+xn=1/v.
Нам желательно, чтобы цена игры была максимальной, следовательно, 1/v должна быть минимальной. Таким образом, поиск оптимальной смешанной стратегии свёлся к решению следующей задачи линейного программирования: надо найти неотрицательные величины xi такие, чтобы они удовлетворяли неравенствам (3) и обращали в минимум сумму x1+x2+…+xn, т.е.
L= x1+x2+…+xn→min,
при ограничениях
a11x1+a21x2+…+an1xn≥1;
a12x1+a22x2+…+an2xn≥1;
…………………………
a1mx1+a2mx2+…+anmxn≥1;
xi≥0, i=1, 2, …, n/
Задача. Самолёты против зениток. Найдём оптимальную смешанную стратегию некоторой конкретной игры. Предположим, что сторона A нападает на сторону B. У стороны A имеются два самолёта, несущие мощное поражающее средство. У стороны B имеются четыре зенитки, при помощи которых осуществляется оборона важного объекта. Чтобы объект оказался разрушенным, достаточно, чтобы к нему прорвался хотя бы один самолёт. Для подхода к объекту самолёты могут выбрать любой из четырёх воздушных коридоров (см. рис. 2).
Рис. 2. Воздушные коридоры и объект
У стороны A есть две чистые стратегии: стратегия A1 — самолёты посылаются в разных воздушных коридорах (безразлично, каких именно), стратегия A2 — оба самолёта посылаются в каком-то одном из коридоров. Возможные стратегии стороны B таковы: B1 — поставить по зенитке на каждый коридор, B2 — поставить по две зенитки на какие-то два коридора (остальные два коридора остаются неохраняемыми, B3 — поставить две зенитки на один из коридоров и по одной зенитке ещё на два коридора, B4 — поставить три зенитки на один из коридоров и одну зенитку ещё на один коридор, B5 — поставить все четыре зенитки на один из коридоров. Стратегии B4 и B5 заведомо невыгодны хотя бы потому, что три, а тем более четыре зенитки в пределах одного коридора не нужны, ведь у стороны A всего два самолета. Поэтому ограничимся стратегиями B1, B2, B3.
Предположим, что сторона A выбрала стратегию A1, сторона B — стратегию B1. Ясно, что тогда ни один самолёт не прорвётся к объекту — выигрыш стороны есть нуль (a11=0). Пусть выбраны стратегии A1 и B2. В этой ситуации, какие бы два коридора ни выбирала сторона B для размещения пар зениток, у самолётов всегда будут шесть равновероятных вариантов и только один проигрышный. Таким образом, при выборе стратегий A1 и B2 вероятный выигрыш стороны A составляет 5/6 (a12=5/6). Рассуждая подобным образом, найдём остальные элементы платёжной матрицы данной игры (см. табл. 6). Нижняя цена игры равна ½, верхняя ¾. Седловой точки нет, оптимальное решение лежит в области смешанных стратегий.
Табл. 6. Платёжная матрица игры
B A |
В1 |
В2 |
В3 |
min |
А1 |
0 |
5/6 |
1/2 |
0 |
А2 |
1 |
1/2 |
3/4 |
1/2 |
max |
1 |
5/6 |
3/4 |
Чтобы найти оптимальную смешанную стратегию, воспользуемся платёжной матрицей (см. табл. 6) и соотношениями (3) и (4). В результате получим следующую задачу линейного программирования:
x1+x2→min
, x1≥0, x2≥1
Решение удобно представить графически. Для этого построим область допустимых решений D (см. рис. 3). Уравнение x1+x2=const описывает семейство параллельных прямых, которые на рисунке показаны штриховыми линиями. Из всех прямых, имеющих хотя бы одну точку в пределах допустимой области, наименьшей сумме x1+x2 соответствует прямая FF. Точка G соответствует оптимальной смешанной стратегии. Координаты этой точки: x1=3/5; x2=1. Отсюда v=5/8, p1=3/8, p2=5/8. Итак, оптимальная смешанная стратегия стороны A предполагает использование стратегии A1 с вероятностью 3/8 и стратегии A2 с вероятностью 5/8.
Как воспользоваться этой рекомендацией на практике? Если игра происходит один раз, то стороне A следует, по-видимому, избрать стратегию A2, ведь p2>p1. Предположим, что игра совершается многократно (например, по отношению к многим объектам, подлежащим бомбардировке). Если игра повторяется раз N (N»1), то в 3N/8 случаях сторона A должна избрать стратегию A1, а в 5N/8 случаях стратегию A2.
Рассмотрим поведение стороны B. При выборе стороной A оптимальной смешанной стратегии её средний выигрыш оказывается в пределах между верхней ценой игры, раной ¾, и ценой игры v=5/8. При неразумном поведении стороны B выигрыш стороны A может оказаться равным верхней цене игры (и даже может стать больше). Если сторона B, в свою очередь, будет придерживаться
Рис. 3. Допустимая область D (область красного цвета) и решение G.
оптимальной смешанной стратегии, то выигрыш игрока A окажется равным цене игры v. Оптимальная смешанная стратегия стороны B сводится к тому, что эта сторона вообще не применяет стратегию B3, стратегию B1 использует с вероятностью ¼, а стратегию B2 с вероятностью ¾. Нецелесообразность применения стратегии B3 усматривается из рисунка: соответствующая этой стратегии прямая EE не имеет общих точек с красной областью. Для определения вероятностей, с какими должны использоваться стратегии B1 и B2, воспользуемся уже найденным значением цены игры (v=5/8): q1´0+q2´5/6=5/8. Отсюда видно, что q1=1/4, q2=3/4. [Тарасов Л. В. Мир, построенный на вероятности. – М.: Просвещение, 1984. – 191 с.].
При решении произвольной конечной игры размера n × m рекомендуется придерживаться следующей схемы:
Фактическое решение
некоторых классов
Теория игр, созданная для математического решения задач экономического и социального происхождения, не может в целом сводиться к классическим математическим теориям, созданным для решения физических и технических задач. Однако в различных конкретных вопросах теория игр широко используются весьма разнообразные классические математические методы. Кроме этого, теория игр связана с рядом математических дисциплин внутренним образом. В теория игр. систематически и по существу употребляются понятия теории вероятностей. На языке теория игр можно сформулировать большинство задач математической статистики. Необходимость при анализе игры количественного учёта неопределённости предопределяет важность и тем самым связь И. т. с теорией информации и через её посредство — с кибернетикой. Кроме того, теория игр, будучи теорией принятия решений, может рассматриваться как существенная составная часть математического аппарата операций исследования.
Теория игр применяется в экономике, технике, военном деле и даже в антропологии. Основные трудности практического применения теория игр связаны с экономической и социальной природой моделируемых ею явлений и недостаточным умением составлять такие модели на количественном уровне.
Предметом рассмотрения данного раздела служат статистические модели принятия решений, трактуемые как статистические игры или игры с Природой при использовании дополнительной статистической информации о её стратегиях. Характерная черта статистической игры – возможность получения информации в результате некоторого статистического эксперимента для оценки распределения вероятностей стратегий природы. Исследование механизма случайного выбора стратегии природой позволяет принять оптимальное решение, которое будет наилучшей стратегией в игре с неантагонистическим противником человека – природой.
В рассмотренных разделах теории игр предполагалось, что оба противника (или больше двух) активно противодействуют друг другу, что оба они достаточно умны, чтобы искать и найти свою оптимальную стратегию, и осторожны, чтобы не отступать от нее. Такое положение дает возможность предсказывать поведение игроков. Неопределенность была лишь в выборе противником конкретной чистой стратегии в каждой отдельной партии.
Но возможен случай, когда неопределенность в игре вызвана не сознательным противодействием противника, а незнанием условий, в которых будет приниматься решение, случайных обстоятельств. Такие игры называются "играми с природой".
Игра человека с природой тоже отражает конфликтную ситуацию, возникающую при столкновении интересов в выборе решения. Но "стихийным силам природы" нельзя приписать разумные действия, направленные против человека и тем более какой-либо "злой умысел". Таким образом, корректнее говорить о конфликтной ситуации, вызванной столкновением интересов человека и неопределенностью действий природы.
Действия природы могут, как наносить ущерб, так и приносить прибыль. Поведение природы можно оценить статистическими методами, определить присущие ей закономерности. В зависимости от степени знания этих закономерностей, определяющих поведение природы, различаются игры с природой в условиях определенности и игры с природой в условиях неопределенности.
Во-первых, поведение природы известно полностью (заданы вероятностями). Во-вторых - действия природы не известны, или изучены частично.
К явлениям природы, влияющим на результат решения, относят не только погодные и сезонные явления (дождь, засуху, урожай, неурожай), но и проявление любых, не зависящих от нас обстоятельств: например, задержки на транспорте.
Поиском решений в таких ситуациях и занимается теория статистических решений.
Человек, играя с природой, стремиться максимизировать свой выигрыш, поэтому, если он осторожный игрок (а теория игр рассматривает именно таких игроков), он должен при выборе своей стратегии руководствоваться тем, что неизвестные или известные ему закономерные действия природы приведут к наименее благоприятным последствиям. Именно поэтому такие игры можно рассматривать как игры двух лиц с нулевой суммой, которые были уже нами рассмотрены.
Формализация задачи происходит следующим образом: у активного игрока (человека) возможные действия по-прежнему называются стратегиями, а возможные действия пассивного игрока (природы) – состояниями или условиями природы.
В качестве первого игрока всегда выступает человек, поэтому в матрице записывается его выигрыш. Так как нас интересует оптимальная стратегия человека и его гарантированный выигрыш, то в игру достаточно определить максиминную стратегию первого игрока и нижнюю цену игры. Определение верхней цены игры имеет смысл, если данная игра повторяется многократно и оптимальная стратегия может быть смешанной.
Если распределение вероятностей будущих состояний природы неизвестно, вся информация о природе сводится к перечню ее возможных состояний. Человек в играх с природой старается действовать осмотрительно, второй игрок (природа, например, покупательский спрос) действует случайно. Таким образом, в сложных структурах каждому допустимому варианту решений Xi вследствие различных внешних условий могут соответствовать различные внешние условия (состояния) Вj и результаты аij решений. Следующий пример иллюстрирует это положение.
Пусть из некоторого материала требуется изготовить изделие, долговечность которого при допустимых затратах невозможно определить. Нагрузки считаются известными. Требуется решить, какие размеры должно иметь изделие из данного материала [Э. Мушик, П. Мюллер. Методы принятия технических решений. М.: Мир, 1990. – 2008 с.].
Варианты решений таковы:
X1 – выбор размеров из соображений максимальной долговечности, т.е. изготовление изделия с минимальными затратами в предположении, что материал будет сохранять свои характеристики в течение длительного времени;
Xn – выбор размеров в предположении минимальной долговечности;
Xi – промежуточные решения.
Условия (состояния), требующие рассмотрения, таковы:
В1 – условия, обеспечивающие максимальную долговечность;
Информация о работе Принятие решения в условиях неопределенности