Антагонистические и матричные игры

Автор работы: Пользователь скрыл имя, 31 Июля 2011 в 13:48, реферат

Описание

Задача теории состоит в том, что является:

1) оптимальным поведением в игре.

2) исследование свойств оптимального поведения

3) определение условий, при которых его использование осмысленно (вопросы существования, единственности, а для динамических игр и вопросы именной состоятельности).

4) построение численных методов нахождения оптимального поведения.

Содержание

Введение 3
Глава 1. Игровые модели 5
1.1. Теория игр 5
1.2. Классификация игровых моделей 10
Глава 2. Антагонистические и матричные игры 16
2.1. Антагонистические игры 16
2.2. Матричные игры 20
Заключение 23
Список литературы 26

Работа состоит из  1 файл

Анкогнистичные матричные игры.doc

— 133.50 Кб (Скачать документ)

     Отдельно  надо отметить специальный класс  антагонистических бесконечных  игр, в которых X=Y=[0, 1]. В этих играх ситуациями являются пары чисел (x,y), где x, yÎ[0, 1]. Эти пары задают точки единичного квадрата. Поэтому такие игры называются играми на единичном квадрате. Класс игр на единичном квадрате во многом характеризует бесконечные антагонистические игры и поэтому является базовым при исследовании бесконечных игр.

     Пример. (Поиск на отрезке.)

     Игрок 2 (прячущийся) выбирает точку yÎ[0, 1], а игрок 1 (ищущий) выбирает одновременно и независимо точку xÎ[0, 1]. Точка y считается “обнаруженной”, если ½x - y½£ l, где 0< l <1. В этом случае игрок 1 выигрывает величину +1, во всех остальных случаях его выигрыш полагается равным 0. Игра антагонистическая. Функция выигрыша имеет вид

                         1, если ½x - y½£ l, 

     H(x,y) = {

                         0 - в противоположном случае.

     Выигрыш второго игрока полагается равным [- H(x,y)]6.

     Как и во всякой антагонистической игре Г = (X,Y,H), в бесконечной игре принципом  оптимального поведения игроков  является принцип равновесия. Оптимальной (равновесной) является такая ситуация (x*,y*), для которой выполняются неравенства

     H(x,y*) £ H(x*,y*) £ H(x*,y) при всех xÎX, yÎY.

     Этот  принцип реализуется в игре Г  в том и только в том случае, когда

     v=v=`v,

     v=max inf H(x,y),

                                                                 x     y

     `v=min sup H(x,y),

                                                                 y      x

     т.е. внешние экстремумы максимина и  минимакса достигаются и нижнее значение игры равно верхнему значению. Такая антагонистическая игра Г  называется вполне определенной, а число v - значением игры. Для матричных игр решение игры заключалось в нахождении их общего значения v и тех стратегий x*, y*, на которых достигаются внешние экстремумы.

     Для бесконечных игр существование  внешних экстремумов, вообще говоря, не обязательно.

     Пример. Пусть каждый из игроков 1 и 2 выбирает число из открытого интервала (0,1), после чего игрок 1 получает выигрыш, равный сумме выбранных чисел. Таким  образом, получаем игру на открытом единичном  квадрате с функцией выигрыша H(x,y) игрока 1

     H(x,y)=x+y, xÎ(0,1), yÎ(0,1).

     Здесь ситуация (1,0) была бы равновесной, если бы 1 и 0 входили в число стратегий  игроков, а значение игры v было бы v=1. В действительности внешние экстремумы в этой игре не достигаются, а верхнее  и нижнее значение игры равно между собой. Поэтому v=1, и игрок 1, выбирая число 1-e, e>0, достаточно близкое к 1, всегда может получить выигрыш, достаточно близкий к значению игры. С другой стороны, игрок 2, выбирая число e>0 достаточно малым, может гарантировать, что его проигрыш будет сколь угодно близким к значению игры.

     Ситуация (xe,ye) в антагонистической игре Г(X,Y,H) называется ситуацией e-равновесия, если для любых стратегий xÎX  yÎY игроков 1и 2 соответственно выполняется неравенство

     H(x,ye) - e £ H(xe,ye)£ H(xe,y)+e.

     Точка (xe ,ye) для которой имеет место (), называется e - седловой точкой, а стратегии xe и ye - e-оптимальными стратегиями игроков 1 и 2 соответственно.

     Антагонистическая игра Г называется непрерывной, если функция выигрыша Н непрерывна на g´h. Для игр с бесконечным числом стратегий (непрерывных игр) стандартные методы решений пока не разработаны. Решения находятся только для игр с определенными ограничениями. Например, для игр со смешанными стратегиями существует лемма: В непрерывной игре Г на прямоугольнике найдется max min и min max смешанной стратегии игроков. Исключение  составляют непрерывные игры, приближенные решения которых можно находить с помощью итеративного алгоритма Брауна-Робинсона(метод фиктивного разыгрывания). Идея метода - многократное фиктивное разыгрывание игры с заданной матрицей выигрыша. Но сходимость итеративного алгоритма очень медленная и поэтому стараются применять какие-нибудь другие более эффективные методы хотя бы приближенного решения непрерывных игр. Для этого применяется способ аппроксимации конечными играми и конструирования из решений конечных игр приближенные (по результатам применения) решения непрерывных игр.

     2.2. Матричные игры

 

     В этом параграфе будет рассказано о принципе максимина, рациональном представлении матрицы игры. 

      н/ч ч
    н/ч 1 -1
    ч -1 1
 

     Начнём  непосредственно с матричных  игр. Тройка (где x и y – множества, H – функция от двух переменных ) называется антагонистической игрой. Процесс разыгрывания конечной антагонистической игры (игра называется конечной, если тройка конечна) состоит в том, что игроки 1 и 2 независимо друг от друга выбирают соответственно некоторые чистые стратегии x и y, в результате чего складывается ситуация (x,y).

     Мы  знаем, что антагонистическую игру двух участников с нулевой суммой (напомним, что нулевая сумма – это когда выигрыш одного игрока равен проигрышу другого) удобно задавать с помощью, так называемой платёжной матрицы. Каждый элемент такой матрицы содержит числовое значение выигрыша игрока 1 (или проигрыша игрока 2) в ситуации, когда первый игрок применяет стратегию i, а второй – стратегию j. Классическим примером антагонистической игры является игра с двумя участниками, которые независимо друг от друга загадывают числа. Предполагается, что если сумма оказывается чётной, то выигрыш равный 1, достаётся первому игроку, а если нечётной, то второму. Если предположить, что загадывание нечётного числа – стратегия первого игрока, а загадывание чётного числа – стратегия второго игрока, то платёжная матрица выглядит следующим образом7:

     Строки матрицы соответствуют стратегиям игрока 1, столбцы – стратегиям игрока 2, а её элементы – результатам (т.е. выигрышам) первого. Если взять элементы матрицы с обратным знаком, то это будут выигрыши второго игрока. Здесь надо отметить, что вопрос о выборе стратегии является основным в теории игр. Для примера проанализируем произвольную игру . При выборе игроком 1 стратегии i, его выигрыш в независимости от игрока 2 составит . Стратегия I произвольно, поэтому главная цель игрока 1 максимизировать величину полученного выигрыша, т.е. получить . Такой принцип получил название принципа максимина. Напомним, что максимин – это выигрыш максимальный из минимальных. Надо также отметить, что принцип максимина обеспечивает игрокам гарантированный «выигрыш» при любых стратегиях противников.

 

      Заключение

 

     Что общего у шахмат, карточных игр, войн, переговоров, рыночной конкуренции, аукционов? Все эти ситуации можно описать c помощью теории игр - раздела прикладной математики, ставшей неотъемлемой частью экономической теории. Всюду, где только имеет место взаимодействие самостоятельных рациональных (или частично рациональных) субъектов, возникает игра. Главный вопрос теории игр заключается в предсказании поведения участников игры, какие ходы сделают шахматисты, чем завершатся войны и переговоры, какие цены сформируются на рынке и т.д. Оказывается, теория игр позволяет сделать достаточно сильные предсказания. Механизмы конкуренции, функционирования рынка, возникновения или краха монополий, способы принятия ими решений в условиях конкурентной борьбы, то есть механизмы игры монополий, действующие в экономической реальности, - все это является предметом анализа теории игр. Уже в момент ее зарождения многие предсказали революцию в экономических науках благодаря использованию нового подхода. Революции, возможно, и не произошло, но тенденции развития экономики показал плодотворность методов теории игр в прикладной сфере. Так, в 1994 году Дж. Харшаньи и Р. Зельтен получили Нобелевскую премию по экономике за работы в области теории игр (приложения их исследований, например – переговоры с односторонними транзакционными затратами, равновесие рынка с продавцом и несколькими потенциальными покупателями).

     Теория  игр имеет не очень длинную  историю. Решающий поворот в ее развитии произошел в 1928 году благодаря американцу Дж. фон Нейману. Именно тогда он представил математическое обоснование общей стратегии для игры двух участников в терминах минимизации и максимизации. Одним из родоначальников теории игр был и французский математик Э. Борель. Но первым систематизированным изложением идей и методов в этой области была вышедшая в 1944 году работа фон Неймана и О. Моргенштерна "Теория игр и экономическое поведение", которая распространила теорию игр на произвольное число участников и применила эту теорию к экономическому поведению. Предложенная в ней стратегия - "минимакс", или минимизация максимальных потерь, - определяется как рациональный курс в условиях неопределенности.

     Теория  игр и решений получила сильный  импульс в годы второй мировой  войны, когда был введен термин "исследование операций". В типичной задаче этой тематики рассматривалась "дуэль" между самолетом и подводной лодкой. Первому требовалось найти оптимальную схему патрульного поиска в определенном районе; другой было необходимо изыскать наилучший способ уйти от наблюдения. Математики Группы исследования операций по противолодочной защите, используя материалы фон Неймана, относящиеся к 1928 году, решили эту задачу.

     Статистические  критерии для принятия решений в  условиях неопределенности были обоснованы математиком из Колумбийского университета А. Вальдом в 1939 году. Они определяют "максимин" - критерий, которым пользуются в ожидании наихудшего результата. Л. Гурвиц и Л. Сэвидж разработали и другие критерии, подобные "критериям сожаления", где субъективные вероятности могут заставить увеличить или уменьшить риск.

     Обычно  теория игр определяется как теория математических моделей выбора оптимальных  решений в условиях неопределенности. При этом тип неопределенности, изучаемый  в теории игр, характеризуется тем, что рассматриваются ситуации, исход в которых определяется действием нескольких сторон, каждая из которых преследует собственные цели (такие взаимодействия нескольких сторон называются играми). Несовпадение целей действующих сторон, а также определенные ограничения на обмен информацией между ними, приводят к тому, что эти взаимодействия носят конфликтный характер, поэтому в прикладном аспекте теория игр может рассматриваться как наука о рациональном поведении в условиях конфликта.

     Очевидно, что взаимодействия между производителями  и потребителями, из которых фактически складывается экономическая реальность, имеют именно такой характер, как указано выше, поэтому теория игр является, наиболее, адекватной теорией для изучения экономического поведения. Следует иметь в виду, что теория игр изучает не фактическое поведение участников, а их гипотетическое поведение, направленное на получение наилучшего в некотором смысле (оптимального) результата.

     В настоящем пособии мы ограничиваемся рассмотрением той части теории игр, которая связана с приложениями в экономике. Игры более чем двух игроков в пособие не включены. Представлены следующие классы теоретико-игровых моделей: игры с природой, антагонистические игры, биматричные игры.

 

      Список литературы

Информация о работе Антагонистические и матричные игры