Автор работы: Пользователь скрыл имя, 13 Февраля 2013 в 14:38, курсовая работа
Тем не менее, в ней сохранилась в значительной степени первоначальная терминология, относящаяся к играм в собственном смысле: партия, ход, выигрыш, игрок и другие. Первые серьёзные исследования по теории игр были выполнены в первой трети XX века такими выдающимися учеными, как Э. Борель, Дж. фон Нейман, но не породили сколько – нибудь заметных откликов. И только после публикации книги Дж. фон Неймана и О.Моргенштерна «Теория игр и экономическое поведение» началось интенсивное развитие теории игр и её приложений.
Содержание 2
Теория игр 6
Экстенсивная форма 6
Нормальная форма 7
Характеристическая формула 8
Типы игр 9
Кооперативные и некооперативные 9
Симметричные и несимметричные 10
С нулевой суммой и с ненулевой суммой 11
Параллельные и последовательные 12
С полной или неполной информацией 12
Игры с бесконечным числом шагов 13
Дискретные и непрерывные игры 13
Метаигры 14
ОПРЕДЕЛЕНИЕ МАТРИЧНОЙ ИГРЫ 15
РЕШЕНИЕ МАТРИЧНЫХ ИГР В ЧИСТЫХ СТРАТЕГИЯХ. 18
ГРАФИЧЕСКИЙ МЕТОД РЕШЕНИЯ ИГР 2 x n И m x 2. 23
Список литературы
Задача, которая обычно ставится в этом случае, состоит не в поиске оптимального решения, а в поиске хотя бы выигрышной стратегии. Используя аксиому выбора, можно доказать, что иногда даже для игр с полной информацией и двумя исходами — «выиграл» или «проиграл» — ни один из игроков не имеет такой стратегии. Существование выигрышных стратегий для некоторых особенным образом сконструированных игр имеет важную роль в дескриптивной теории множеств.
Дифференциальные игры
Большинство изучаемых игр дискретны: в них конечное число игроков, ходов, событий, исходов и т. п. Однако эти составляющие могут быть расширены на множество вещественных чисел. Игры, включающие такие элементы, часто называются дифференциальными. Они связаны с какой-то вещественной шкалой (обычно — шкалой времени), хотя происходящие в них события могут быть дискретными по природе. Дифференциальные игры также рассматриваются в теории оптимизации, находят своё применение в технике и технологиях, физике.
Это такие игры, результатом которых является набор правил для другой игры (называемой целевой или игрой-объектом). Цель метаигр — увеличить полезность выдаваемого набора правил. Теория метаигр связана с теорией оптимальных механизмов (англ.).
Описание игры включает перечень участников конфликта, задание множеств возможных действий и оценок эффективности этих действий для каждого из них. Участников конфликта принято называть игроками. Обозначим множество всех игроков через . Далее будем считать множество N конечным. Игроков принято различать по их номерам, т. е. считать ={1,2, ..., n}. Множество возможных действий i-го игрока обозначим через . Элементы этого множества принято называть стратегиями. Каждый игрок имеет не менее двух различных стратегий, в противном случае его действия заранее определены и фактически он не участвует в игре. В результате выбора i-м игроком стратегии складывается система стратегий , которая называется ситуацией. Эффективность возможных действий игроков мы будем оценивать теми выигрышами, которые игроки получают в каждой ситуации s. Выигрыш игрока i в ситуации s обычно обозначается через . Функция , определенная на множестве всех ситуаций, называется функцией выигрыша игрока i. Цель i-го игрока — максимизация своей функции выигрыша.
Данный способ описания
игры заключается в том, что рассматриваются
все возможные стратегии
Игра (17.1) называется антагонистической, если в ней участвуют два игрока и значения функций выигрыша в каждой ситуации равны по величине и противоположны по знаку.
Следовательно, для задания антагонистической игры достаточно указать функцию выигрыша только одного из игроков . Поэтому под антагонистической игрой понимается совокупность
Г = <А, В, Н>,
где А и В — соответственно множества стратегий игроков I и II, а Н — функция выигрыша игрока I.
Конечная антагонистическая игра в нормальной форме называется матричной игрой.
Это название можно объяснить следующей возможностью описания игр такого рода. Поскольку множество возможных действий каждого из игроков в этом случае конечно, можно положить А = {1, 2, ..., m}, В = {1, 2,..., n}, где m и n — соответственно число стратегий игроков I и II, а значения функции Н представить в виде следующей матрицы:
Здесь —выигрыш игрока I в ситуации (i, j), где i — номер строки (стратегия игрока I), j — номер столбца (стратегия игрока II). Матрица Н называется матрицей игры или матрицей выигрышей.
Матричная игра полностью определяется своей матрицей выигрышей. Поэтому часто вместо выражения “игра с матрицей выигрышей Н” употребляется выражение “игра Н”.
Преимущество представления игры в виде матрицы заключается в хорошей наглядности. Матричные игры являются самыми простыми из класса антагонистических игр.
Матричная игра двух игроков с нулевой суммой может рассматриваться как следующая абстрактная игра двух игроков.
Первый игрок имеет m стратегий i = 1,2,...,m, второй имеет n стратегий j = 1,2,...,n. Каждой паре стратегий (i,j) поставлено в соответствие число аij, выражающее выигрыш игрока 1 за счёт игрока 2, если первый игрок примет свою i-ю стратегию, а 2 – свою j-ю стратегию.
Каждый из игроков делает один ход: игрок 1 выбирает свою i-ю стратегию (i=
Каждая стратегия игрока i=
Если рассмотреть матрицу
А =
то проведение каждой партии матричной игры с матрицей А сводится к выбору игроком 1 i-й строки, а игроком 2 j-го столбца и получения игроком 1 (за счёт игрока 2) выигрыша аij.
Главным в исследовании игр является понятие оптимальных стратегий игроков. В это понятие интуитивно вкладывается такой смысл: стратегия игрока является оптимальной, если применение этой стратегии обеспечивает ему наибольший гарантированный выигрыш при всевозможных стратегиях другого игрока. Исходя из этих позиций, игрок 1 исследует матрицу выигрышей А следующим образом: для каждого значения i (i =
т.е. определяется минимальный выигрыш для игрока 1 при условии, что он примет свою i-ю чистую стратегию, затем из этих минимальных выигрышей отыскивается такая стратегия i = iо, при которой этот минимальный выигрыш будет максимальным, т.е. находится
Определение. Число
Игрок 2 при оптимальном своём поведении должен стремится по возможности за счёт своих стратегий максимально уменьшить выигрыш игрока 1. Поэтому для игрока 2 отыскивается
т.е. определяется max выигрыш игрока 1, при условии, что игрок 2 применит свою j-ю чистую стратегию, затем игрок 2 отыскивает такую свою j = j1 стратегию, при которой игрок 1 получит min выигрыш, т.е. находит
Определение. Число
Другими словами, применяя свои чистые стратегии игрок 1 может обеспечить себе выигрыш не меньше
Определение. Если в игре с матрицей А
u =
Седловая точка – это пара чистых стратегий (iо,jо) соответственно игроков 1 и 2, при которых достигается равенство
где i, j – любые чистые стратегии соответственно игроков 1 и 2; (iо,jо) – стратегии, образующие седловую точку.
Таким образом, исходя из (3), седловой элемент
Пример 1
Седловой точкой является пара (iо = 3; jо = 1), при которой u =
Заметим, что хотя выигрыш в ситуации (3;3) также равен 2 =
Пример 2
Из анализа матрицы выигрышей видно, что
Поясним метод на примераx.
Пример 1.
Рассмотрим игру, заданную платёжной матрицей.
На плоскости xОy введём систему координат и на оси Оx отложим отрезок единичной длины А1, А2, каждой точке которого поставим в соответствие некоторую смешанную стратегию игрока 1 (x, 1 - x). В частности, точке А1 (0;0) отвечает стратегия А1, точке А2 (1;0) – стратегия А2 и т.д.
В точкаx А1 и А2 восстановим перпендикуляр и на полученныx прямыx будем откладывать выигрыш игроков. На первом перпендикуляре (в данном случае он совпадает с осью 0y) отложим выигрыш игрока 1 при стратегии А1, а на втором – при стратегии А2. Если игрок 1 применит стратегию А1, то выиграет при стратегии В1 игрока 2 – 2, при стратегии В2 – 3, а при стратегии В3 – 11. Числам 2, 3, 11 на оси 0x соответствуют точки В1, В2 и В3.
Если же игрок 1 применит стратегию А2, то его выигрыш при стратегии В1 равен 7, при В2 – 5, а при В3 – 2. Эти числа определяют точки В'1, В2', В3' на перпендикуляре, восстановленном в точке А2.Соединяя между собой точки В1 и В'1, В2 и В'2, В3 и В'3 получим три прямые, расстояние до которыx от оси 0x определяет средний выигрыш при любом сочетании соответствующиx стратегий. Например, расстояние от любой точки отрезка В1В'1 до оси 0x определяет средний выигрыш u1 при любом сочетании стратегий А1 А2 (с частотами x и 1–x) и стратегией В1 игрока 2. Это расстояние равно
2x1 + 6(1 - x2) = u1
(Вспомните планиметрию и
Соответствующие два уравнения имеют вид
Следовательно Х = (
Оптимальные стратегии для игрока 2 можно найти из системы
и, следовательно, Y = (0;
Пример 2. Найти решение игры, заданной матрицей
Решение. Матрица имеет размерность 2 x 4. Строим прямые, соответствующие стратегиям игрока 1. Ломанная А1 K А'4 соответствует верxней границе выигрыша игрока 1, а отрезок N K –цене игры. Решение игры таково
U = (