Автор работы: Пользователь скрыл имя, 13 Января 2012 в 15:48, лекция
Для того чтобы можно было решить задачу с помощью динамического программирования обязательно должны присутствовать следующие моменты:
1) должна быть возможность, позволяющая представить решаемую задачу в виде многошагового процесса, где решение, принимаемое на каждом шаге, заключается в выборе одной или несколько управляющих переменных, которые однозначно определяют переход в следующий этап;
1. Постановка задачи динамического программирования
2. Вычислительная схема метода динамического программирования (рекуррентные соотношения Беллмана)
3. Некоторые экономические задачи, решаемые методом динамического программирования
1
ТЕМА: ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
1.
Постановка задачи
2.
Вычислительная схема метода
динамического
3.
Некоторые экономические
2
1.
Постановка задачи
динамического программирования
Для
того чтобы можно было решить
задачу с помощью
1)
должна быть возможность,
2)
оптимальное решение,
3
3)
выбор оптимального решения на
каждом шаге должен
4
2.
Вычислительная схема
метода динамического
программирования
(ре-куррентные соотношения
Беллмана)
Пусть имеется некоторая управляемая система S, ее начальное состояние известно s0. Допустимое множество состояний Si. Решение задачи заключается в том, что происходит последовательный переход системы из одного состояния в другое под воздействием управления u. Допустимое множество управлений Ui.
5
Целевая
функция задается в виде суммы
оценочных функций ri=(si;
si+1), значения которых получают
на каждом шаге при переходе в решении
задачи из состояния si в состояние
si+1 при выборе управления
ui. Необходимо найти такой
сценарий развития ситуации u* = (u*0;
u*1;…; u*N-1), при
котором достигается экстремум функции:
6
Математическая
запись принципа оптимальности
выглядит следующим образом:
Основное
функциональное уравнение
7
Алгоритм
решения задачи при помощи
динамического
1)
выбрать группу параметров,
2) разбить решаемую задачу на этапы;
3)
определить совокупность
8
4) определить величину эффекта оценочной функции ri(si; ui) на i-ом шаге, которое дает управление ui при переходе системы из состояния si в si+1 и определить как изменяется сама система при переходе в новое состояние, т. е. необходимо определить функцию изменения состояния si+1 = φi(si; ui);
5)
далее нужно записать
9
6)
затем следует провести
и
среди полученных выигрышей
10
7)
далее провести условную
8)
после того, как было выбрано
условное оптимальное
11
3. Некоторые экономические задачи, решаемые методом динамического программирования
Задача оптимального распределения ресурсов
Пусть имеется некоторое количество ресурсов х, которое необходимо распределить между п различными предприятиями, объектами, работами и т. д., так, чтобы получить максимальную суммарную эффективность от выбранного способа распределения.
Введем обозначения:
12
xi - количество ресурсов, выделенных i-му предприятию (i=1,2…n);
gi (xi) – функция полезности, в данном случае это величина дохода от использования ресурса xi, полученного i - м предприятием;
fk
(x) - наибольший доход, который можно получить
при использовании ресурсов х от первых
k различных предприятий.
13
Сформулированную
задачу можно записать в
при
ограничениях:
, хi≥0,
i=1,2…n
14
Для
максимизации суммарного
15
Задача о прокладке наивыгоднейшего пути между двумя пунктами
Требуется
определить такой путь из
Стоимость переезда из пункта i в пункт j обозначим через cij.
Используем
формулу рекуррентных
16
где
N— количество этапов в
fn(i) — стоимость, отвечающая стратегии минимальных затрат для пути от пункта i, если до конечного пункта остается n шагов;
Pn(i)—решение,
позволяющее достичь fn(i).
17
Задача об определении оптимальных сроков замены оборудования
Оптимальная
стратегия замены оборудования
состоит в определении
Введем обозначения:
r(t)—
стоимость продукции,
18
u(t)
— ежегодные затраты на
s(t)
— остаточная стоимость
Р — покупная цена оборудования.
Рассмотрим
период N лет, в пределах которого
требуется определить
Пусть
fN(t)— максимальная прибыль, получаемая
от оборудования возраста t лет за оставшиеся
N лет цикла использования оборудования
при условии оптимальной стратегии.
19
На
каждом этапе N-стадийного процесса
должно быть принято решение
о сохранении или замене
Функциональные уравнения, основанные на принципе оптимальности, имеют вид:
20
Уравнение
состоит из двух частей: верхняя
строка определяет прибыль, получаемую
при сохранении оборудования; нижняя
– прибыль, получаемую при замене
оборудования и продолжении
Функция
r(t)-u(t) показывает разность между
стоимостью произведенной
Функция характеризует суммарную
прибыль
от N-1 оставшихся стадий для
21
Нижняя
строка характеризуется
Функция
r(0) – u(0) выражает прибыль, получаемую
от нового оборудования
22
Последняя функция представляет
собой доход от оставшихся N–1 стадий, до начала осуществления которых возраст оборудования составляет один год.
23
Пример
Совет
директоров фирмы
Для
расширения производства совет
директоров инвестирует
Найти
предложения инвестиций между
предприятиями, обеспечивающее фирме
максимальный прирост выпуска
продукции, причем на одно предприятие
можно осуществить одну