Линейное и динамическое программирование

Линейное программирование.

Задача линейного оптимального планирования - один из важнейших математических инструментов, используемых в экономике. Рассмотрим предприятие, которое из m видов ресурсов производит n видов продукции.

Примем следующие обозначения:

i - номер группы ресурса (i=1,2, ..., m);

j -

номер вида продукции (j=1,2, ..., n);

aij
- количество единиц i-го ресурса, расходуемое на производство одной единицы j-го вида продукции;

bij
-
запасы i-ro ресурса ;

xi
—
планируемое количество единиц j-й продукции;

cj
-прибыли от реализации одной единицы j-го вида продукции;

X=(x1,
x2,…,
xn
) -
искомый план производства, называется допустимым если имеющихся ресурсов достаточно. называется допустимым если имеющихся ресурсов достаточно.

Рассматриваемая задача состоит в нахождении допустимого плана, дающего максимальную прибыль из всех допустимых решения подобных задач, называемых задачами линейного программирования.

Предположим, что предприятие может выпускать четыре вид продукции, используя для этого три вида ресурсов. Известна технологически матрица А затрат любого ресурса на единицу каждой продукции, вектор В объемов ресурсов и вектор С удельной прибыли

48 30 29 10 удельные прибыли

нормы расхода 3 2 4 3 198

2 3 1 2 96

6 5 1 0 228

запасы ресурсов

Обозначим х1
, х2
, х3
, х4
- число единиц 1-й, 2-й, 3-й, 4-й продукции, которые планируем произвести. При этом можно использовать только имеющиеся запасы ресурсов. Целью является получение максимальной прибыли. Получаем следующую математическую модель оптимального планирования:

L(x1
,x2
,x3
,x4
)=48xl
+30x2
+29x3
+10x4
-max

3х1
+2х2
+4х3
+3х4
≤198

2х1
+3х2
+1х3
+2х4
≤96

6х1
+5х2
+1х3
+0х4
≤228

xj
≥0, jєN4

Для решения полученной задачи в каждое неравенство добавим неотрицательную переменную. После этого неравенства превратятся в равенства, в силу этого добавляемые переменные называются базисными. Получается задача ЛП на максимум, все переменные неотрицательны, все ограничения есть равенства и есть базисный набор переменных: х5
- в 1-м равенстве, х6
- во 2-м и х7
- в 3-м. Теперь можно запускать симплекс-метод.

L(x1
,x2
,x3
,x4
)=48xl
+30x2
+29x3
+10x4
-max

3х1
+2х2
+4х3
+3х4
+x5
=198

2х1
+3х2
+х3
+2х4
+x6
=96

6х1
+5х2
+х3
+x7
=228

xj
≥0, jєN7

Таблица N 1

C	B	H	48	30	29	10	0	0	0
C	B	H	x1	x2	x3	x4	x5	x6	x7
0	x5	198	3	2	4	3	1	0	0
0	x6	96	2	3	1	2	0	1	0
0	x7	228	6	5	1	0	0	0	1
0	-48	-30	-29	-10	0	0	0

Если все оценочные коэффициенты (серый цвет) неотрицательны, то получено оптимальное решение: базисные переменные равны свободным членам, остальные равны 0. Если же есть отрицательный оценочный коэффициент, то находят самый малый из них. Если в столбце коэффициентов над ним нет положительных, то задача не имеет решения. Задача оптимального планирования не может быть таковой, поэтому ищут минимальное отношение свободных членов столбца Н к положительным коэффициентам указанного xj
. В пересечении строки и столбца получаем разрешающий элемент и затем строим новую таблицу.

Таблица N 2

C	B	H	48	30	29	10	0	0	0
C	B	H	x1	x2	x3	x4	x5	x6	x7
0	х5	84	0	-½	31 /2	3	1	0	-3 /6
0	x6	20	0	11 /3	2 /3	2	0	1	-2 /6
48	х1	38	1	5 /6	1 /6	0	0	0	1 /6
1824	0	10	-21	-10	0	0	-8

Таблица N 3

C	B	H	48	30	29	10	0	0	0
C	B	H	x1	x2	x3	x4	x5	x6	x7
29	х3	24	0	-1 /7	1	6 /7	2 /7	0	-1 /7
0	x6	4	0	13 /7	0	13 /7	-4 /21	1	-5 /21
48	х1	34	1	6 /7	0	-1 /7	-1 /21	0	4 /21
2328	0	7	0	8	6	0	5

Оптимальное решение (производственная программа): Xо
pt
=(34; 0; 22; 0); максимум целевой функции равен 2328.

Значение переменной с номером i большим 4-х есть остаток (i-4)-ro ресурса. 'Гак как все оценочные коэффициенты неотрицательны, то получено оптимальное решение: базисные переменные равны свободным членам, остальные равны 0.

Следует обратить внимание на экономический смысл элементов последней строки последней симплексной таблицы. Например, коэффициент Δ2
=7 при переменной х2
показывает, что если произвести одну единицу продукции второго вида (она не входит в оптимальную производственную программу), то прибыль уменьшится на 7 единиц.

Заметим, что в рассматриваемом примере линейной производственной задачи возможна самопроверка результата.

Воспользуемся тем, что в оптимальной производственной программе х2
=0, х4
=0. Предположим, что вторую и четвертую продукции мы не намеревались выпускать с самого начала. Рассмотрим задачу с оставшимися двумя переменными, сохранив их нумерацию. Математическая модель задачи будет выглядеть следующим образом:

L(x1
,x3
)=48xl
+29x3
-max

3х1
+4х3
≤198

2х1
+ х3
≤ 96

6х1
+ х3
≤228

x1
≥0, x3
≥0

Задачу линейного программирования с двумя переменными можно решить графически. Возьмем на плоскости систему координат: ось OX3
направим горизонтально и вправо, ось OХ1
-вертикально и вверх. Каждое ограничение задачи, раз оно линейное нестрогое неравенство, графически изображается полуплоскостью, граничная прямая которой соответствует уже не неравенству, а равенству. Допустимое множество задачи является пересечением всех этих полуплоскостей и есть выпуклый многоугольник. Вторая из двух основных теорем линейного программирования гласит: Если экстремум целевой функции достигается на допустимом множестве, то функция принимает его в какой-то вершине многоугольника-допустимого множества. Исходя из этой теоремы, найти искомый экстремум можно просто перебрав вершины многоугольника и определив ту, в которой значение функции экстремально. Чаще делают по-другому: строят линию уровня целевой функции и двигают ее параллельно в направлении экстремума, стараясь уловить последнюю точку пересечения линии с допустимым множеством.

Двойственная задача линейного программирования

Задача линейного оптимального планирования - исходная в своей паре симметричных двойственных задач. Вообще же другая задача в двойственной паре строится так:

1)меняется тип экстремума целевой функции (mах на min и наоборот);

2)коэффициенты целевой функции одной задачи становятся свободными членами другой задачи;

3)свободные члены одной задачи становятся коэффициентами целевой функции двойственной задачи;

4)тип неравенств меняется (≤ на ≥ и наоборот);

5) каждый столбец одной задачи порождает строку ограничений другой задачи и наоборот. В матрично-векторном виде обе задачи выглядят так:

исходная задача двойственная задача

L=(c,x)-max Z=(b,y)-min

Ax≤b, x≥0 Ya≥c, y≥0,

L(x1
,x2
,x3
,x4
)=48xl
+30x2
+29x3
+10x4
-max Z(y1
,y2
,y3
,y4
)=198yl
+96y2
+228y3
- min

3х1
+2х2
+4х3
+3х4
≤198 3y1
+2y2
+6y3
≥48

2х1
+3х2
+1х3
+2х4
≤96 2y1
+3y2
+5y3
≥30

6х1
+5х2
+1х3
+0х4
≤228 4y1
+ y2
+ y3
≥29

xj
≥0, jєN4
3y1
+2y2
≥10

yj
≥0, jєN3

Решение полученной задачи легко найти с помощью второй основной теоремы двойственности, согласно которой для оптимальных решений X(x1,
x2,
x3,
x4
) и Y(y1,
y2,
y3
) пары двойственных задач необходимо и достаточно выполнение условий:

x1
(3y1
+2y2
+6y3
-48)=0 y1
(3х1
+2х2
+4х3
+3х4
)-198=0

x2
(2y1
+3y2
+5y3
-30)=0 y2
(2х1
+3х2
+1х3
+2х4
)-96=0

x3
(4y1
+1y2
+1y3
-29)=0 y3
(6х1
+5х2
+1х3
+0х4
)-228=0

x4
(3y1
+2y2
+0y3
-10)=0

В решении исходной задачи х1
>0, х3
>0, поэтому

3y1
+2y2
+6y3
-48=0

4y1
+1y2
+1y3
-29=0

Учитывая, что второй ресурс был избыточным и, согласно теореме двойственности его оценка равна нулю – y2
=0, то приходим к системе:

3y1
+6y3
-48=0

4y1
+1y3
-29=0

из которой следует, что y1
=6; y3
=5.

Таким образом получили двойственные оценки ресурсов: y1
=6; y2
=0; y3
=5; общая оценка всех ресурсов Z=198y1
+228y3
=2328.

Заметим, что полученное решение содержалось в последней строке последней симплексной таблицы исходной задачи

Таблица N 3

C	B	H	48	30	29	10	0	0	0
C	B	H	x1	x2	x3	x4	x5	x6	x7
29	х3	24	0	-1 /7	1	6 /7	2 /7	0	-1 /7
0	x6	4	0	13 /7	0	13 /7	-4 /21	1	-5 /21
48	х1	34	1	6 /7	0	-1 /7	-1 /21	0	4 /21
2328	0	7	0	8	6	0	5

Решение одной из пары двойственных задач можно найти, зная только ответ к другой задаче и пользуясь 2-й теоремой двойственности: если i-e ограничение одной из пары двойственных задач на компонентах оптимального решения есть строгое неравенство, то оптимальное значение i-й переменной другой задачи равно 0, или, что то же самое - если оптимальное значение j-й переменной одной задачи строго положительно, то j-e ограничение другой из пары двойственных задач на компонентах оптимального решения есть равенство.

Важен экономический смысл двойственных оценок. Двойственная оценка, например, третьего ресурса у3
=5 показывает, что добавление одной единицы третьего ресурса обеспечит прирост прибыли на 5 единиц.

Расшивка "узких мест" производства

Таблица N 3

C	B	H	48	30	29	10	0	0	0
C	B	H	x1	x2	x3	x4	x5	x6	x7
29	х3	24	0	-1 /7	1	6 /7	2 /7	0	-1 /7
0	x6	4	0	13 /7	0	13 /7	-4 /21	1	-5 /21
48	х1	34	1	6 /7	0	-1 /7	-1 /21	0	4 /21
2328	0	7	0	8	6	0	5

При выполнении оптимальной производственной программы первый и третий ресурсы используются полностью, тем самым они образуют "узкие места" производства. Будем их заказывать дополнительно. Пусть Т=( t1
,t2
,t3
) - вектор дополнительных объемов ресурсов. Так как мы будем использовать найденные двойственные оценки ресурсов, то должно выполняться условие H+Q-
l
Т≥0, где Н - значения базисных переменных в последней симплексной таблице, а Q-1
- обращенный базис, который образуют столбцы при балансовых переменных в этой таблице. Задача состоит в том, чтобы найти вектор Т, максимизирующий суммарный прирост прибыли W=6t1
+5 t3
при условии сохранения двойственных оценок ресурсов (и, следовательно, ассортимента выпускаемой продукции), предполагая, что можно получить дополнительно не более 1/3 первоначального объема ресурсов каждого вида.

24 2
/7
0 -1
/7
t1
0

4 + -4
/21
1 -5
/21
0 ≥ 0

34 -1
/21
0 4
/21
t3
0

t1
198

0 ≤ 1
/3
96

t3
228

t1
≥0, t3
≥0.

W=6t1
+5t3
-max

-2
/7
t1
+ 1
/7
t3
≤ 24

4
/21
t1
+ 5
/21
t3
≤ 4

1
/21
t1
- 4
/21
t3
≤ 34

t1
≤198
/3
, t3
≤228
/3
.

t1
≥0, t3
≥0.

Как видно, после графического решения (График 2) программа расшивки приобретает вид:

t1
=21, t2
=0, t3
=0

С новым количеством ресурсов: 198+21 219

b' = 96+0 = 96

228+0 228

у предприятия будет новая производственная программа.

Найдем h'=Q-1
b'

5
/28
0 -1
/7
219 30 -x3

-4
/7
1 -1
/7
96 = 0 -x6

-3
/28
0 2
/7
228 33 -x1

Теперь новая производственная программа имеет вид: X'о
pt
=(33;0;30;0). При этом второй ресурс был использован полностью.

219

При наличии ресурсов b' = 96 производство наиболее выгодно, так как

228

достигается max прибыль с использованием всех ресурсов. Также обратим внимание на то, что производство продукции 1–го вида при заказе дополнительных ресурсов необходимо будет уменьшить на 15 единиц, а производство продукции 3–го вида – увеличить на единицу.

ΔLmax
=(Y,t)=6·21=126, где Y=(6;0;5); t(21;0;0)

L'max
= ΔLmax
+ Lmax
=126+2328=2454.

Этот результат можно проверить, подставив значения х1
и х3
в первоначальную целевую функцию: L'max
=48xl
+30x2
+29x3
+10x4
=31·37+41·21=1147+861=2454.

Транспортная задача

Транспортная задача формулируется следующим образом. Однородный продукт, сосредоточенный в т
пунктах производства (хранения) в количествах a1
, а2
,..., аm
единиц, необходимо распределить между п
пунктами потребления, которым необходимо соответственно b1
, b2,
,…,
bn
единиц. Стоимость перевозки единицы продукта из i-ro пункта отправления в j-й пункт назначения равна cij
и известна для всех маршрутов. Необходимо составить план перевозок, при котором запросы всех пунктов потребления были бы удовлетворены за счет имеющихся продуктов в пунктах производства и общие транспортные расходы по доставке продуктов были минимальными.

Обозначим через xij
количество груза, планируемого к перевозке от i-ro поставщика j-му потребителю. При наличии баланса производства и потребления

математическая модель транспортной задачи будет выглядеть так:

найти план перевозок

X=(xij
), xij
³0, iÎNm
, jÎNn

минимизирующий общую стоимость всех перевозок

при условии, что из любого пункта производства вывозится весь продукт

, iÎNm

и любому потребителю доставляется необходимое количество груза

, jÎNn

Для решения транспортной задачи чаще всего применяется метод потенциалов.
Пусть исходные данные задачи имеют вид

А(а1
,а2
,а3
)=(40;45;70); В(b1
,b2
,b3
)=(48;30;29;40); 3 6 4 3

С= 2 3 1 3

6 5 1 4

Общий объем производства Sai
=40+45+70=155 больше, чем требуется всем потребителям Sbj
=48+30+29+40=147, т.е. имеем открытую модель транспортной задачи. Для превращения ее в закрытую вводим фиктивный пункт потребления с объемом потребления 155-147=8 единиц, причем тарифы на перевозку в этот пункт условимся считать равными нулю, помня, что переменные, добавляемые к левым частям неравенств для превращения их в уравнения, входят в функцию цели с нулевыми коэффициентами.

Первое базисное допустимое решение легко построить по правилу "северо-западного угла".

Таблица 1

Потребл Произв	b1 =48	b2 =30	b3 =29	b4 =40	b5 =8
a1 =40	40 3	6	4	* 3	0	p1 =0
a2 =45	8 2	30 3	7 1	3	0	p2 =-1
a3 =70	6	5	22 1	40 4	8 0	p3 =-1
q1 =3	q2 =4	q3 =2	q4 =5	q5 =1

Обозначим через m(p1
, p2
,…, pm
, q1
, q2
,…, qn
) вектор симплексных множителей или потенциалов. Тогда Dij
=mAij
-cij
, iÎNm
, jÎNn
, откуда следует

Dij
=pi
+qj
-cij
, iÎNm
, jÎNn

Положим, что p1
=0. Остальные потенциалы находим из условия, что для базисных клеток Dij
=0. В данном случае получаем

D11
=0, p1
+q1
-c11
=0, 0+q1
-3=0, q1
=3

D21
=0, p2
+q1
-c21
=0, p2
+3-2=0, p2
= -1

D23
=0, p2
+q3
-c23
=0, -1+q3
-1=0, q3
=2

аналогично, получим: q2
=4, р3
=-1, q4
=5, q5
=1.

Затем вычисляем оценки всех свободных клеток:

D12
=p1
+q2
-c12
=0+4-6= -2

D13
=p1
+q3
-c13
=0+2-4=-2

D14
=2; D15
=1; D24
=1; D25
=0; D31
= -4; D32
= -2

Находим наибольшую положительную оценку:

mах(Dij
>0)=2=D14
,

Для найденной свободной клетки 14 строим цикл пересчета - замкнутую ломаную линию, соседние звенья которой взаимно перпендикулярны, сами звенья параллельны строкам и столбцам таблицы, одна из вершин находится в данной свободной клетке, а все остальные - в занятых клетках. Это будет 14-34-33-23-21-11. Производим перераспределение поставок вдоль цикла пересчета:

40	*	40-r	r	33	7
8	30	7	®	8+r	7-r	®	15	30
22	40	22+r	40-r	29	33

rmax
=7

Получаем второе базисное допустимое решение:

Таблица 2

Потребл Произв	b1 =48	b2 =30	b3 =29	b4 =40	b5 =8
a1 =40	33 3	6	4	7 3	0	p1 =0
a2 =45	15 2	30 3	1	3	0	p2 =-1
a3 =70	6	* 5	29 1	33 4	8 0	p3 =1
q1 =3	q2 =4	q3 =0	q4 =3	q5 = -1

Находим новые потенциалы. Новые оценки:

D12
= -2; D13
= -4; D15
= -1; D23
= -2; D24
= -1; D25
= -2; D31
= -2; D32
=0. Поскольку все Dij
£0 решение является оптимальным:

33 0 0 7

Xо
pt1
= 15 30 0 0

0 0 29 33

Однако, так как оценка клетки D32
=0, делаем вывод о наличие другого возможного оптимального решения. Для его нахождения строим цикл пересчета клетки 32: 32-22-21-11-14-34, производим перераспределение:

Таблица 3

Потребл Произв	b1 =48	b2 =30	b3 =29	ter;">b4 =40	b5 =8
a1 =40	3 3	6	4	37 3	0	p1 =0
a2 =45	45 2	3	1	3	0	p2 =-1
a3 =70	6	30 5	29 1	3 4	8 0	p3 =1
q1 =3	q2 =4	q3 =0	q4 =3	q5 = -1

Находим новые потенциалы. Получаем рi
и qj
соответственно равные потенциалам первого базисного оптимального решения (см. табл. 2). Исходя из этого Dmax
=D32
, однако элемент с индексом 32 уже присутствует в базисе, поэтому пересчет не имеет смысла. Таким образом получаем второе и последнее базисное оптимальное решение:

3 0 0 37

Xо
pt2
= 45 0 0 0

0 30 29 3

Оптимальное распределение инвестиций

Данная задача с n переменными представляется, как многошаговый процесс принятия решений. На каждом шаге определяется экстремум функции только по одной переменной.

Пусть 4 фирмы образуют объединение. Рассмотрим задачу распределения инвестиций в размере 700 тыс. рублей по этим 4 фирмам. Размер инвестиций пусть будет кратен 100 тыс. рублей. Эффект от направления i-й фирме инвестиций в размере ξ (сотен тыс. рублей) выражается функцией fi
(xi
). Приходим к задаче fl
(xl
)+f2
(x2
)+f3
(x3
)+f4
(x4
)-max , где xi
- пока еще неизвестный размер х1
+х2
+х3
+х4
≤7; х1
,х2
,х3
.х4
≥0 инвестиций i-й фирме. Эта задача решается методом динамического программирования: последовательно ищется оптимальное распределение для k=2,3 и 4 фирм.

Пусть первым двум фирмам выделено ξ инвестиций. обозначим z2
(ξ) величину инвестиций 2-й фирме, при которой сумма f2
(z2
j
)+fl
(ξ-z2
j
), 0≤j≤ ξ максимальна, саму эту максимальную величину обозначим F2
(ξ). Далее действуем также: находим функции z3
и F3
и т.д. На k-ом шаге для нахождения Fk
(ξ) используем основное рекуррентное соотношение: Fk
(ξ)=max{fkj
(хk
)+F(
k
-1)
( ξ-хk
); 0 ≤ хk
≤ ξ

xj	100	200	300	400	500	600	700
f1	28	45	65	78	90	102	113
f2	25	41	55	65	75	80	85
f3	15	25	40	56	62	73	82
f4	20	33	42	48	53	56	58

Таблица 1

x2	ξ-х2	0	100	200	300	400	500	600	700
x2	F1 (ξ-x2 ) f2 (x2 )	0	28	45	65	78	90	102	113
0	0	0	28	45	65	78	90	102	113
100	25	25	53	70	90	103	115	127
200	41	41	69	86	106	119	131
300	55	55	83	100	120	133
400	65	65	93	110	130
500	75	75	103	120
600	80	80	108
700	85	85

Жирным цветом обозначен максимальный суммарный эффект от выделения соответствующего размера инвестиций по 2-м предприятиям.

ξ	100	200	300	400	500	600	700
F2	28	53	70	90	106	120	133
x2	0	100	100	100	200	300	300

Таблица 2

х3	ξ-х2	0	100	200	300	400	500	600	700
х3	F3 (ξ-x3 ) f3 (x3 )	0	28	53	70	90	106	120	133
0	0	0	28	53	70	90	106	120	133
100	15	15	43	68	85	105	121	135
200	25	25	53	78	95	115	131
300	40	40	68	93	110	130
400	56	56	84	109	125
500	62	62	90	115
600	73	73	101
700	82	82

Жирным цветом обозначен максимальный суммарный эффект от выделения соответствующего размера инвестиций по 3-м предприятиям.

ξ	100	200	300	400	500	600	700
F2	28	53	70	90	106	121	135
x2	0	0	0	0	0	100	100

Таблица 3

x4	ξ-х4	0	100	200	300	400	500	600	700
x4	F4 (ξ-x4 ) f4 (x4 )	0	28	53	70	90	106	121	135
0	0	135
100	20	141
200	33	139
300	42	132
400	48	118
500	53	106
600	56	84
700	58	58

Жирным цветом обозначен максимальный суммарный эффект от выделения соответствующего размера инвестиций по 4-м предприятиям.

Сведем результаты в 4 таблицы. Теперь F4
(7)=141 показывает максимальный суммарный эффект по всем 4-м фирмам, a z4
(7)=100 тыс. руб. - размер инвестиций в 4-ю фирму для достижения этого максимального эффекта. На долю остальных трех предприятий остается 600 тыс. руб.

Третьему предприятию должно быть выделено х*3
=Х3
(700-х*4
)=Х3
(600)=100 тыс. руб.

Продолжая обратный процесс, находим х*2
=Х2
(700-х*4
-х*3
)=Х2
(500)=200 тыс. руб.

На долю первого предприятия остается х*1
=700-х*4
-х*3
-х*2
=300 тыс. руб.

Таким образом, наилучшим является следующее распределение капитальных вложений по предприятиям:

х*1
=300; х*2
=200; х*3
= 100; х*4
= 100.

Оно обеспечивает производственному объединению наибольший возможный прирост прибыли 141 тыс. руб.

Анализ доходности и риска финансовых операций

Финансовой называется операция, начальное и конечное состояния которой имеют денежную оценку и цель проведения которой заключается в максимизации дохода - разности между конечной и начальной оценками.

Почти всегда финансовые операции проводятся в условиях неопределенности и потому их результат невозможно предсказать заранее. Поэтому финансовые операции рискованны, т.е. при их проведении возможны как прибыль, так и убыток.

Существует несколько разных способов оценки операции с точки зрения доходности и риска. Наиболее распространенным является представление дохода операции как случайной величины и оценка риска операции как среднего квадратического отклонения этого случайного дохода. Однако количественно оценить риск возможно лишь если операция вероятностно характеризуема, т.е. ее доход есть случайная величина - это предполагает возможность неоднократного повторения этой операции. Итак, пусть доход от операции Q есть случайная величина, которую будем обозначать также как и саму операцию Q. Математическое ожидание М[Q] называют еще средним ожидаемым доходом, а риск операции r отождествляют со средним квадратическим отклонением, т.е. квадратным корнем из дисперсии D[Q].

Рассмотрим четыре операции Q1
, Q2
, Q3
, Q4
. Найдем средние ожидаемые доходы Qi
и риски ri
, операций.

; ;

; .

Q1:	0	1	2	8
1 /3	1 /3	1 /6	1 /6

Q1
=0×1
/3
+1×1
/3
+2×1
/6
+8×1
/6
=2

M[Q1
2
]= 02
×1
/3
+12
×1
/3
+22
×1
/6
+82
×1
/6
=11,7

D[Q1
]= 11,7-22
=7,7

r1
=2,77

Q2:	2	3	4	10
1 /3	1 /3	1 /6	1 /6

Q2
=4

M[Q2
2
]=23,7

D[Q2
]=7,7

r2
=2,77

Q3:	0	4	6	10
1 /5	1 /5	1 /5	2 /5

Q3
=6

M[Q3
2
]=50,4

D[Q3
]=14,4

r3
=3,8

Q4:	2	6	8	12
1 /5	1 /5	1 /5	2 /5

Q4
=8

M[Q4
2
]=78,4

D[Q4
]=14,4

r4
=3,8

Нанесем средние ожидаемые доходы Q и риски r на плоскость - доход откладываем по горизонтали, а риски по вертикали (см. график 3);

Получили 4 точки. Чем правее точка (Q,r), тем более доходная операция, чем точка выше - тем более она рисковая. Значит, нужно выбирать точку правее и ниже. Точка (Q',r') доминирует над точкой (Q,r) если Q'>Q и r'<r и хотя бы одно из этих неравенств строгое.

Точка, не доминируемая никакой другой, называется оптимальной по Парето, а множество всех таких точек называется множеством оптимальности по Парето. Легко видеть, что если из рассмотренных операций надо выбирать лучшую, то ее обязательно надо выбрать из операций, оптимальных по Парето.

Для нахождения лучшей операции применяют взвешивающую формулу j(Qi
)=2Qi
-ri
, которая для пар (Q,r) дает одно число, по которому и определяют лучшую операцию.

j(Q1
)=2×2-2,8=1,2 j(Q2
)=6,2

j(Q3
)=8,2 j(Q4
)=12,2

Наибольшее значение j соответствует лучшей операции, наименьшее – худшей. В нашем случае наилучшей является операция №4, худшей – операция №1.

Матричная игра 2х4

Рассмотрим игру для двух лиц с нулевой суммой. Пусть П и В – первый и второй игроки соответственно, а матрица А – платежная матрица, каждый элемент которой по абсолютной величине является выигрышем/ проигрышем, уплачиваемым игроками друг другу в соответствии с их договоренностью. Цель игроков – максимизировать выигрыш. При этом предполагается, что будет сыграно достаточно много партий, так что задача заключается в получении максимального выигрыша в среднем за партию. Каждый из игроков использует наилучшие для себя стратегии. Стратегия называется чистой, если выбор игрока неизменен от партии к партии, и смешанной, если выбор i-ой строки производится с некоторой вероятностью pi
.

Рассмотрим графическое решение игры 2х4 с матрицей

П ®

Седловой точки в чистых стратегиях нет.

В строках доминирования нет.

3-ий столбец доминирует над 1-ым.

Обозначим искомую оптимальную стратегию первого игрока П - (х, 1-х), где

х – вероятность выбора первой строки

(1-х) – вероятность выбора второй строки

0 £ x £ 1

Пусть П играет в смешанных стратегиях, а В отвечает чистыми:

n1
(х)= 2х-2(1-х) (1)

n2
(х)= -2х+(1-х) (2)

n4
(х)= -5х+3(1-х) (4)

n1
(х)= 3х-2

n2
(х)= -3х+1

n4
(х)= -8х+3

т. В(х*, n*)

т. В: n1
=n4

3х-2= -8х+3

11х=5

х*=5
/11

n(х*)=×15
/11
-2= -7
/11

р*(5
/11
; 1-5
/11
)=р*(5
/11
; 6
/11
) – оптимальная смешанная стратегия для П

Ищем оптимальную смешанную стратегию для В.

q(y, 0, 0, 1-y)

p1
* = 5
/11
>0

Рассматриваем вариант, когда В играет в смешанных стратегиях, а П – в чистых стратегиях выбирает первую строку.

-7
/11
= 2y-5(1-y)

y*= 48
/77

q*=(48
/77
, 0, 0, 29
/77
) – оптимальная смешанная стратегия В

Анализ модели краткосрочного страхования жизни

В страховой компании застраховано N1
=900 человек в возрасте 45 лет и N2
=550 человек в возрасте 55 лет сроком на один год. Компания выплачивает наследникам: 100000 руб., в случае смерти застрахованного от несчастного случая, и 25000 руб., в случае смерти от естественных причин в течение года. Компания не платит ничего, если человек проживет этот год. Предположим, что смертность описывается моделью Мейкхама и рассчитаем нетто-премию, цену полиса, страховую надбавку, чтобы вероятность неразорения компании составляла 0,95.

Индивидуальные иски x и x каждого из застрахованных 1-ой и 2-ой групп определяются, соответственно, рядами распределения (для удобства за денежную единицу примем 100000 руб.).

0 ¼ 1 (1)

=0,9982 =0,0013 =0,0005

0 ¼ 1

=0,9962 =0,0044 =0,0005

Здесь вероятности смерти от несчастного случая примем равными 0,0005, а вероятности смерти от естественных причин возьмем из Таблицы продолжительности жизни.

Средние индивидуальные иски Мx и Мx равны соответствующим нетто-премиям Р и Р для клиентов компании 1-ой и 2-ой групп.

Р = Мx = ј*0,0013 + 1*0,0005 » 0,00083 = 83 руб. (2)

Р = Мx = ј*0,0044 + 1*0,0005 » 0,0016 = 160 руб.

I. Сначала рассмотрим решение, основанное на распределении Пуассона.

Чтобы свести задачу к схеме опытов Бернулли можно приближенно заменить ряды распределения (1) следующими таблицами:

0 М(x/x№0) 0 М(x/x№0)

x: x: (3)

а затем в качестве условной денежной единицы принять условные математические ожидания М(x/x№0) в 1-ой таблице и М(x/x№0) – во 2-ой.

Вычислим условные математические ожидания:

М(x/x№0)=ј*Р(x=ј/x№0)+1*Р(x=1/x№0) = =ј*/()+1*= =ј*0,0044/(0,0044+0,0005)+1*0,0005/(0,0044+0,0005)=

=
ј*13
/18
+1*5
/49
= 5
/18
» 0,458=45800 руб. – денежная единица для клиентов 1-ой группы.

М(x/x№0=ј*/()+1*=

=ј*0,0044/(0,0044+0,0005)+1*0,0005/(0,0044+0,0005)=

=. ј*44
/49
+1*5
/49
= 16
/49
» 0,327=32700 руб – денежная единица для клиентов 2-ой группы.

С учетом всех замечаний вместо рядов распределения (3) имеем:

0 1 0 1

x: x: (4)

0,9982 0,0018 0,9962 0,0049

откуда получаем: Мx = 0,0018

Мx = 0,0049.

Подсчитаем сумму исков от застрахованных

1-ой группы:

l = Мx = N1* Мx = 400*0,0018 = 0,7

2-ой группы:

l = Мx = N2* Мx = 1000*0,0049 = 4,9

Общая сумма исков может рассматриваться, как случайная пуассоновская величина с параметром l+l = 5,6

Так как вероятность не разорения компании должна быть не меньше 0,95, необходимо чтобы для общей суммы исков от застрахованных

x = x + x

выполнялось соотношение: Р(x Ј x) і 0,95 , где х – капитал компании.

Очевидно, что х = х, здесь х» 10– квантиль уровня 0,95 для распределения Пуассона. За счет нетто-премий компания может получить только сумму:

5,6=0,7*45800 руб. + 4,9*32700 руб. = 32060 руб.+1060230 руб. = 192290руб.

Поэтому страховая надбавка компании должна составлять:

R=(10-5,6)
/5,6
×100% »78,6% = 0,786*192290 руб.»1511400руб., (5)

а капитал компании:

х = 192290 руб. + 151140 руб. » 343430 руб. (6)

Таким образом, индивидуальные страховые надбавки r и r, цены полисов Р и Р для каждого из клиентов 1-ой и 2-ой группы соответственно равны (они пропорциональны нетто-премиям):

r = 0,52*Р = 0,52*83 руб. » 43 руб.,

r = 0,52*Р = 0,52*160 руб. » 83 руб.,

(7)

Р = Р + r » 43 руб. + 83 руб. = 126 руб.,

Р = Р + r »160 руб. + 83 руб. = 243 руб.

II. Теперь решим задачу с помощью гауссовского приближения. Среднее значение общего суммарного иска от застрахованных

x = Мx + Мx

с учетом средних индивидуальных исков (2) равно:

Мx = N1*Mx+ N2* Мx=400*0,00083+1000*0,0016=

= 0,332 + 1,6 » 1,9 = 190000 руб. (8)

Дисперсию x в виду независимости x и x вычислим по формуле:

Dx = Dx + Dx » 400*0,00058 + 1000*0,00078=

=0,23 + 0,78 = 1,01. (9)

Здесь:

Dx = М(x) - Мx = 0,00058 – (0,00083) » 0,00058 ,

(10)

Dx = М(x) - Мx = 0,00078 – (0,0016) » 0,00078 ,

где с помощью рядов распределения (1) имеем:

М(x) = 1/16*0,0013 + 1*0,0005 » 0,00058 ,

(11)

М(x) = 1/16*0,0044 +1*0,0005 » 0,00078.

На основании центральной предельной теоремы функция распределения нормированной случайной величины:

S= (x - Mx)/,

при N1 + N2 ® Ґ имеет предел

F(x) = (1/)*dz

Для гауссовского приближения случайной величины x верна следующая цепочка равенств:

Р(x < x) = Р((x - Мx)/ Ј (х - Мx)/) » F((x - Mx)/) ,

где х – капитал компании.

Для того чтобы вероятность неразорения компании не превосходила 0,95, т.е.

F((x - Mx)/) і 0,95 должно быть выполнено соотношение

(х - Mx)/ і х, (12)

здесь х» 1,645 – квантиль уровня 0,95 стандартного гауссовского распределения.

Нетрудно убедиться в том, что минимально необходимый капитал компании должен составлять:

х=Мx+х*»1,9+1,645*1,005=1,9+1,65=3,55=355000руб., (13)

а относительная страховая надбавка составляет:

х*/Мx*100%=1,65/1,9*100%»86,8% (14)

Индивидуальные страховые надбавки r и r, цены полисов Р и Р для клиентов 1-ой и 2-ой групп с учетом (2), очевидно будут равны (страховые надбавки пропорциональны нетто-премиям):

r = 0,68*83 руб. » 56 руб.;

r = 0,68*160 руб. » 109 руб.;

(15)

Р = Р + r »83 руб. + 56 руб. = 139 руб.;

Р = Р + r »160 руб. + 109 руб. = 269 руб.

III. Проанализируем результаты, полученные в п.п. I и II. Очевидно расхождение результатов, полученных при использовании пуассоновского и гауссовского приближений. Попытаемся разобраться, в чем причина этого различия.

Дело в том, что при использовании закона Пуассона замена рядов распределения (1) на ряды распределения (3) привела к тому, что не изменились лишь математические ожидания Мxи Мx. В то же время дисперсии Dx и Dx, свидетельствующие о степени рассеяния случайных исков x и x, найденных по рядам распределения (1) и (3), различны. Следовательно, различны и дисперсии Dx, найденные по рядам распределения (1) и (3). Действительно, дисперсия общего суммарного иска x по рядам (1) подсчитана: Dx = 1,24 (см. соотношение (9) ).

Вычислим дисперсию x по рядам распределения (3), т.е.

0 0,458 0 0,327

x: x: (16)

0,9982 0,0018 0,9962 0,0049

Проведя расчеты, аналогичные (9-11), получим:

Dx =Dx + Dx » 400*0,00038 + 1000*0,00052 = 0,67. (17)

Здесь:

Dx = М(x) - Мx = 0,00038 – (0,00083) » 0,00038 ,

(18)

Dx = М(x) - Мx = 0,00052 – (0,0016) » 0,00052 ,

причем:

М(x) = 0,458*0,0018 » 0,00038 ,

(19)

М(x) = 0,327*0,0049 » 0,00052.

В дальнейшем будем использовать следующие обозначения: дисперсию x, найденную с использованием рядов (1), обозначим s, а дисперсию x, найденную по рядам (3) или (16), обозначим s. Таким образом, s = 1,01, а s = 0,67.

Из формулы (12), использующей стандартное гауссовское распределение, непосредственно следует, что относительная страховая надбавка, если Dx = s = 0,67 , равна

х*s/Мx*100% = 1,645*/1,9*100% » 70,9% (20)

Этот результат хорошо согласуется с относительной страховой надбавкой, учитывающей распределение суммарного иска x по закону Пуассона, равной 86,8% (см. (5)).

Учитывая вышеизложенное, напрашивается естественный вывод: если относительная страховая надбавка, капиталл компании, обеспечивающий неразорение компании с вероятностью 0,95, и цена полиса вычисляются, исходя из распределения суммарного иска застрахованных по закону Пуассона, то для нахождения основных характеристик компании необходимо ввести поправочный коэффициент, равный k = s1 /s2.

Проиллюстрируем применение коэффициента k для коррекции результатов, полученных в п.I:

страховая надбавка с учетом (5) станет равной:

R= k*R = *86,8%=1,2*86,8% » 71,4% » 135660 руб. (21)

капитал компании (см.(6)) станет равным:

х= 190000 руб. + 135660 руб. » 325660 руб., (22)

а индивидуальные страховые надбавки и цены полисов (см.(7)):

r = k*r » 1,2*43 руб. » 54 руб.,

r = k*r » 1,2*83 руб. » 100 руб.,

(23)

Р = Р + r » 83 руб. + 54 руб. = 137 руб.,

Р = Р + r » 160 руб. + 100 руб. = 260 руб.

В заключение необходимо отметить, что характеристики работы компании, полученные с учетом коррекции результатов исследования, в котором суммарный иск застрахованных подчинен распределению Пуассона хорошо согласуется с характеристиками работы страховой компании.

Слов:	7994
Символов:	85205
Размер:	166.42 Кб.

C	B	H	48	30	29	10	0	0	0
C	B	H	x1	x2	x3	x4	x5	x6	x7
0	x5	198	3	2	4	3	1	0	0
0	x6	96	2	3	1	2	0	1	0
0	x7	228	6	5	1	0	0	0	1
0	-48	-30	-29	-10	0	0	0

xj	100	200	300	400	500	600	700
f1	28	45	65	78	90	102	113
f2	25	41	55	65	75	80	85
f3	15	25	40	56	62	73	82
f4	20	33	42	48	53	56	58

ξ	100	200	300	400	500	600	700
F2	28	53	70	90	106	120	133
x2	0	100	100	100	200	300	300

C	B	H	48	30	29	10	0	0	0
C	B	H	x1	x2	x3	x4	x5	x6	x7
0	x5	198	3	2	4	3	1	0	0
0	x6	96	2	3	1	2	0	1	0
0	x7	228	6	5	1	0	0	0	1
0	-48	-30	-29	-10	0	0	0

xj	100	200	300	400	500	600	700
f1	28	45	65	78	90	102	113
f2	25	41	55	65	75	80	85
f3	15	25	40	56	62	73	82
f4	20	33	42	48	53	56	58

ξ	100	200	300	400	500	600	700
F2	28	53	70	90	106	120	133
x2	0	100	100	100	200	300	300

Название реферата: Линейное и динамическое программирование

C	B	H	48	30	29	10	0	0	0
C	B	H	x1	x2	x3	x4	x5	x6	x7
0	x5	198	3	2	4	3	1	0	0
0	x6	96	2	3	1	2	0	1	0
0	x7	228	6	5	1	0	0	0	1
0	-48	-30	-29	-10	0	0	0

xj	100	200	300	400	500	600	700
f1	28	45	65	78	90	102	113
f2	25	41	55	65	75	80	85
f3	15	25	40	56	62	73	82
f4	20	33	42	48	53	56	58

ξ	100	200	300	400	500	600	700
F2	28	53	70	90	106	120	133
x2	0	100	100	100	200	300	300