Предмет:
Тип роботи:
Дипломна робота
К-сть сторінок:
73
Мова:
Українська
– інтервал між випадковими подіями (випадкова величина τj).
2.2.3. Принцип максимуму Понтрягіна
Ефективним засобом дослідження задач оптимального управління є принцип максимуму Понтрягіна, який представляє собою необхідну умову оптимальності в таких задачах.
Формулювання принципу максимуму. Розглянемо задачу оптимального управління (2. 26) :
(2. 26)
,
де (2. 27)
,
При цьому передбачається, що моменти to, Т фіксовані, тобто розглядається задача з закріпленим часом; множина U не залежить від часу, фазові обмеження відсутні. Покладемо
(2. 28),
де - константа, .
Функція Н називається функцією Гамільтона. Система лінійних диференціальних рівнянь відносно змінних називається сполученої системою, відповідної управління u і траєкторії х. Тут
(2. 29)
У більш докладної покоординатної записі сполучена система приймає вигляд
(2. 30)
Система (2. 30) має за будь-яких початкових умовах єдине рішення , визначене і безперервне на всьому відрізку .
Наступна теорема висловлює необхідні умови оптимальності в задачі (2. 26).
Теорема (принцип максимуму Понтрягіна). Нехай функції і Ф, g1,..., gm мають похідні по змінним х1,..., Хn і неперервні разом з цими похідними по сукупності аргументів х , u U, t [to. Т]. Припустимо, що (u, х) – рішення задачі (2. 26). Тоді існує рішення сполученої системи (2. 29), що відповідає управлінню u і траєкторії х, і константа такі, що | | + || (t) || при t [to, Т], і виконуються наступні умови:
а) (умова максимуму) при кожному t [to. Т] функція Гамільтона, досягає максимуму по при v = u (t), т. е.
(2. 31)
б) (умова трансверсальності на лівому кінці траєкторії) існують числа , такі, що
(2. 32)
в) (умова трансверсальності на правому кінці траєкторії) існують числа такі, що
(2. 33)
Центральним у теоремі є умова максимуму (2. 31). Якщо відмовитися від припущення про те, що кінцевий момент часу Т фіксований, то теорема залишиться справедливої за винятком умови трансверсальності на правому кінці траєкторії. Умову (2. 33) замінимо умовою
(2. 34)
і додамо ще одну умову трансверсальності на правому кінці траєкторії:
(2. 35)
Необхідність в принципі максимуму Понтрягіна виникає у разі коли ніде в допустимому діапазоні керуючої змінної неможливо задовольнити необхідній умові.
2.3. Чисельне розв’язання економіко-математичної моделі впливу реклами на капітал компанії
До розгляду пропонується модель компанії, яка з метою збільшення капіталу у своїй діяльності використовує рекламу. Завдання – визначити S (T) – максимальний капітал компанії за період T в середньому.
Отже, компанія буде характеризуватися S (t) – капітал, яким володіє компанія в момент t. Будемо вважати, що компанія за час [t; t + Δt] несе витрати [c0 + c1S (t) ]. Величина c0 описує постійні витрати, пов'язані з витратами на оренду, світло і т. д., а величина c1 показує витрати, пов'язані з обслуговуванням капіталу, наприклад, податки. Крім того, будемо вважати, що за час [t; t + Δt] частина капіталу αS (t) Δt виділяється на рекламу. Введемо величину R (t) – функцію ефективності реклами. Її вплив проявляється в тому, що потік покупців є пуассонівським потоком з інтенсивністю (l0 + l1R (t)), де l0 визначає інтенсивність потоку покупців без потоку. Тоді зміни капіталу за період часу t будуть наступними:
1. Відбувається продаж товару на суму – випадкової величини з функцією розподілу F ( ) з ймовірністю (l0+l1R (t)) t.
2. Нічого не відбувається.
Тому зміни капіталу S (t) за момент часу t складуть величину.
(2. 36)
Отже, за t S (t + t) = S (t) + S (t).
Усереднимо останній вираз M{S (t + t) } = M {S (t) } + M { S (t) }.
Так як процес покупок випадковий, то величина S (t) є випадковий процес, а отже, і ступінь впливу реклами стає випадковим процесом, оскільки на рекламу виділяється частка капіталу αS (t) Δt.
Позначимо M{S (t) }=S1 (t), M{R (t) }=R1 (t), M{ }=a1.
(2. 37)
Переносимо в праву частину S1 (t) і ділимо вираз на t, t 0.
(2. 38)
Розглянемо зміну функції ефективності реклами за t.
Будемо вважати, що на вплив реклами R (t) діють два процеси: а) процес збільшення R (t), обумовлений вкладенням в рекламу капіталу αS (t) Δt і б) процес забування реклами, пропорційний самої R (t). Тому
, (2. 39)
(2. 40)
де коефіцієнт визначає швидкість забування реклами, а – ступінь впливу грошей, вкладених в рекламу. Усереднюючи, отримаємо
(2. 41)
або після звичайних перетворень
(2. 42)
Отримали систему диференціальних рівнянь. Оскільки завданням є отримання максимального капіталу в кінцевий момент часу Т, то з урахуванням введених позначень функціонал буде мати вигляд S1 (t) =>