Побудова моделі вибору рішення

Формулювання мети. Розрізняють головну (кінцеву) мету і проміжні (етапні) цілі, в тому числі одномоментні. Тому, виробляючи стратегію поведінки на певний проміжний період, слід мати на увазі, що при незмінності головної мети, етапні цілі можуть перетворюватися в залежності від мінливих обстановки та умов їх досягнення. У зв’язку з цим алгоритмічно задається можливість вибору оптимальної стратегії на кожному такому етапі. У загальному вигляді для досягнення кінцевої мети використовується схема її декомпозиції “зверху вниз” у вигляді “дерева рішень”, окремі вузли та гілки якого можуть перетворюватися при отриманні поточної інформації. Цілі можуть бути сформульовані лексикографічно, математично чи іншим способом.

Інформаційний рівень ЛПР. Розглядаються традиційні рівні:

  • – Детермінований – певна ситуація;
  • – Стохастичний – ситуація ризику;
  • – Невизначений – ситуація невизначеності;
  • – Додатково включаються ситуації невідомості (відомі не всі можливі стратегії супротивника або “Природи”) і катастрофічною невідомості (жодна з цих стратегія не передбачається).

Завданням сенсорної зони є підвищення інформаційного рівня ЛПР. Критерієм служить міра достатності інформації для вибору детермінованого рішення в даній ситуації. При недостатньої інформації зона вибору рішення посилає додатковий запит в сенсорну зону.

Стратегії ЛПР. Перелік стратегій кожного технічного (робототехнического) вироби обмежується наявністю і можливостями її виконавчих пристроїв. Вибір оптимальної стратегії є завданням даної зони кори головного мозку. Він здійснюється за формальними правилами, залежно від цілей, інформаційного рівня ЛПР, а також обраних принципів і критеріїв оптимальності, що визначається, зокрема, характером ситуації. Це означає, що в кожному окремому випадку (на кожному етапі) будується приватна модель прийняття рішень. Оптимальною визнається така стратегія, яка поряд з максимізацією виграшу – у можливій для даної ситуації мірою – мінімізує неминучі і невиправдані втрати.

Принцип оптимальності. Вибір принципу оптимальності для кожного типу ситуацій задається конструктивно в алгоритмизировать вигляді. Формулювання цього принципу зумовлює правила вибору оптимальної стратегії в кожній із ситуацій. Це означає, що залежно від конкретної мети, її ієрархічного рівня і особливостей ситуації допустима і доцільна зміна принципів оптимальності. Правила вибору принципу оптимальності залежно від комплексу перерахованих умов задаються конструктивно і реалізуються алгоритмічними засобами.

Критерії оптимальності. Критерій – це оціночний показник. Без урахування витрат, а тільки у вигляді запобіжного її досягнення – це формалізована мета – критерій результативності.

Критерій оптимальності за змістом включає обидва названі критерії – результативності та ефективності. Це і міра досягнення мети, і готовність враховувати при цьому як неминучі, так і невиправдані втрати. Вибір критерію оптимальності є прерогативою ЛПР. В даному випадку критерій оптимальності задається конструктивно і реалізується алгоритмічно залежно від особливостей ситуації, як і при виборі принципу оптимальності.

Виграші. Під виграшами розуміють очікувані результати вибору тієї чи іншої стратегії ОПР за умови вибору тієї чи іншої стратегії противником (декількома супротивниками) чи “Природою”. При моделюванні розглядають очікувані виграші, при реалізації рішення – фактичні. Вони і оцінюються в якості результатів виконаного рішення ЛПР на кожному етапі його дій.

Розміри і форми подання виграшів призначаються ЛПР. У цьому завданню ця функція належить розробнику і реалізується алгоритмічно залежно від особливості (типу) ситуації.

Призначення виграшів. Під цим терміном розуміють визначення форми і величини виграшів, що залежить від особливостей ситуації і обраної форми моделі вибору рішення. Залежно від цілей, діапазону розв’язуваних завдань і виконавських можливостей вироби варіанти призначення виграшів для моделей прийняття рішень різного типу також задаються конструктивно і вводяться в модель алгоритмічно, в тому числі за поданням сценарної зони. Для цього використовується завершальна формулювання імплікації (, то …).

Оптимальною формою призначення виграшів є величина корисності того чи іншого результату. Корисність – це міра переваги даного результату для ЛПР. При призначенні виграшів в числовій формі більше число приписується виграшу, що володіє найбільшою користю.

При призначенні виграшів у лексикографічної формі встановлюється система їх уподобань.

Рефлексивні методи прийняття рішень. Можливості даного програмно-апаратного комплексу не дозволяють використовувати справжню рефлексію, доступну живому мозку. Проте є прийом, який можна назвати імітує рефлексивність. Його сутність полягає в модельній інверсії гравців – в зміні місцями в моделі прийняття рішень позицій ЛПР і активного супротивника. Вибір оптимального рішення таким “противником”, що фігурують в ролі ЛПР в інвертіро-

ванній моделі, дозволить розглянути цю стратегію фактичного супротивника при зворотній інверсії моделі в її початковий стан. Таку процедуру можна виконати, не використовуючи її результати для видачі команд на виконання отриманих рішень до остаточного аналізу переваг цього попереднього прийому.

Для використання даного прийому потрібні чіткі підстави:

– Відсутність достатньої інформації про наміри активного противника;

– Відсутність повного переліку передбачуваних стратегій супротивника для побудови моделі прийняття рішень при класичній ситуації невизначеності;

– Наявність ситуації невідомості або катастрофічної невідомості;

– Залежність вибору оптимальної стратегії ОПР від реалізації свого рішення противником.

Наявність хоча б одного з таких підстав конструктивно задіє стандартний алгоритм автоматичного перекладу моделі в інвертовану форму і блокує можливості запуску команд виконавчим засобам до остаточного вирішення ЛПР після зворотної інверсії.

Форма моделі ємства рішень. З численних формальних моделей прийняття рішень для цілей і поточних завдань даних виробів доцільно використовувати тільки матричну і позиційну форми. Матрична форма призначена для одномоментного вибору, позиційна – для багатоетапного.

Нижче представлений перелік правил вибору рішень, що залежать від інформаційного рівня ЛПР.

Певна ситуація. Вибір ЛПР детермінований. Оптимальною буде стратегія, найбільш ефективна при даному ході протидіє боку, ефективна при обраному принципі і критерії оптимальності.

Ситуація ризику. Стохастичний інформаційний рівень. Теоретично оптимальне використання статистичного апарату вибору стратегії ОПР. Наскільки це виявиться практично доцільним, передбачити неможливо. У ситуації ризику слід використовувати всі можливості для переведення її на детермінований інформаційний рівень.

Невизначена ситуація. На даному рівні використовується формальний апарат математичної теорії ігор, зокрема антагоністичних.

За відсутності активного супротивника і наявності інших учасників ситуації вибору рішення може бути використаний апарат

неантагоністіческіх ігор.

При необхідності розрахунку оптимальності багатокрокової стратегії ОПР будується модель позиційної гри.

Ситуація невідомості характеризується відсутністю інформації про частину можливих стратегій супротивника. Прийнятним рішенням у такому випадку буде вибір стратегії, оптимальної по відношенню до відомих альтернатив протидіє сторони.

Ситуація катастрофічною невідомості виникає при відсутності якої б то не було інформації про стратегії супротивника або “Природи”. Будь-які припущення можуть виявитися помилковими, а результати їх реалізації – катастрофічними. Є декілька прийнятних варіантів вибору оптимальної поведінки в такій ситуації. Це методи проб і помилок.

Відсутність аналогій, яких позитивних результатів при використанні аналогічних їм рішень, або відсутність позитивних результатів при равновероятном розподілі стратегій в групі виробів викликає нагальну необхідність підвищення інформаційного рівня ЛПР. “Чистий” метод проб і помилок може виявитися небезпечніше паузи для отримання хоч якоїсь інформації. У такому випадку рішення про тактику доцільно покласти на керівника вироби.

ПОДІЛИТИСЯ: