Портал освітньо-інформаційних послуг «Студентська консультація»

  
Телефон +3 8(066) 185-39-18
Телефон +3 8(093) 202-63-01
 (093) 202-63-01
 studscon@gmail.com
 facebook.com/studcons

<script>

  (function(i,s,o,g,r,a,m){i['GoogleAnalyticsObject']=r;i[r]=i[r]||function(){

  (i[r].q=i[r].q||[]).push(arguments)},i[r].l=1*new Date();a=s.createElement(o),

  m=s.getElementsByTagName(o)[0];a.async=1;a.src=g;m.parentNode.insertBefore(a,m)

  })(window,document,'script','//www.google-analytics.com/analytics.js','ga');

 

  ga('create', 'UA-53007750-1', 'auto');

  ga('send', 'pageview');

 

</script>

Розробки алгоритму ідентифікації складних об’єктів моніторингу на основі нечітких алгоритмів кластерного аналізу

Предмет: 
Тип роботи: 
Бакалаврська робота
К-сть сторінок: 
62
Мова: 
Українська
Оцінка: 

результатів, як і для звичайної відстані Евкліда. Проте при його застосуванні вплив окремих великих різниць (викидів) зменшується (оскільки вони не зводяться в квадрат). Формула для розрахунку манхеттенскої відстані:

 ;                                     (2.3)

- відстань Чебишева. Ця відстань може виявитися корисною, коли треба визначити два об'єкти як «різні», якщо вони розрізняються по будь - якій одній координаті. Відстань Чебишева обчислюється за формулою:

 ;                                     (2.4)

- степенева відстань. Застосовується у разі, коли необхідно збільшити або зменшити вагу, що відноситься до розмірності, для якої відповідні об’єкти сильно відрізняються. Степенева відстань обчислюється за наступною формулою:

 ,                                     (2.5)

де r і p – параметри, що визначаються користувачем. Параметр p відповідальний за поступове зважування різниць по окремих координатах, параметр r відповідальний за прогресивне зважування великих відстаней між об’єктами. Якщо обидва параметри – r і p – рівні 2, то ця відстань співпадає з відстанню Евкліда.

Вибір метрики повністю лежить на досліднику, оскільки результати кластеризації можуть істотно відрізнятися при використанні різних метрик [19].

Для даного випадку найбільш доцільна метрика — Евклідова [5], так як дана міра ідеально підходить для розрахунку географічних відстаней та бойових порядків. Решта метрик менш доцільніші, так як вони застосовуються для вирішення інших специфічних завдань, і не придатні для здійснення кластеризації просторових даних. Основні характеристики бойових порядків засобів ППО і ознаки по яких можливо здійснювати кластеризацію представлені у табл. 2.1.

Таблиця 2.1

Основні характеристики бойових порядків засобів ППО і ознаки по яких можливо здійснювати кластеризацію

Назва дивізіонуКількість бойових батарей, шт.Відстань між бойовими батареями, кмВіддаленість від переднього краю, кмДальність зв’язку, км

“Чапарел - Вулкан”38-15>158-30

“Петріот”630-50>4030-100

“Удосконалений Хок”3-415-40>3515-80

 

Ознаки, по яким здійснюється кластеризація:

- кількість бойових батарей - N;

- відстань між бойовими батареями  ;

- віддаленість від переднього краю  ;

- дальність зв’язку  .

 

2.2 Вибір доцільного алгоритму  кластеризації складних об’єктів моніторингу

 

Проаналізувавши відомі алгоритми кластеризації [4] , для вирішення задачі ідентифікації, найбільш доцільними є нечіткі алгоритми. Нечіткі методи кластеризації, на відміну від чітких, дозволяють одному і тому ж об’єкту належати одночасно кільком кластерам з різним ступенем приналежності. Нечітка кластеризація в багатьох ситуаціях переважає чітку, зокрема для об’єктів, розташованих на грані кластерів.

Алгоритм кластеризації складається з ряду блоків:

- вибір початкового нечіткого розбиття n об’єктів k кластерів шляхом вибору матриці приналежності U розміру n x k;

- пошук значення критерію нечіткої помилки, використовуючи матрицю U:

 ,                         (2.6)

де   – «центр мас» нечіткого кластера k :

 ;                                         (2.7)

- кожне спостереження «приписується» до одного з n кластерів – того, відстань до якого найкоротша;

- розраховується новий центр кожного кластера як елемент, ознаки якого розраховуються як середнє арифметичне ознак об’єктів, що входять у цей кластер.

Відбувається така кількість ітерацій (повторюються кроки 3-4), поки кластерні центри не стануть стійкими (тобто при кожній ітерації в кожному кластері виявлятимуться одні й ті самі об’єкти). Це повторення грунтоване на мінімізації цільової функції, яка представляє собою відстань від будь-якого елемента кластера у центрі самого кластеру, зважених щодо членства класу, відносно іншого елемента кластера. Дисперсія всередині кластера буде мінімізована, а між кластерами – максимізована. Цей алгоритм може не підійти, якщо заздалегідь невідоме число кластерів, або необхідно однозначно віднести кожен об'єкт до одного кластера.

Переваги:

- простота та швидкість виконання.

Недоліки:

- результат кластеризації у найбільшій мірі залежить від випадкових початкових позицій кластерних центрів;

- алгоритм чутливий до аномальних вимірів (викидів), які можуть викривлювати середнє.

Існують наступні алгоритми нечіткого кластерного аналізу:

- FCM (Fuzzy c-means – нечітких c-середніх); 

- гірської кластеризації;

- поступово зростаючого розбиття.

Алгоритм FCM

Алгоритм нечіткої кластеризації називають FCM - алгоритмом (Fuzzy Classifier Means, Fuzzy C-Means). Метою FCM - алгоритму кластеризації є автоматична класифікація безлічі об'єктів, які задаються векторами ознак в просторі ознак. Іншими словами, такий алгоритм визначає кластери і відповідно класифікує об'єкти. Кластери представляються нечіткими множинами, і, крім того, межі між кластерами також є нечіткими. 

FCM-алгоритм кластеризації припускає, що об'єкти належать усім кластерам з певним ступенем приналежності. Ступінь приналежності визначається відстанню від об'єкта до відповідних кластерних центрів. Даний алгоритм ітераційно обчислює центри кластерів і нові ступені приналежності об'єктів.

Алгоритм нечіткої кластеризації виконується наступним чином :

а) ініціалізація.

Вибираються наступні параметри: 

- необхідна кількість кластерів N, 2 <N <К;

- міра відстаней (Евклідова);

Фото Капча