Оптичне розпізнавання образів

Предмет:

Тип работы:

Доповідь

К-во страниц:

Язык:

Українська

Оценка:

Існує безліч варіантів реалізації голографічних коректорів і проте їх основні принципи функціонування дуже схожі. Всі вони запам'ятовують зразкові зображення у вигляді або плоскої, або об'ємної голограми і відновлюють їх при когерентному освітленні в петлі зворотного зв'язку. Вхідне зображення, яке може бути зашумленим або неповним, подається на вхід системи і одночасно корелюєтся оптично з всіма запам'ятовуваними зразковими зображеннями. Ці кореляції обробляються пороговою функцією і подаються зворотно на вхід системи, де найбільш сильні кореляції посилюють (і, можливо, корегують або завершують) вхідне зображення. Підсилене зображення проходить через систему багато разів, змінюючись при кожному проході доти, поки система не стабілізується на необхідному зображенні. Помітимо, що для опису розпізнаваних образів використовувався термін «зображення». Хоч розпізнавання зображень є найбільш адекватним застосуванням для оптичних кореляторів, вхід системи може розглядатися як узагальнений вектор і система при цьому стає загальноцільовою асоціативною пам'яттю.

Багато дослідників зробили великий внесок в розвиток голографічних кореляторів і їх теорії.

Рис. 1. Оптична система розпізнавання зображень

У конфігурації, показаній на рис. 1, входом в систему є зображення, сформоване транспарантом, освітленим лазерним променем. Це зображення через дільник променя передається на пороговий пристрій, функції якого описані нижче. Зображення відбивається від порогового пристрою, повертається на дільник променя і попадає на лінзу 1, яка фокусує його на першої голограмі.

Перша голограма містить декілька запам'ятовуваних зображень (наприклад, зображення чотирьох літаків). Вхідне зображення корелюєтся з кожним з них, утворюючи світлові образи. Яскравість цих образів змінюється в залежності від міри кореляції, що визначає схожість між двома зображеннями. Лінза 2 і відбивач 1 проектують зображення кореляцій на мікроканальний масив, де вони просторово розділяються. З мікроканального масиву множина світлових образів передається на відбивач 2 через лінзу 3 і потім надається до другої голограми, яка має ті ж запам'ятовувані зображення, що і перша голограма. Лінза 4 і відбивач 3 передають суперпозицію множини корельованих зображень на зворотну сторону порогового пристрою.

Пороговий пристрій є ключовим для функціонування цієї системи. Його передня поверхня відображає найбільш сильно той образ, який є самим яскравим на його зворотній поверхні. У цьому випадку на зворотну поверхню проектується набір з чотирьох кореляцій кожного з чотирьох запам'ятовуваних зображень з вхідним зображенням. Запам'ятовуване зображення, найбільш схоже на вхідне зображення, має саму високу кореляцію, отже, воно буде самим яскравим і найбільш сильно відбитим від передньої поверхні. Це посилене відображене зображення проходить через дільник променя, після чого повторно вводиться в систему для подальшого посилення. У результаті система буде сходиться до запам'ятовуваного зображення, найбільш схожого на вхідний вектор. Після цього можна забрати вхідний образ, і запам'ятовуваний образ буде продовжувати циркулювати в системі, проводячи вихідне зображення, до скидання системи.

Записана на відеострічку демонстрація цієї системи показала її здатність відновлювати повне зображення у випадку, коли тільки частина зображення подається на вхід системи. Ця властивість має важливе військове застосування, оскільки розпізнавання мети часто повинне бути виконане в умовах часткової видимості. Крім того, можливі багато інших промислових застосувань, розпізнавання об'єктів як множини ліній є задачею, що вирішується протягом багатьох років.

Незважаючи на потенційні можливості оптичних кореляторів, якість зображення в існуючих системах є невисокою, а їх складність і вартість високі. Крім того, в цей час оптичні корелятори мають великі розміри і складні для налаштування. Великі потенційні можливості оптичних кореляторів будуть стимулювати проведення досліджень по вдосконаленню таких систем, однак в цей час багато питань залишаються без відповіді, незважаючи на їх практичне значення.

У зв'язку з великим обсягом даних, які потрібно вводити, постає питання про автоматизацію процесу вводу. Найбільш оптимальним методом автоматизації є оптичне розпізнавання образів з готових форм. При сучасному рівні розвитку технологій сканування та розпізнавання образів можна довести швидкість вводу до 100 000 аркушів на добу при якості автоматичного розпізнавання 95-98%. Автоматичне розпізнавання даних дозволяє уникнути таких помилок, як неправильний набір даних оператором, набір даних в неправильних полях форми, розбіжність даних за форматом. Досить простим та прозорим стає масштабування системи. Так, підвищення обсягу обробки на 1000 аркушів на добу потребує лише обладнання ще одного робочого місця. Якість вводу інформації перестає залежати від людського фактору, швидкість вводу легко піддається прогнозу та плануванню.

Програмне забезпечення, яке здійснює обробку та розпізнавання даних, відповідає наступним вимогам:

- гнучкість та простота настроювання на різноманітні типи форм;

- висока швидкість та якість розпізнавання;

- захист від несанкціонованого доступу;

- контроль над операторами в процесі обробки;

- простота експлуатації, програмне забезпечення не вимагає високої кваліфікації оператора;

- перехресні перевірки розпізнаних даних за словниками та базами даних;

- автоматичний контроль сум;

- простий та ефективний швидкодіючий інтерфейс до системи для сполучення з базою даних;

- здатність працювати в умовах коливання обсягу вводу від одиниць до кількох тисяч аркушів.

Оскільки призначення підсистеми розпізнавання – обробка великої кількості вхідних форм, ця підсистема підтримує такі можливості розподілення операцій, як:

- пакетна обробка даних, коли форми поєднуються у іменовані пакети, що проходять по стадіях обробки;

- централізоване адміністрування комплексу;

- безперервний моніторинг процесу обробки, окремих станцій, операторів та