Головна Головна -> Реферати українською -> Дисертації та автореферати -> ЕФЕКТИВНІСТЬ БАЙЄСІВСЬКИХ МЕТОДІВ РОЗПІЗНАВАННЯ

ЕФЕКТИВНІСТЬ БАЙЄСІВСЬКИХ МЕТОДІВ РОЗПІЗНАВАННЯ

Назва:
ЕФЕКТИВНІСТЬ БАЙЄСІВСЬКИХ МЕТОДІВ РОЗПІЗНАВАННЯ
Тип:
Реферат
Мова:
Українська
Розмiр:
14,84 KB
Завантажень:
278
Оцінка:
 
поточна оцінка 5.0


Скачати цю роботу безкоштовно
Пролистати роботу: 1  2  3  4  5  6  7  8  9  10 
Національна академія наук України
Інститут кібернетики імені В.М. Глушкова
БІЛЕЦЬКИЙ Борис Олександрович
УДК 519.217.2
ЕФЕКТИВНІСТЬ БАЙЄСІВСЬКИХ МЕТОДІВ
РОЗПІЗНАВАННЯ
01.05.01 – теоретичні основи інформатики та кібернетики
Автореферат
дисертації на здобуття наукового ступеня
кандидата фізико-математичних наук
Київ – 2007


Дисертацією є рукопис.
Робота виконана в Інституті кібернетики імені В.М. Глушкова НАН України.
Науковий керівник: доктор фізико-математичних наук, професор
Гупал Анатолій Михайлович,
Інститут кібернетики ім. В.М. Глушкова
НАН України, завідувач відділу.
Офіційні опоненти: доктор фізико-математичних наук,
провідний науковий співробітник
Норкін Володимир Іванович,
Інститут кібернетики ім. В.М. Глушкова
НАН України,
кандидат фізико-математичних наук, доцент
Семенов Володимир Вікторович,
Київський національний університет
імені Тараса Шевченка.
Захист відбудеться 25.01.2008 р. о(об) 12 годині на засіданні спеціалізованої вченої ради Д 26.194.02 при Інституті кібернетики імені В.М. Глушкова НАН Україні за адресою:
03680, МСП, Київ-187, проспект Академіка Глушкова, 40.
З дисертацією можна ознайомитися в науково-технічному архіві інституту.
Автореферат розісланий 18.12.2007 р.
Учений секретар
спеціалізованої вченої ради СИНЯВСЬКИЙ В.Ф.
ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ
Дисертаційна робота присвячена розробці та дослідженню ефективності байєсівських методів розпізнавання, а також застосування цих методів для визначення вторинної структури білків. Задачі навчання машин розпізнаванню образів вже існують більше шістдесяти років. З початку 90-х років стрімко розвиваються комп’ютерні методи в біології. У 2003 році завершено міжнародний проект “Геном людини”. Його результатом стало відкриття нуклеотидної послідовності ДНК людини, яка складається приблизно з трьох мільярдів нуклеотидів чотирьох типів та містить 20-25 тисяч білок-кодуючих генів. Аналіз об’ємних баз даних біологічної інформації обумовив використання нових методів в інформатиці – методів машинного навчання (machine learning). Основна їхня ідея полягає у тому, що вивід та отримання результатів виконується безпосередньо з даних.
На сьогодні розроблено багато методів розпізнавання та навчання, при цьому використовуються різноманітні алгоритми та моделі, серед яких слід виділити ланцюги Маркова з прихованими параметрами, ентропійні алгоритми, нейронні та байєсівські мережі тощо. Важливим питанням при застосуванні методів машинного навчання є розміри навчаючої вибірки: коштовність отримання навчаючих вибірок вимагає заздалегідь оцінювати їхні розміри для ефективної роботи конкретного метода. Вищенаведені методи як правило використовуються без обґрунтування, ефективність таких методів достатньою мірою не досліджувалась.
На протязі останніх десятиліть активно розвивається статистична теорія навчання, в тому числі теорія мінімізації ризику. Основною величиною в отриманих оцінках узагальнюючої здатності методів розпізнавання виступає загальна кількість прикладів у навчаючій вибірці. Цей момент не зовсім відповідає специфіці задач розпізнавання. В дисертаційній роботі показано, що ефективність процедур розпізнавання (верхні та нижні оцінки похибки) залежать від розмірів класів у навчаючій вибірці, а не від загального розміру вибірки.
Актуальність теми. На сьогоднішній день розроблено багато методів розпізнавання та прогнозування. Основним недоліком при застосуванні таких методів є відсутність обґрунтування та належного дослідження ефективності. Оскільки методи розпізнавання мають передбачати ефективну комп’ютерну реалізацію, необхідно побудувати гарантовані поліноміальні оцінки похибки від входу задачі для того, щоб вміти заздалегідь визначати розміри навчальної вибірки для ефективної роботи на об’єктах заданої структури.
Передбачення вторинної структури білка – одна з основних задач біо-інформатики. Для її розв’язання використовуються різноманітні методи з використанням підходів машинного навчання.
При побудові процедур розпізнавання на об’єктах різноманітної структури важливим моментом є вибір ефективної моделі описання досліджуваних об’єктів.

Завантажити цю роботу безкоштовно
Пролистати роботу: 1  2  3  4  5  6  7  8  9  10 



Реферат на тему: ЕФЕКТИВНІСТЬ БАЙЄСІВСЬКИХ МЕТОДІВ РОЗПІЗНАВАННЯ

BR.com.ua © 1999-2017 | Реклама на сайті | Умови використання | Зворотній зв'язок