| Назва: | Дослідники автоматичного перекладу... |
| Тип: | Реферати |
| Мова: | Українська |
| Розмiр: | 17,24 KB |
| Скачувань: | 8 |
Для визначення правильного рішення були ще раз ретельно розглянуті конструкції англійської мови, і був зроблений висновок, що багато властивостей мови спрямовані на те, щоб обмежити глибину фраз приблизно до 7. З цього В.Інгве висунув гіпотезу, що всі мови мають морфологічні та синтаксичні механізми, що служать для обмеження глибини синтаксичних конструкцій. Крім того, психологами встановлено, що об'єм оперативної пам'яті людини також дорівнює 7 одиниць. Людина не може запам'ятати відразу, а потім відтворити більше 7 випадкових цифр або слів.
Одним з способів обмеження глибини конструкцій в англійській мові є бінарний поділ речення. Наприклад, речення поділяється на групу підмета і групу присудка, а вже група присудка на дієслово та, наприклад, додаток. Якщо поділити речення відразу на три частини, то потрібно запам'ятовувати не один, а два вузли. Взагалі лінгвісти відмічають, що мова надає перевагу бінарним конструкціям.
Іншим способом обмеження глибини конструкцій, що більш властивий аглютинативним мовам, є аффіксація, за допомогою якої можна поєднати різні елементи в одне довге слово.
Разом з засобами обмеження глибини конструкцій англійська мова має механізми, що дозволяють зберігати виразність, не дивлячись на жорстке обмеження глибини. Таким механізмом є, наприклад, перестановка членів речення. Крім того для надання виразності, речення будуються так, щоб складну структуру перенести на кінець, де вона буде потребувати запам'ятовування на один вузол менше. Це пояснює, чому означальні підрядні речення ідуть за своїми іменниками.
Приклад породження фрази.
START -> 103 (Simple sentense)
103 ->13 (зап. 1)
13 -> HE
1 -> 104
104 ->206 (зап. 2)
206 -> IS
2 -> 108
108 -> 20 (зап. 3)
20 ->BLACK
3 -> 109
109 -> 204 (зап. 210)
204 -> ,
210 -> 108
108 -> 20 (зап. 3)
20 -> SHINY
3 -> 110
110 -> 209 (зап. 20)
209 -> AND
20 -> PROUD
Модель синтаксичної структури російської фрази та алгоритм синтезу англійської при автоматичному перекладі. Д.М.Йєйтс.
В роботі англійської дослідниці автоматичного перекладу Д.М.Йєйтс пропонується спосіб запису граматичних відомостей про російську фразу, що отримані за допомогою аналізуючого алгоритму. Цей запис побудований таким чином, що алгоритм синтеза англійської фрази може безпосередньо використовувати ці дані. Модель повинна була забезпечувати представлення в машині будь-якої синтаксичної структури, і це представлення, наскільки можливо, не повинно було залежати від особливостей обох мов. Наприклад, словосполучення не спросил в машині представлялось: “спрос- = ask, отрицательная форма, прошедшее время”. Подібні множини були названі системами.
Синтаксична структура представлялась за допомогою дерева безпосередньо складових з такими особливостями, як наприклад:
Деякі слова тексту, наприклад частки та допоміжні дієслова, взагалі не представлялися в синтаксичній структурі.
Деякі слова могли бути представлені двічі, наприклад слово который, яке має одночасно зв'язувати підрядне речення з головним та входити в структуру підрядного речення.
Особливості реалізації моделі.
Синтаксична структура словосполучень представляється в машині за допомогою спискової структури , тобто набору об'єктів, кожний з яких або містить адреси одного або декількох інших елементів, або має відмітку про те, що він термінальний. Термінальні об'єкти - це слова або ідіоматичні вирази, нетермінальні - словосполучення, або складові. Наприклад, словосполучення самое интересное семинарское занятие має чотири термінальних елементи та два нетермінальні, які зв'язані таким чином:
ГП - група прикметника, ГІ - група іменника. Кожному елементу приписується тип складової (група іменника, дієслова), а кожній адресі - синтаксична функція, яку виконує ця менша група в більшій.
О - препозитивне означення (в групі іменника), Гс - головне слово (в групі іменника), ПрОП - визначник прикметника, П - прикметник (в групі прикметника).
При відповідному елементі міститься також набір граматичних характеристик, в цьому прикладі - число, рід, та відмінок головного іменника.
Існуючий алгоритм синтезу зберігає порядок слів та пунктуацію вхідної російської фрази, окрім особливих випадків, коли є спеціальні потреби для їх зміни. Ця обставина відображається в моделі таким чином: адреси підрядних складових зберігаються при кожному елементі в тому порядку, в якому стоять самі ці складові, і кожний елемент містить вказівки про всі знаки пунктуації, які його оточують.
Перелік всіх типів складових та синтаксичні функції їх складових, необхідних для опису фраз.
Складова Можливі компоненти даної складової та їх синтаксичні функції.
Група іменника (ГІ) Препозитивне означення (О) Головне слово (Гс) Прикладка (Пл) Постпозитивне означення (ПО)
Група прикметника (ГП) Препозитивний визначник прикметника (ПрОП) Прикметник (П) Постпозитивний визначник прикметника (ПтОП)
Прийменникова група (ПГ) Прийменник (Пр) Доповнення прийменника (Д)
Одним з способів обмеження глибини конструкцій в англійській мові є бінарний поділ речення. Наприклад, речення поділяється на групу підмета і групу присудка, а вже група присудка на дієслово та, наприклад, додаток. Якщо поділити речення відразу на три частини, то потрібно запам'ятовувати не один, а два вузли. Взагалі лінгвісти відмічають, що мова надає перевагу бінарним конструкціям.
Іншим способом обмеження глибини конструкцій, що більш властивий аглютинативним мовам, є аффіксація, за допомогою якої можна поєднати різні елементи в одне довге слово.
Разом з засобами обмеження глибини конструкцій англійська мова має механізми, що дозволяють зберігати виразність, не дивлячись на жорстке обмеження глибини. Таким механізмом є, наприклад, перестановка членів речення. Крім того для надання виразності, речення будуються так, щоб складну структуру перенести на кінець, де вона буде потребувати запам'ятовування на один вузол менше. Це пояснює, чому означальні підрядні речення ідуть за своїми іменниками.
Приклад породження фрази.
START -> 103 (Simple sentense)
103 ->13 (зап. 1)
13 -> HE
1 -> 104
104 ->206 (зап. 2)
206 -> IS
2 -> 108
108 -> 20 (зап. 3)
20 ->BLACK
3 -> 109
109 -> 204 (зап. 210)
204 -> ,
210 -> 108
108 -> 20 (зап. 3)
20 -> SHINY
3 -> 110
110 -> 209 (зап. 20)
209 -> AND
20 -> PROUD
Модель синтаксичної структури російської фрази та алгоритм синтезу англійської при автоматичному перекладі. Д.М.Йєйтс.
В роботі англійської дослідниці автоматичного перекладу Д.М.Йєйтс пропонується спосіб запису граматичних відомостей про російську фразу, що отримані за допомогою аналізуючого алгоритму. Цей запис побудований таким чином, що алгоритм синтеза англійської фрази може безпосередньо використовувати ці дані. Модель повинна була забезпечувати представлення в машині будь-якої синтаксичної структури, і це представлення, наскільки можливо, не повинно було залежати від особливостей обох мов. Наприклад, словосполучення не спросил в машині представлялось: “спрос- = ask, отрицательная форма, прошедшее время”. Подібні множини були названі системами.
Синтаксична структура представлялась за допомогою дерева безпосередньо складових з такими особливостями, як наприклад:
Деякі слова тексту, наприклад частки та допоміжні дієслова, взагалі не представлялися в синтаксичній структурі.
Деякі слова могли бути представлені двічі, наприклад слово который, яке має одночасно зв'язувати підрядне речення з головним та входити в структуру підрядного речення.
Особливості реалізації моделі.
Синтаксична структура словосполучень представляється в машині за допомогою спискової структури , тобто набору об'єктів, кожний з яких або містить адреси одного або декількох інших елементів, або має відмітку про те, що він термінальний. Термінальні об'єкти - це слова або ідіоматичні вирази, нетермінальні - словосполучення, або складові. Наприклад, словосполучення самое интересное семинарское занятие має чотири термінальних елементи та два нетермінальні, які зв'язані таким чином:
ГП - група прикметника, ГІ - група іменника. Кожному елементу приписується тип складової (група іменника, дієслова), а кожній адресі - синтаксична функція, яку виконує ця менша група в більшій.
О - препозитивне означення (в групі іменника), Гс - головне слово (в групі іменника), ПрОП - визначник прикметника, П - прикметник (в групі прикметника).
При відповідному елементі міститься також набір граматичних характеристик, в цьому прикладі - число, рід, та відмінок головного іменника.
Існуючий алгоритм синтезу зберігає порядок слів та пунктуацію вхідної російської фрази, окрім особливих випадків, коли є спеціальні потреби для їх зміни. Ця обставина відображається в моделі таким чином: адреси підрядних складових зберігаються при кожному елементі в тому порядку, в якому стоять самі ці складові, і кожний елемент містить вказівки про всі знаки пунктуації, які його оточують.
Перелік всіх типів складових та синтаксичні функції їх складових, необхідних для опису фраз.
Складова Можливі компоненти даної складової та їх синтаксичні функції.
Група іменника (ГІ) Препозитивне означення (О) Головне слово (Гс) Прикладка (Пл) Постпозитивне означення (ПО)
Група прикметника (ГП) Препозитивний визначник прикметника (ПрОП) Прикметник (П) Постпозитивний визначник прикметника (ПтОП)
Прийменникова група (ПГ) Прийменник (Пр) Доповнення прийменника (Д)
Новости загрузка новостей...