Машинний переклад та сучасні електронні перекладачі

Автор работы: Пользователь скрыл имя, 19 Февраля 2013 в 21:45, курсовая работа

Описание

Переклад має довгу історію. Своїм корінням він походить з тих далеких часів, коли прамова почала розпадатися на окремі мови і виникла необхідність у людях, які знали кілька мов і здатних виступати в ролі посередників при спілкуванні представників різних мовних громад.

Содержание

ВСТУП 3
РОЗДІЛ 1. МАШИННИЙ ПЕРЕКЛАД 6
.Історія машинного перекладу 6
1. 2.Теорія машинного перекладу 10
1.3.Напрями розвитку машинного перекладу 11
1.4.Специфіка машинного перекладу 12
1.5.Аналіз та синтез в системі машинного перекладу 15
1.6. Сучасні електронні перекладачі 16
РОЗДІЛ 2. РЕЗУЛЬТАТИ ДОСЛІДЖЕННЯ МАШИННОГО ПЕРЕКЛАДУ ЗА ДОПОМОГОЮ ЕЛЕКТРОННИХ ПЕРЕКЛАДАЧІВ19
2.1. PROMT 19
2.2. Systran 28
ВИСНОВКИ 32
СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ

Работа состоит из  1 файл

курсова Олійник.docx

— 80.98 Кб (Скачать документ)

 

1.2. Теорія машинного перекладу

Загальна теорія перекладу  основується на даних, які отримані при спостереженні об’єкту в  різних його проявах. Ці прояви можуть бути випадковими, нетиповими, і тоді вони не враховуються. Ці прояви можуть повторюватися, бути типовими, і тоді теорія вважає їх закономірними загалом або для того чи іншого виду перекладу зокрема. Довший час не викликала сумніву аксіома: міжмовні перетворення можуть здійснюватися лише людиною. Науково-технічний прогрес у ХХ столітті вніс в це положення суттєве уточнення: міжмовні перетворення може здійснювати як людина, так і машина. Так з’явилася перша основа для класифікації перекладу: механізми міжмовних перетворень. На цій основі було започатковано теорію машинного перекладу.

Теорія машинного перекладу  пройшла бурхливий період розвитку. За свій короткий вік вона зробила  в загальну теорію перекладу не менший вклад, ніж існуючі теорії перекладу, здійснюваного людиною. Не можна, звичайно, забувати, що машинний переклад ввібрав  у себе всі досягнення «домашинного»  перекладу. Вирішальне значення в успіхах  теорії машинного перекладу мало те, що його автори змушені були моделювати діяльність перекладача і забезпечити  функціонування механізмів перекладу. Саме в машинному перекладі була виявлена необхідність окремо розглядати аналіз вихідного тесту і синтез тексту перекладу. На жаль, на відміну  від перекладу, здійснюваного людиною, машинний переклад практичними результатами похвалитися не може. Але, можливо, це тільки наслідок недостатніх технічних  можливостей, і отримання високоякісного машинного перекладу – це питання  часу.

Теорія машинного перекладу  поки що існує як дещо єдине ціле. Це пов’язано із стабільністю умов процесу машинного перекладу  і невисокою компетентністю машин. Інша справа людина. Їй не тільки доводиться працювати в різних умовах, їй доводиться в залежності від ситуації перекладати  письмово або усно, сприймати оригінал очима або на слух. Важко не помітити різницю, що існує між письмовим  перекладом, не обмеженим по часу, що дозволяє користуватися словниками і різноманітними довідниками, і  усним перекладом, який виконується  в екстремальних умовах функціонування розумових механізмів перекладача. Різниця, яка існує між письмовим  і усним перекладом, пов’язана  з умовами функціонування розумових механізмів, котрі, таким чином, є основою для класифікації перекладу, що здійснюється людиною. [4. 88-89]

 

1.3. Напрями розвитку машинного  перекладу

Розрізняють два магістральні напрямки створення та застосування машинного перекладу. В першому  випадку система машинного перекладу  функціонує на великій ЕОМ і представляє  “сирий”, чорновий переклад, який згодом редагують кваліфіковані перекладачі. Як правило, така методика використовується у великих організаціях, які змушені  готувати документи на різних мовах. Деколи досить успішно використовується попереднє редагування вихідних текстів. Деякі фірми вводять  у себе так звані “контрольовані природні мови”: коли кожен працівник  фірми, що готує документацію, повинен  її готувати саме з дотриманням вимог  цієї обмеженої мови (наприклад, вимога відсутності складних синтаксичних конструкцій). Використання контрольованої природної мови спрощує роботу машинного  перекладу і зменшує обсяги постредагування, яке дорого коштує через необхідність залучення спеціалістів високої  кваліфікації. Другим магістральним  напрямком машинного перекладу  є використання систем, орієнтованих на персональні комп’ютери. Такі системи  вперше появилися ще на початку 1980-х  років (наприклад, MicroCAT фірми Weidner). Найбільший успіх в застосуванні цих систем перекладу припав на 90-і роки.

Зараз інтенсивно проводяться  дослідження в галузі перекладу  усної мови. Компанія IBM, яка вважається лідером в цій області, випустила  програмний пакет ViaVoice 4.1, яка дозволяє комп’ютеру сприймати до 140 слів на хвилину неперервної диктовки. Попередні  версії цієї програми передбачали лише дискретний спосіб введення мови. Для  налагодження на персональні особливості  мовлення певної людини при початковій установці програми в залежності від якості вимови і конкретного  діалекту потрібно повторити від 104 до 256 речень, що попередньо задаються. Але розпізнавання мови не означає  розуміння її змісту. Слід розрізняти розпізнавання машинної мови і перетворення її в текст або ж її використання у вигляді команд, і справжнє розуміння її змісту, як це робить людина. Останнє вимагає знання комп’ютером всього обсягу стилістичних та семантичних конструкцій, правил використання слів та висловів, при чому останні повинні задаватися не жорстко – адже люди говорять, що завгодно і як завгодно, не звертаючи уваги наскільки це грамотно і літературно. Іноді навіть те, що говориться, не відповідає тому, що малося на увазі. Так що навчити машину розуміти людей – задача незрівнянно складніша і віддалена в часі. [11.45-46]

 

1.4 Специфіка машинного перекладу

Перекладом називається  процес та результат створення на основі вхідного тексту однією мовою  рівноцінного йому в комунікативному  відношенні тексту іншою мовою. При  цьому комунікативна рівнозначність, або еквівалентність, розуміється  як така якість тексту перекладу, котра  дозволяє йому виступати в процесі  спілкування носіїв різних мов у  ролі повноправної заміни вхідного тексту (оригіналу) в сфері дії мови перекладу.

Комунікативна еквівалентність  нового тексту у відношенні до оригіналу  забезпечується виконанням трьох основних вимог:

1.текст перекладу повинен в більш повному обсязі передавати зміст оригіналу, що, перш за все, означає неприпустимість довільного опущення або додавання інформації;

2  текст перекладу повинен відповідати нормам мови перекладу, тому що їх порушення, принаймні, створює перешкоди для сприйняття інформації, а іноді веде й до її викривлення;

3 текст перекладу повинен бути приблизно рівний з оригіналом за своїм об’ємом, чим забезпечується подібність стилістичного ефекту з погляду лаконічності або розгорнутості вираження.

Однак виконання вказаних вимог до тексту перекладу часто  пов’язане з подоланням різного  роду об’єктивно існуючих перепон. Створені працюючі системи машинного перекладу  передбачають етапи редагування  як обов’язковий елемент оброблення одержаного українського тексту. Сучасний машинний переклад має ряд особливостей: наявність неперекладених слів і  помилок, що виникають при переносі вихідного іноземного тексту на носій, що читається машиною, граматичні й  стилістичні недоліки тексту перекладу, що синтезуються через погрішності  в машинній граматиці. Переклад може здійснюватися:

1) з однієї мови на іншу – нерідну, родинну, близькоспоріднену;

2) з літературної мови на її діалект та навпаки, або з діалекту однієї мови           на іншу літературну мову;

3) з мови древнього періоду на мову у її сучасному стані (наприклад, з      давньоруської мови на сучасну російську, зі староанглійської на сучасну англійську та т.п.).

Розвиток новітніх технологій зробив можливим машинний переклад, тобто  переклад, який побудовано на використанні машиною визначених та постійних  для даного виду матеріалу відповідностей між словами та граматичними явищами  різних мов. У наш час є достатньо  широкий вибір програм, які полегшують працю перекладача, котрі умовно можна підрозділити на дві основні  групи: електроні словники (electronic dictionary) та системи машинного перекладу (machine translation system). Системи машинного перекладу забезпечують послідовний переклад текстів, що враховує морфологічні, синтаксичні та семантичні зв’язки членів речення.

Програми перекладу (системи машинного перекладу) з'явилися у відповідь на потреби користувачів в оперативному перекладі різної комерційної, технічної або Інтернет - інформації, яка подана в електронному вигляді. Аналізуючи програми машинного перекладу, потрібно відразу зазначити, що вимоги до них не повинні бути такими ж, як і до перекладу, який виконує людина.  Переклад,  зроблений комп'ютером, поки що далеко не ідеальний, але текст, отриманий в результаті роботи електронного перекладача, дозволяє у більшості випадків зрозуміти суть документа, який перекладається. Далі цей документ можна корегувати, маючи базові знання іноземної мови та добре орієнтуючись в предметній галузі, до якої належить інформація, що перекладається.

Сьогодні програми - перекладачі  вміють будувати осмислені фрази, й  за останні декілька років якість перекладу поліпшилася. Однак комп’ютер  ще погано розбирається в граматичних  нюансах та жаргоні, автоматичний переклад художніх текстів неможливий, тому його головне призначення – переклад бізнесових паперів, керівництв, листів з електронної пошти, сторінок з  Інтернету (Web-сторінок). Інше застосування систем – полегшення рутинної роботи перекладачів, виконання за них підрядкового перекладу, котрий можна легко підправити.

Системи машинного перекладу  здійснюють автоматичний переклад тексту. Одиницями перекладу при цьому  служать слова або словосполучення, причому останні розробки дозволяють враховувати морфологію перекладеного  слова. Розвинені системи машинного  перекладу здійснюють переклад по заданому розробником або корегованим  користувачем алгоритмам перекладу.

Для здійснення машинного  перекладу в комп’ютер вводиться  спеціальна програма, яка реалізує алгоритм перекладу, під котрим розуміється  послідовність однозначно та строго визначених дій над текстом для  знаходження перекладних відповідностей в даній парі мов при заданому напрямі перекладу (з однієї конкретної мови на іншу). Система машинного  перекладу включає в себе двомовні словники, які містять потрібну граматичну інформацію (морфологічну, синтаксичну  та семантичну) для забезпечення передачі еквівалентних, варіантних та трансформаційних перекладних відповідностей, а також  алгоритмічні засоби граматичного аналізу, які реалізують яку-небудь з вжитих для автоматичної переробки тексту формальних граматик.[8.34-36]

 

1.5Аналіз та синтез в системі машинного перекладу

 

Найбільш поширеною постає наступна послідовність формальних операцій, які забезпечують аналіз та синтез в системі машинного  перекладу:

1. На першому етапі  здійснюється введення тексту  та пошук вхідних словоформ  (слів в конкретній граматичній  формі, наприклад, давального  відмінку, множини) у вхідному  словнику (словнику мови, з котрої  робиться переклад) з супровідним  морфологічним аналізом, в ході  котрого встановлюється належність  даної словоформи до визначеної  лексеми (слова як одиниці словника). В процесі аналізу з форми  слова можуть бути одержані  також відомості, стосовно до  інших рівнів організації мовної  системи.

2. Наступний етап включає  в себе переклад ідіоматичних  словосполучень, фразеологічних єдностей  або штампів даної предметної  області (наприклад, при англо-російському  перекладі обороти типу in case of, in accordance with одержують єдиний цифровий еквівалент та виключаються з подальшого граматичного аналізу); визначення основних граматичних (морфологічних, синтаксичних, семантичних та лексичних) характеристик елементів вхідного тексту (наприклад, числа іменників, часу дієслова, синтаксичних функцій словоформ в даному тексті та т.п.), яке робиться в рамках вхідної мови; розв’язання омографії ,лексичний аналіз та переклад лексем. Звичайно на цьому етапі однозначні слова відділяються від багатозначних, після чого однозначні слова перекладаються по спискам еквівалентів, а для перекладу багатозначних слів використовуються так звані контекстологічні словники, словникові статті котрих представляють собою алгоритми запиту до контексту на наявність/відсутність контекстного значення.

3. Остаточний граматичний  аналіз,  в ході котрого з’ясовується  потрібна граматична інформація  з урахуванням даних вихідної  мови (наприклад, при іменниках  типу ножиці дієслово повинно  стояти в множині, незважаючи  на те, що в оригіналі може  бути й однина).

4. Синтез словоформ та  речень в цілому на вихідній  мові.

В залежності від особливостей морфології, синтаксису та семантики  конкретної мовної пари, а також  напряму перекладу, загальний алгоритм перекладу може включати й інші етапи, а також модифікації названих етапів або порядку їх проходження, але варіації такого роду в сучасних системах, як правило, незначні. Аналіз та синтез може проводитись як пофразно, так і для всього тексту, введеного  в пам’ять комп’ютеру; в останньому випадку алгоритм перекладу передбачає визначення так званих анафоричних  зв’язків. Програма – перекладач - це, перш за все, інструмент, котрий дозволяє вирішити проблеми перекладу або  підвищити ефективність праці перекладача  тільки в тому випадку, якщо він грамотно використовується.[19]

 

1.6 Сучасні електронні перекладачі

Promt

Одним з найвідоміших постачальників сервісів онлайнового перекладу  в російському Інтернеті є  компанія ПРОМТ (www.translate.ru), яка займається розробкою систем автоматизованого перекладу з 1991 року й відома своїми машинними перекладачами. Крім програм, ПРОМТ пропонує широкий спектр послуг онлайнового перекладу, для роботи з якими досить мати доступ в Інтернет. На сайті можна перекласти невеликий текст або безкоштовно зареєструвавшись –текст об`ємом до 500 символів, а також електронний лист або Веб – сторінку з повним збереженням форматування. Існує також спеціальна послуга онлайн - перекладу для користувачів стільникових телефонів (ВАП - Перекладач), є версія сайту для власників кишенькових комп'ютерів (http://pda.translate.ru).

Сервіс Транслейт. ру пропонує переклад для семи європейських мов: англійської, німецької, французької, іспанської, італійської, португальської й російської. У цілому користувачеві  доступний 21 напрямок перекладу, а також  великий набір додаткових настроювань (спеціалізовані словники, переклад тексту більшого обсягу, доступ до додаткової граматичної інформації та ін.). Для одержання доступу до додаткових сервісів потрібна реєстрація (безкоштовна).[19]

Systran

Онлайн-Сервіс перекладу  іншого відомого розроблювача систем машинного перекладу — американської  компанії Сустран— можна знайти на сторінці www.systran.ru. Тут заявлено більше 35 напрямків перекладу.

Крім традиційної для  всіх онлайн- перекладачів функції  перекладу тексту, за допомогою Сустран  можна перекладати письмові тексти, файли пакету Майкрософт Оффис та Web-Сторінки. Для підвищення якості перекладу розроблювачі пропонують спеціалізовані словники по дев'яти  тематиках, а також опцію створення  користувачами власних словників. Сьогодні Онлайн сервісом користується більш ніж 500,000 людей.

Информация о работе Машинний переклад та сучасні електронні перекладачі