Автор работы: Пользователь скрыл имя, 30 Ноября 2011 в 19:12, курсовая работа
Цель данной работы – определение того, насколько можно использовать современные программные продукты для осуществления перевода, а также выявление наиболее перспективных, на наш взгляд, направлений исследований в области его автоматизации.
Введение
Глава I. Машинный перевод………………………………………………… 5
1.1. История школы машинного перевода……………….................... 7
1.2. Классификация систем машинного перевода………………….. 10
Вывод по Главе I ………………………………………………………….… 21
Глава II. Система МП PROMT XT…………………………………………..22
2.1. Общая характеристика системы………………………………….22
2.2. Применение системы МП PROMT XT на практике…………….26
Вывод по Главе II ………………………………………………………….…33
Заключение…………………………………………………………………... 34
Список литературы …………………………………
Система PROMT выполняет перевод типа TRANSFER. Но и в данном случае имеются свои особенности, касающиеся архитектуры системы PROMT. А особенности состоят в том, что этот метод (TRANSFER) применен в системе не в соответствии с лингвистическим стандартным подходом.
Дело в том, что система
Анализ простых предложений
2.1. Применение системы МП PROMT XT на практике
Чтобы лучше понять принципы действия систем МП и их методы использования словарей и анализа грамматики, равно как и синтеза структур на выходном языке, следует на практике перевести несколько текстов, желательно различных по функциональному стилю и тематике, используя одну из современных систем машинного перевода. Наиболее целесообразным представляется использование системы МП PROMT XT, поскольку она является самой последней на данный момент версией ряда продуктов PROMT и объективно лучшей из доступных [Кузнецов, 1956: 27].
В качестве первого примера
выступает следующая
"You are given 12 identical-looking coins, one of which is counterfeit and weighs slightly more or less (you don't know which) than the others. You are given a beam balance which lets you put the same number of coins on each side and observe which side (if either) is heavier. How can you identify the counterfeit and tell whether it is heavy or light, in 3 weighings?"
Вот ее 'вольный' перевод на русский язык, который мог бы быть сделан человеком - переводчиком:
"У вас есть 12 одинаковых по виду монет, одна из которых - фальшивая и весит немного больше или меньше, чем остальные (вы не знаете, какая именно). Имеются рычажные весы, на чаши которых вы можете класть равное число монет и смотреть, какая из чаш перевесила (или весы остались в равновесии). Как за 3 взвешивания определить фальшивую монету и узнать, легче она или тяжелее остальных?"
При переводе переводчику пришлось поменять порядок слов в нескольких предложениях. А вот как переводит этот текст система автоматического перевода семейства PROMT (использовалась PROMT XT):
"Вам дают 12 идентично-выглядящих монет, одна из которых - подделка и весит немного более или менее (Вы не знаете который) чем другие. Вам дают баланс луча, который позволяет Вам помещать то же самое число {номер} монет на каждой стороне и наблюдать {соблюдать}, какая сторона (если любой) более тяжел. Как Вы можете идентифицировать подделку и сказать, тяжело ли это или легко, в 3 взвешиваниях?"
Следует обратить внимание на "баланс луча". Эта ошибка вызвана, как легко понять, отсутствием в словаре словосочетания "beam balance", означающего "рычажные весы". Очевидно, что варианты перевода слов (данные в фигурных скобках) - вторые значения соответственных слов во входном языке. Таким образом, отбирая, исходя из контекста, наиболее вероятные значения слов, программа PROMT иногда затрудняется выдать однозначный вариант, оставляя, таким образом, право выбора за редактором-переводчиком. Однако справедливости ради, нужно отметить, что в обоих случаях двоякого толкования слова программой в данном тексте, в качестве наиболее вероятных были выбраны именно правильные значения.
Немного смущает фраза "если любой", употребленная в тексте в скобках. Во-первых, очевидно, что грамматически текст данный в скобках никак программой не связывается с текстом за скобками - отсюда и разница в роде: существительное «сторона» - ж.р. ед. ч.; и местоимение «любой» - м.р. ед. ч. Во-вторых, вероятно фраза "if any" представляет собой одно единое семантическое целое - в своем роде клише официального стиля. Доказательством тому служит присутствие выражения "if any" в словаре ABBY Lingvo7.0 в качестве отдельной словарной статьи:
"if any" - если это имеет место
At the start of every month I have to send him an account of my earnings, if any. — В начале каждого месяца я должен посылать ему отчет о моих заработках, если таковые имелись."
Поэтому упущением создателей системы PROMT является пословный перевод этой фразеологической единицы. Следующим существенным недостатком является очевидное 'нежелание' системы менять порядок слов в предложении - иногда это жизненно необходимо. То есть в выходном языке порядок слов почти всегда такой же, как и во входном.
Общеизвестно, что в английские существительные утратили грамматическую категорию рода. Поэтому почти все они согласуются с местоимением 3 лица ед. числа "it" - среднего рода. В русском же языке категория рода у существительных присутствует и в 3-м лице ед. числе они согласуются с тремя разными местоимениями в зависимости от грамматического рода. Так вот, система PROMT, синтезируя текст на выходном языке не учитывает возможность согласования существительного и местоимения, его заменяющего в роде [Кормалев, 2003: 149].
Примером может служить последнее предложение текста: "How can you identify the counterfeit and tell whether it is heavy or light, in 3 weighings?".
Переведено оно следующим образом: "Как Вы можете идентифицировать подделку и сказать, тяжело ли это или легко, в 3 взвешиваниях?" Перевод слов "It" и "counterfeit" не согласуются в роде: подделка - женского рода, это - среднего рода; более того - не видя связи между двумя этими словами, программа-переводчик вместо личного местоимения подставляет указательное.
В качестве второго примера следует взять начало Декларации Независимости США. Здесь мы увидим перевод программой PROMT XT текста, написанного в официально-деловом стиле в конце XVIII века. Вот оригинал текста:
"When in the course of human events, it becomes necessary for one people to dissolve the political bands which have connected them with another, and to assume among the powers of the earth, the separate and equal station to which the laws of nature and of nature's God entitle them, a decent respect to the opinions of mankind requires that they should declare the causes which impel them to the separation. We hold these truths to be self-evident, that all men are created equal, that they are endowed by their creator with certain unalienable rights, that among these are life, liberty and the pursuit of happiness, that to secure these rights, governments are instituted among men, deriving their just powers from the consent of the governed..."
Данный текст далеко не прост с точки зрения восприятия: предложения длинные, много придаточных предложений и однородных членов. С другой стороны, несмотря на то, что тексту более 225 лет, в нем нет слов или грамматических конструкций, которые были бы непонятны человеку, знающему английский язык хотя бы на уровне носителя. В тесте не используются слова, значения, которых устарели бы и поэтому единственной сложностью является большой объем предложений и относительная сложность их конструкции. Далее следует перевод этого текста, сделанный человеком переводчиком:
"Когда в ходе человеческой
истории для одного народа
становится необходимым
А вот перевод этого текста, осуществленный системой PROMT XT:
"Когда в ходе человеческих событий, это становится необходимым для одного людей расторгнуть {распустить} политические полосы {оркестры}, которые соединили их с другим, и принимать среди полномочий земли, отдельная и равная станция, на которую законы характера {природы} и Бога характера{природы} дают право им, приличное уважение{отношение} к мнениям относительно человечества требует, чтобы они объявили причины, которые побуждают их к разделению. Мы считаем эти истины быть самоочевидными, что все мужчины созданы равными, что они обеспечены их создателем с некоторыми неотъемлемыми правами, которые среди них являются жизнью, свободой и преследованием счастья, что, чтобы обеспечить эти права, правительства назначены {установлены} среди мужчин, получая их справедливые полномочия от согласия управляемых..."
С таким текстом у системы машинного перевода возникает больше проблем. Здесь можно даже не упоминать выбора неправильных значений слов, таких как People, bands, station. Основываясь на данном образце перевода текста, можно воочию, так сказать, увидеть все несовершенство механизмов грамматического анализа и синтеза.
В отношении грамматического синтеза, с другой стороны, сказать можно не так много. Ну, например, выходной вариант "дают право им" не соответствует норме языка с точки зрения порядка слов. Таким образом, при синтезе грамматических структур на выходном языке, мы опять-таки видим жесткую привязку к порядку слов в тексте на входном языке. Затем, такая фраза как "мы считаем эти истины быть самоочевидными…" сильно напоминает речь иностранца, 'изучившего' русский язык посредством разговорника. А ведь программа писалась русскими специалистами! Однако в данном случае, лингвистов, участвовавших в создании систем PROMT в незнании грамматики родного языка обвинить нельзя. Ведь проблема здесь не в синтезе грамматической структуры, а все в том же непонимании структуры входного языка - то есть в грамматическом анализе.
Грамматический анализ, как мы
видим, находится на самом
примитивном уровне. Да, простые
предложения система
Язык - это живая структура, которая
не поддается полной алгоритмизации
и, следовательно, посредством
одних лишь алгоритмов проблему
машинного перевода не решить.
Машина не понимает текст, она
лишь преобразовывает его посредством
различных алгоритмов и правил. И не важно,
сколько будет этих правил, без
хотя бы общего понимания входного текста
не может быть сколько-нибудь связного
и стабильного процесса перевода.
На уровне простых предложений
и в рамках строго определенной
тематики машинный перевод в
принципе возможен, но не более [Чужакин,
1999: 53].
Вывод по Главе II
Всем хорошо известно, что хороший перевод текста – это не только творческая, но и достаточно трудоемкая работа. Причем даже самый хороший перевод, как правило, нуждается в редакторской правке. Что касается творческой части, то в обозримом будущем в соревновании компьютер-человек всегда победит "живой" переводчик. Однако для решения проблем, обусловленных трудоемкостью процесса перевода, системы МП могут оказаться хорошим подспорьем.
Одной из таких систем является система МП Prompt XT. Компания ПРОМТ разработала и реализовала технологию полностью автоматизированного процесса перевода, которая учитывает все этапы обработки текстов.
Заключение
Бесконечное
разнообразие современного мира передается
при помощи средств информации в
ощущениях и интерпретациях многочисленных
участников международного информационного
процесса - журналистов, корреспондентов,
комментаторов, телеоператоров. Поэтому
постоянно растет значение переводческой
деятельности. Перевод был важен всегда.
Научный прогресс дошел до изобретения
машинного перевода, который во многом
облегчил жизнь переводчикам. Конечно,
и сейчас, существует огромное количество
недостатков и в таком, казалось бы, совершенном
изобретении. Но мы должны приложить все
усилия , что бы развивать машинный перевод.
И к этому имеются стимулы. Можно выделить
два основных стимула к развитию работ
по машинному переводу в современном мире.
Первый – собственно научный; он определяется
комплексностью и сложностью компьютерного
моделирования перевода. Как вид языковой
деятельности перевод затрагивает все
уровни языка – от распознавания графем
(и фонем при переводе устной речи) до передачи
смысла высказывания и текста. Кроме того,
для перевода характерна обратная связь
и возможность сразу проверить теоретическую
гипотезу об устройстве тех или иных языковых
уровней и эффективности предлагаемых
алгоритмов. Эта характеристическая черта
перевода вообще и машинного перевода
в частности привлекает внимание теоретиков,
в результате чего продолжают возникать
все новые теории автоматизации перевода
и формализации языковых данных и процессов.
Второй стимул – социальный, и обусловлен
он возрастающей ролью самой практики
перевода в современном мире как необходимого
условия обеспечения межъязыковой коммуникации,
объем которой возрастает с каждым годом.
Другие способы преодоления языковых
барьеров на пути коммуникации – разработка
или принятие единого языка, а также изучение
иностранных языков – не могут сравниться
с переводом по эффективности. С этой точки
зрения можно утверждать, что альтернативы
переводу нет, так что разработка качественных
и высокопроизводительных систем машинного
перевода способствует разрешению важнейших
социально-коммуникативных задач.
Информация о работе Компьютерный перевод как разновидность перевода