Автор работы: Пользователь скрыл имя, 26 Декабря 2011 в 10:23, курсовая работа
Компьютерная лингвистика, направление в прикладной лингвистике, ориентированное на использование компьютерных инструментов – программ, компьютерных технологий организации и обработки данных – для моделирования функционирования языка в тех или иных условиях, ситуациях, проблемных сферах и т.д., а также вся сфера применения компьютерных моделей языка в лингвистике и смежных дисциплинах.
Оглавление 1
Введение 2
Глава I Компьютерная лингвистика как прикладная лингвистическая дисциплина 4
1.1 Когнитивный инструментарий компьютерной лингвистики 5
1.2 Инструментарий компьютерной лингвистики 10
1.3 Направления компьютерной лингвистики 12
Глава II Гипертекстовые технологии представления текста 20
2.1 Теоретические основания гипертекста 20
2.2 Элементы типологии гипертекста 22
2.3. Некоторые гипертекстовые системы 24
Отношения между элементами гипертекста могут изначально фиксироваться создателями, а могут порождаться всякий раз, когда происходит обращение пользователя к гипертексту. В первом случае речь идет о гипертекстах жесткой структуры, а во втором - о гипертекстах мягкой структуры. Жесткая структура технологически вполне понятна. Технология организации мягкой структуры должна основываться на семантическом анализе близости документов (или других источников информации) друг к другу. Это нетривиальная задача компьютерной лингвистики. В настоящее время широко распространено использование технологий мягкой структуры на ключевых словах. Переход от одного узла к другому в сети гипертекста осуществляется в результате поиска ключевых слов. Поскольку набор ключевых слов каждый раз может различаться, каждый раз меняется и структура гипертекста. Жесткость или мягкость архитектуры гипертекста зависит и от количества информации, которая в нем содержится. Если узлов в сети гипертекста порядка одной-трех тысяч, то чаще всего используется жесткая архитектура, если же количество узлов достигает нескольких десятков тысяч или даже миллионов единиц, то мягкая структура оказывается более предпочтительной, поскольку кодировка жестких связей отнимает слишком много времени. Заметим, что структура Интернета часто функционирует как гипертекст мягкой архитектуры.
Технология построения гипертекстовых систем не делает различий между текстовой и нетекстовой информацией. Между тем включение визуальной и звуковой информации (видеороликов, картин, фотографий, звукозаписей и т.п.) требует существенного изменения интерфейса с пользователем и более мощной программной и компьютерной поддержки. Такие системы получили название гипермедиа или мультимедиа. Наглядность мультимедийных систем предопределила их широкое использование в обучении, в создании компьютерных вариантов энциклопедий. Известны, например, прекрасно выполненные CD-ромы с мультимедийными системами по детским энциклопедиям издательства "Дорлинг Киндерсли".
2.3. Некоторые гипертекстовые системы
Технологически в основе гипертекста лежат компьютерные программы, которые поддерживают следующие базовые функции:
обеспечение быстрого просмотра информационного массива (браунинг);
обработка ссылочных отношений (обращение и вызов фрагмента текста или другой информации, на которую производится отсылка);
навигация по гипертексту, запоминание маршрута движения; представление пути движения в легко воспринимаемой форме;
возможность формирования обычного линейного текста как результата движения по гипертексту;
дополнение гипертекста новой информацией;
введение новых отношений в структуру гипертекста (для систем с жесткой структурой).
Программные оболочки гипертекста, как правило, универсальны. Они могут использоваться в различных областях для создания тематически разных гипертекстов. Таковы, например, оболочка ZOG и разработанная на ее основе промышленная гипертекстовая система KMS (университет Карнеги-Меллон, США). Сферы применения этих гипертекстовых систем необычайно разнообразны - от работы с документацией и поддержки электронной почты до гипертекстов, предназначенных для экспертов, работающих над бюджетом. Имеются и специализированные системы. Так, система NoteCards (продукт компании "Xerox PARC") предназначена для аналитической работы, а система WE, моделирующая особенности получения нового знания - для помощи в авторской работе. Наиболее популярны в настоящее время программные пакеты HyperCard компании "Apple". Они относительно просты в использовании. Гипертекст в оболочке HyperCard представляется в виде каталожных карточек. Пользователь с помощью довольно простого интерфейса организует структуру карточки и устанавливает связи между карточками. Пакеты HyperCard позволяют сочетать различные типы информации, в частности карточки могут включать графическую, звуковую и др. информацию. Следует отметить, что современные базы данных также включают поля для визуальной и звуковой формы данных (ср., например, базу данных ACCESS 7, работающую в среде Windows). Близка к HyperCard по своим свойствам и программа SuperCard фирмы "Silicon Beach". Некоторые системы гипертекста содержат специальные средства ориентации пользователя в гиперпространстве - карты или закладки, отмечающие наиболее посещаемые узлы гипертекста. Комплексом средств ориентации обладает система Hypergate Writer фирмы "Eastgate Systems Inc".
В системах автоматической обработки текстовой информации важную роль играет компьютерная лингвистика. Центральными научными проблемами компьютерной лингвистики являются проблема моделирования процесса понимания смысла текстов (перехода от текста к формализованному представлению его смысла) и проблема синтеза речи (перехода от формализованного представления смысла к текстам на естественном языке).
Важной методологической проблемой компьютерной лингвистики является правильная оценка необходимого соотношения между декларативной и процедурной компонентами систем автоматической обработки текстовой информации. При решении прикладных задач компьютерной лингвистики основной акцент следует делать на декларативные средства, но процедурные средства, в том числе грамотный компьютерный интерфейс тоже играют не последнюю роль.
Традиционные методы преодоления языковых барьеров – это обучение иностранным языкам и переводческая деятельность. Но с ростом экономических, политических и культурных связей между странами и повышением интенсивности информационных потоков между ними эти методы становятся недостаточными. Возникла необходимость искать альтернативные пути решения проблемы. И одним из них может явиться создание систем фразеологического машинного перевода.
In systems of automatic processing of the text information the important role is played by computer linguistics. The central scientific problems of computer linguistics are a problem of modelling of process of understanding of sense of texts (transition from the text to the formalized representation of its sense) and a problem of synthesis of speech (transition from the formalized representation of sense to texts in a natural language).
Important methodological problem of computer linguistics is the correct estimation of a necessary parity between declarative and procedural components of systems of automatic processing of the text information. At the decision of applied problems of computer linguistics it is necessary to do the basic accent on declarative means, but procedural means, including the competent computer interface too play not last role.
Traditional methods of overcoming of language barriers is a training to foreign languages and translational activity. But with growth economic, political both a cultural contact between the countries and increase of intensity of information streams between them these methods become insufficient. There was a necessity to search for alternative ways of a solution of a problem. And one of them creation of systems of phraseological machine translation can be.