Звуки и знаки - Страница 18
Диалог продолжается…
Конечно, никто из ученых не пытается сейчас дать совершенный перевод с помощью машины, подобный переводу человеческому. И переводится не любой текст, а текст по какой-либо узкой специальности, например химии полимеров или низкотемпературной плазме. Но ведь именно такой подстрочный, так сказать, рабочий перевод текстов по специальности и необходим в первую очередь ученым, инженерам, техникам, работающим в той же химии полимеров или в области низкотемпературных плазм.
Первая в нашей стране промышленная эксплуатация МП была осуществлена в 1976 году в Чимкентском пединституте по заказу Института химии Академии наук Казахской ССР. ЭВМ системы «Минск» переводит английский текст длиной в тысячу слов, то есть около трех страниц, за двадцать — двадцать пять минут. И это, учитывая ввод текста в машину и вывод его из машины в виде отпечатанного русскими буквами перевода!
В конце 1977 года в Алмаатинском энергетическом институте проходила VII Всесоюзная конференция по генераторам низкотемпературной плазмы. Участвовали в ней и гости из других стран. Делегатам и гостям были вручены три компактные книжечки в красном переплете: англо-русский и русско-английский, французско-русский и русско-французский, немецко-русский и русско-немецкий словари-минимумы. Предназначены они для чтения научных текстов по плазме, а также для разговора с зарубежными коллегами. Автором же этих словарей была… вычислительная машина и, естественно, коллектив программистов и языковедов, составивших машинную программу. За три месяца ЭВМ проделала работу, на которую потребовалось бы несколько лет труда сектора научного учреждения.
Перед нами широкий лист бумаги. Вверху напечатан запрос: «Прошу определить общую тему документа». Далее следует французский текст статьи по технологии окраски. Внизу дается ответ на русском языке: «Документ относится к теме «электрофорез». Затем снова запрос: «Прошу дать машинный реферат документа». На него тут же дан развернутый ответ.
«В этом диалоге, казалось бы, нет ничего удивительного, — пишет профессор Р. Г. Пиотровский, руководитель группы «Статистика речи». — Именно таким образом сотни референтов-переводчиков ведут беседу со своими заказчиками. Однако приведенный текст представляет собой человеко-машинный диалог, в котором вопросы формулировал человек, а ответы на правильном русском языке без всякой подсказки выдавала машина. Учителями компьютера были языковеды, химики и математики из лаборатории инженерной лингвистики Ленинградского педагогического института имени А. И. Герцена и Кишиневского политехнического института».
Лишь совсем недавно человеческий мозг создал «мозг» электронный, вычислительные машины. На первых порах диалог человека с ЭВМ казался фантастикой. Затем настала пора радужных надежд и горьких разочарований. Но работа продолжается, продолжаются поиски подходов и методов, с помощью которых вычислительные машины включатся в человеческое общество и «электронный мозг» станет не просто чудо-счетчиком, по и надежным и верным помощником в тысяче других дел. Путь к этому — обучить машины человеческому языку.
Диалог человека и робота только-только начинается! Мы же закончим наш рассказ о МП — машинном переводе, о поисках ЯП — языка-посредника и о создании ИЯ — информационных языков словами Норберта Винера, которого называют «отцом кибернетики»: «Отдайте же человеку — человеческое, а вычислительной машине— машинное. В этом и должна, по-видимому, заключаться разумная линия поведения при организации совместных действий людей и машин. Линия эта в равной мере далека и от устремлений машинопоклонников, и от воззрений тех, кто во всяком использовании механических помощников в умственной деятельности усматривает кощунство и принижение человека».
В ПОИСКАХ ЗНАЧЕНИЯ
Передача смысла, значения — вот цель нашего общения, главная задача человеческого языка и, стало быть, главная задача науки об этом языке. Можно ли описывать это значение на языке точных формул и чисел?
О том, как математическая лингвистика штурмует «святая святых» языка, расскажет очерк
В ПОИСКАХ ЗНАЧЕНИЯ
Путь к семантике
Не так давно в сектор структурной и прикладной лингвистики Института языкознания Академии наук пришел человек с рюкзаком. В рюкзаке лежали словари: индонезийского, английского, русского, древнегреческого и других языков.
Человек с рюкзаком объявил: он сделал важное открытие. Чтобы определить степень развитости того или иного языка, надо мерять слова. В буквальном смысле мерять — линейкою. Оказывается, древнегреческие слова на пять миллиметров длиннее индонезийских. Стало быть, и сам язык эллинов более развит…
Конечно, это курьез. Но еще каких-нибудь два десятка лет назад даже у многих серьезных ученых представление о математической лингвистике принципиально не отличалось от представлений человека с рюкзаком. Помните, как великий комбинатор Остап Бендер, продавая астролябию, напутствовал покупателя словами: «Сама меряет — было бы что мерять». Математической лингвистике отводилась такая же роль: с ее помощью, дескать, все можно в языке измерить, были бы языки!
Но сам термин «математическая лингвистика» не совсем точен. «Нельзя сравнивать термин «математическая лингвистика» с аналогичным термином «математическая физика», — писал профессор Р. Л. Добрушин в годы, когда математическая лингвистика делала свои первые шаги. — Математическая физика — это особый раздел математики, нацеленный на специфические физические приложения; по своим методам он не менее сложен, чем любой другой раздел математики. В лингвистике же речь должна идти о первых шагах применения математики».
В пионерских работах применялся традиционный аппарат теории вероятностей и теории множеств, математической статистики и теории информации. Однако в наши дни начинается создание и своего особого математического аппарата для лингвистики, подобно тому, как он был создан для экономики с ее линейным и динамическим программированием, теорий игр и теорий массового обслуживания. Особые лингвистические проблемы привели к тому, что в математике родилась совершенно новая область — теория формальных грамматик.
В предыдущем очерке мы упоминали теорию нечетких множеств. Она также была создана математиками для решения задач лингвистики. Позже выяснилось, что аппарат этой теории имеет самые различные применения, вплоть до метеорологии. Сейчас теория нечетких множеств — одна из самых перспективных и бурно развивающихся отраслей современной математики (в нашей стране в издательстве «Знание» вышла брошюра основателя этой теории, Л. Заде, «Основы нового подхода к анализу сложных систем и процессов принятия решений» и его же монография «Понятие лингвистической переменной и ее применение к принятию приближенных решений» в издательстве «Физматгиз»).
Когда ученые попробовали применить к языку и его правилам строгие и однозначные алгоритмы, выяснилось, что они слишком просты и грубы. Теперь математики разрабатывают так называемые нечеткие алгоритмы, опираясь на теорию нечетких множеств. Образцом такого алгоритма может быть поведение слепого, когда он приближается к цели, постепенно уменьшая свои шаги…
Таким образом, в современной лингвистике наряду с традиционным аппаратом математики есть и свои специальные средства. Они применяются для описания диалектов и изменения языка во времени, для грамматики и лексики. Но при всем многообразии идей и направлений, поисков и перспектив можно увидеть общую тенденцию, которая отличает их от более ранних исследований. Тенденцию эту можно охарактеризовать словами, вынесенными в заголовок: поиски значения. Поиски путей, позволяющих проникнуть в сокровенные глубины языка, а вместе с тем — и вообще человеческого мышления, неотторжимого от языка.