Звуки и знаки - Страница 17
Однако в зависимости от степени или меры внутри каждого подкласса можно выделить несколько категорий или элементарных смыслов. Это — очень, большое количество, активность, длительность, выделение в своем классе. Чтобы каждый человек, владеющий русским языком, смог понять то, что формулируется на языке терминов (но термины тоже опираются на языковую интуицию носителей языка, именно она помогает нам понимать друг друга безо всяких лингвистических теорий), приведем несколько примеров.
«Очень» указывает на высокую степень того или иного признака предмета, но без сравнения его с другими предметами, которые обладают теми же признаками. Здоровье может быть крепким, и дружить можно крепко, а интересоваться— глубоко. Вторая категория — «большое количество» — указывает на увеличение объема. Выбор может быть широким, информация — обширной, ограбление — групповым, вред — огромным. Третья — «активность» — связана с интенсивностью того или иного процесса. Работать с душой можно и не активно, а вот работать не покладая рук — это значит трудиться активно. Выражение «огромная энергия» подчеркивает количество этой энергии, а «кипучая энергия» — ее активность.
Категорию «длительность» легко понять, если в качестве примера привести выражения «продолжительные аплодисменты», «старая дружба», «смеяться до упаду», «любовь до гроба», «древние традиции» и т. п. Наконец, последняя рубрика — «выделение в своем классе» — указывает на то, что смысл выделяется из такой же смысловой группы особым подчеркиванием: оборудование бывает уникальное, урожай — рекордным, красота — необыкновенной и бежать можно изо всех сил…
ЯП, МП, ИЯ
Вероятно, теперь вы и сами поняли, как трудно, а порой просто невозможно описать в терминах, понятных ЭВМ, всю нашу сложную и нелинейную систему значений. И тем не менее система существует, иначе человек не смог бы понимать человека и ни один ребенок не смог бы обучиться родному языку, не говоря уже об иностранных.
Что же получается в итоге? Человек, решив передать машинам механическую работу, обнаружил, что, казалось бы, самые обыденные дела, вроде разговора, требуют таких сложных алгоритмов, таких тонкостей, о которых не догадывались даже лучшие умы прошлых веков.
И все-таки машины нужны для перевода! Современный мир, говорят ученые, сам по себе напоминает огромную переводческую машину, работающую со все увеличивающейся скоростью. Каждый день с печатных станков сходит около шестидесяти переведенных книг, открывается три или четыре международные встречи, выпускается на экран несколько дублированных фильмов; пишущие машинки печатают, а дикторы оглашают несчетное количество переведенных страниц; бесконечное число документов переводится в самом разнообразном виде с одних языков на другие.
Но для того, чтобы включить в гигантскую «переводческую машину», которой является наш современный мир с его несколькими тысячами языков, ЭВМ, мы должны прежде всего разобраться, хотя бы приблизительно, в работе нашей собственной «вычислительной машины» — мозга, причем под определенным углом зрения — лингвистическим. Не инженер, а лингвист должен найти формулы языка, алгоритмы нашего повседневного чуда — языка, которое предстает перед нами каждый день и каждый миг. Задача же эта необычайно сложна и трудна.
Причем на пути ученых встают трудности самого различного характера: технические, лингвистические, логические. Предположим, что нам удалось решить проблемы смысловых множителей, разложить любое слово на отдельные «атомы смысла», его составляющие. Сколько же слов понадобится вводить в память машины?
Мы уже говорили, что словари таких развитых языков, как русский или английский, включают около полумиллиона слов. Но ведь есть еще и так называемые фразеологизмы, непереводимые буквально выражения, идиомы. Их в языке много тысяч. Добавьте к ним также десятки тысяч специальных терминов, в словари литературного языка не вошедших. А такой развитой терминологией обладают все науки, будь то химия, медицина, электроника или сама лингвистика («Словарь лингвистических терминов» О. С. Ахмановой включает семь тысяч единиц, а в него вошли далеко не все термины современной науки о языке, например, нет в словаре ни «инженерной лингвистики», ни «нейролингвистики», то есть целых дисциплин, имеющих свою собственную терминологию!). Так что общее число слов будет, пожалуй, превышать миллион. А ведь к ним надо прибавить еще правила грамматики и программы, объем которых составит не менее трети машинной записи словаря!
Это, так сказать, трудность чисто техническая. Не за горами то время, когда ЭВМ будут обладать памятью, достаточно большой, чтобы вместить всю эту информацию. Но здесь встает следующая проблема — проблема времени. Для ввода одного слова в ЭВМ, снабженного всеми нужными признаками, смысловыми и грамматическими, необходим день работы одного исполнителя. Значит, чтобы ввести миллион слов в ЭВМ, нужен один миллион человеко-дней или тридцать лет работы коллектива, состоящего из ста человек.
Эта проблема, в свою очередь, порождает проблему, которую называют «парадоксом Ахиллеса и черепахи». Парадокс этот известен со времени античности: может ли быстроногий Ахиллес догнать черепаху, если в каждый конкретный момент времени черепаха также продвигается вперед? Если следовать правилам логики, Ахиллесу ее никогда не догнать! Не получится ли сходная ситуация и при машинном переводе: информация, заложенная в ЭВМ, будет устаревать к тому моменту, когда начнется практическое применение «электронного мозга?» Ведь слова, как известно, меняются со временем. И никакому Ахиллесу-роботу не догнать наш неспешный, но постоянно изменяющийся язык-черепаху…
Более того, слова не являются, строго говоря, отдельными изолированными единицами языка. Смысл их связан со смыслом других слов, все слова как бы прошиты незримыми нитями ассоциаций. Причем границы между этими связями нечетки, они как бы размыты. Приведем такой пример. В нашем языке есть группа прилагательных, относящихся к возрасту человека: детский, отроческий, юношеский, молодой, средних лет, пожилой, старый. Но попробуйте-ка четко и однозначно распределить смысл этих слов по строгой шкале лет, и вы убедитесь сами, насколько размыты границы между детским и отроческим, отроческим и юношеским, юношеским и молодым, молодым и средних лет, средних лет и пожилым, пожилым и старым у разных людей, в зависимости от их собственного возраста (вспомните журналиста из «Двенадцати стульев», считавшего стариком всякого, чей возраст превысил двадцать лет!).
Теория нечетких множеств — так называется новая область математики, одна из самых интересных и перспективных, которая родилась в связи с описанием языка. Ее аппарат начинает применяться и для машинного перевода, и для информационного поиска. А надежной точкой опоры становятся те холодные числа, данные статистики, о которых рассказывал наш первый очерк. И если первые опыты по машинному переводу были в полном смысле слова опытами, то в наши дни начинается промышленная эксплуатация МП.