Этруски: загадка номер один - Страница 25
На наш взгляд, электронная вычислительная машина может оказаться незаменимым помощником в выявлении абстрактной структуры этрусского языка. На первом этапе мы отказываемся от гипотез, начинаем с нуля, т. е. с того, что об этрусском языке мы не имеем ровным счетом никаких сведений, кроме тех, что данные тексты, которые предстоит обработать, — это тексты, написанные на «языке икс». И для контроля берем тексты такого же объема, написанные на языке, который мы хорошо знаем, например на русском. А вслед за этим начинаем строгие, формальные процедуры, которые может проделать и человек, и машина, — разница здесь будет лишь в скорости обработки, а не принципиальная.
Первый вопрос: что свойственно «языку икс» — префиксы (т. е. приставки и т. п.) или суффиксы? Подсчитываем частоту букв во всех текстах, а затем смотрим, какой процент слов начинается и заканчивается на А, К, Е и т. д. Оказывается, что в этрусских словах начальные буквы встречаются примерно так же часто, что и в середине слова, а финальные — нет. Одна пятая часть всех этрусских слов имеет окончание на букву А, одна шестая — на И, а вот на П или Ц заканчивается ничтожный процент всех этрусских слов. Значит, этрусскому языку свойственны суффиксы, а не префиксы (примерно такая же картина и в русском языке, только в начале слов будут отклоняться буквы «п», «в» и «с» — за счет приставок «во», «со», «по» и т. п.). Этот вывод подтверждает и статистика окончаний не отдельных букв, а их сочетаний (АА, ЕА, КА; АЕА, АКА и т. д.).
Если бы язык этрусков походил на некоторые языки Кавказа, которым свойственны префиксы, а не суффиксы, дальнейшая работа велась бы с алфавитным словарем. Раз это не так, мы берем «обратный словарь». На букву А заканчивается более 20 процентов всех этрусских слов. Но означает ли это, что А — грамматический показатель? Может, не просто А? Может, употребление А в конце слов зависит от того, что она входит в состав более длинных суффиксов, заканчивающихся на «А», например, ИА, СА, НА и т. п.?
Чтобы проверить это, мы переходим ко второму этапу исследования. Как отличить в языке случайное от закономерного? На помощь здесь приходит математическая статистика, изучающая случайные процессы. Если какое-то сочетание букв, слогов, слов встречается редко или часто в тексте, это еще ни о чем не говорит. Следует проверить, опираясь на законы теории вероятностей, чем вызвано оно: тем ли, что просто-напросто эти буквы, слоги или слова, встретившиеся вместе, имеют большую частоту, или же тем, что они отражают какую-то особенность, какое-то свойство языка.
Буква «я» в нашем алфавите не только самая последняя, она и встречается реже, чем буквы «а», «о» и ряд других. Между тем в окончаниях слов она очень часта. Почему? Да потому, что входит в состав окончаний, вроде «-ся», «-ая», «-яя» и т. д. С точки зрения теории вероятностей и окончание «-ая» и окончание «-яа» должны встречаться одинаково, ведь частота букв, образующих эти сочетания, не изменилась. Между тем, обратившись к текстам, мы встретим тысячи окончаний на «-ая» и ни одного на «-яа». Ибо «-ая» является грамматическим показателем, а окончание «-яа» — нет.
Теперь, вероятно, вы поняли принцип выявления этрусской грамматики, вернее, суффиксов этрусского языка. Берется определенная буква, допустим буква А. Затем подсчитывается, как часто встречаются в тексте ее сочетания с буквами Е, К и всеми остальными. Потом вычисляется, а сколько бы таких сочетаний должно было образоваться, если бы все эти окончания ЕА, КА, АА, СА образовывались случайно, т. е. не отражали бы какие-то законы грамматики (нам пока неизвестные), а были бы порождением лишь самих частот букв, образующих эти сочетания. Полученные величины сравниваются. И тут оказывается, что, например, сочетание СА должно бы по теории вероятностей встретиться в этрусских текстах 50 раз, а на самом деле оно встречается 450 раз. Значит, никакой случайности тут не может быть, это закономерность, продиктованная особенностями этрусского языка: в нем есть суффикс СА, он-то и дал такое частое употребление «абстрактному» сочетанию С и А.
Ну, а может быть, есть суффикс не СА, а более длинный? Например, ИСА, или ЕСА, или АСА? Процедура подсчетов повторяется, только на сей раз мы рассчитываем вероятность «встречи» сочетания СА с буквами А, Е, К, Т и т. д. (т. е. АСА, ЕСА, КСА, ТСА и т. д.). Потом снова проводится сравнение расчетных и реальных величин. И далее, рассматриваются сочетания четырех букв и т. д.
В русском языке, который был также подвергнут такой «дешифровке», четко выделяются сочетания двух букв, вроде «-ая» или трех, вроде «-щая», «-щий» и ряд других. Выделяются и падежные окончания, например, к корню «бок» как бы «приклеиваются» окончания «а», «у», «ам», «ами», и они же «приклеиваются» к корню «бык» и т. д. Этрусский язык в этом смысле подобен русскому, там также выявляются падежные окончания, показатели множественного числа и суффиксы. Разумеется, конкретного значения мы определить с помощью такой методики не можем, да и не это было ее целью. Зато мы можем сказать другое: она подтверждает выводы этрускологов о том, что слова этрусков изменялись по падежам, имели суффиксы и т. п.
Программа выявления структуры «языка икс» может быть опробована на любом языке, известном или неизвестном. Целью эксперимента, о котором мы рассказали, было выяснение: может ли этрусский язык изучаться подобным методом? Полученные результаты показывают: да, может. Но, сказав «а», надо говорить и «б». Следующим этапом должна быть уже не проверка результатов, достигнутых этрускологами (или, скорее, проверка программы, резултаты которой сравниваются с тем, что уже известно после комбинаторного анализа), а достижение новых результатов. А для этого предстоит сделать еще очень много.
Пути к «автоматическому» выявлению грамматики языка этрусков автор этой книги стал искать несколько лет назад. В настоящее время над этой проблемой под его руководством работает выпускница отделения математической лингвистики Ленинградского университета Е. Д. Савенкова. Ею составлена программа машинной обработки текстов (до сей поры работа, о которой рассказывалось выше, велась вручную). Но прежде чем засылать этрусские тексты в электронную память машины, необходимо внести в них исправления, которые не учли Фаулер и Вольф, разделить на группы, в зависимости от места и времени надписи и т. д.
Но даже если абстрактная грамматика, «формула этрусского», будет выведена, разумеется, это не принесет разгадки тайны языка этрусков, а лишь даст возможность исследователям оперировать со словами, значение которых неизвестно, но известна их «категория» (т. е. это слово существительное, это — глагол и т. д.). Ну, а как значение слов? Останется ли его определение уделом людей, и помощь ЭВМ здесь лишь в доставке нужного «сырья»?
Работы последних лет в области математической лингвистики показывают, что и проблемы значения слов могут быть в сфере ее интересов. Более того: «поиски значения» являются в наши дни ведущим направлением в математической лингвистике. А это вселяет надежду, что в недалеком будущем ЭВМ можно будет давать задания по поиску значения отдельных этрусских слов, исходя из контекстов, характера надписей и других данных. И тогда, казалось бы, очень далекая от проблем века космоса и кибернетики область знания, как этрускология, пойдет рука об руку с ультрасовременной математической лингвистикой и кибернетикой, конечная цель которых — моделировать деятельность человеческого мозга, мышления, которое невозможно без языка!
ГЛАВА 12. Подводя итоги
Около двух тысяч лет назад римский император Клавдий написал историю этрусков — труд в двадцати томах.
Быть может, если бы он дошел до наших дней, этот народ и не был бы «загадкой номер один». Но сочинение Клавдия погибло при пожаре знаменитой Александрийской библиотеки.