Интернет-разведка. Руководство к действию - Страница 14
Эксперимент показал, что система действительно справляется с опечатками транслитерации, если количество таких ошибок в слове невелико. Убедитесь сами.
Запрос (все буквы русские):
[ «глОКлАя кУздРА»]
Результат: Вы искали: «глОКлАя кУздРА», найдено сайтов: 5, документов: 37.
Запрос (заглавные буквы – латинские):
[ «глOKлAя кYздPA»]
Результат: Не найдено ни одного документа, полностью соответствующего запросу ««глOKлAя кYздPA»».
Запрос (заглавные буквы – латинские):
«глOклая куздPа»
Результат: Вы искали: ««глOклая куздPа»», найдено сайтов: 5, документов: 37.
Чтобы не загружать читателя лишними примерами, скажем лишь, что при трех опечатках правильный поиск еще проводился, но после появления четвертой неправильно написанной буквы результат поиска стал нулевым. Рамблер в комментариях к результату поиска в этом случае просто порекомендовал пользователям быть внимательнее при вводе текста.
5. Регистр букв.
Как правило, Рамблер не учитывает регистр букв, причем он распространяет это правило не только на слова запроса, но и на операторы.
Действительно, запросы «глоклая куздра» и «ГлоКЛаЯ КУздРа» дали одинаковые результаты.
Запрос:
[ «глоклая куздра»]
Результат: Вы искали: «„глоклая куздра“«, найдено сайтов: 8, документов: 45
Запрос:
[ «ГлоКЛаЯ КУздРа»]
Результат: Вы искали: «„ГлоКЛаЯ КУздРа“«, найдено сайтов: 8, документов: 45
Однако Рамблер сообщает, что он делает исключение из этого правила: если в запросе, как минимум, два слова, идущих подряд, написаны с заглавной буквы, система, как утверждают ее создатели, старается искать эти слова также с заглавной буквы. То есть, Рамблер пытается помочь тем, кто ищет имена собственные или географические названия.
Проведенный нами эксперимент этого не подтвердил.
Запросы:
[слава зайчиков] и [Слава Зайчиков]
выдали в Рамблере одинаковое количество страниц в выдаче.
Вы искали: слава зайчиков, найдено сайтов: 813, документов: 2621
Вы искали: Слава Зайчиков, найдено сайтов: 815, документов: 2621.
Это похоже на результаты Гугла, который не различает заглавные и прописные буквы:
Результаты 1 – 10 из примерно 138 000 для слава зайчиков
Результаты 1 – 10 из примерно 138 000 для Слава Зайчиков.
Тогда как в Яндексе, который различает заглавные и прописные буквы, результат был иным:
Запрос: [слава зайчиков]
Результат поиска: страниц – 403, сайтов – не менее 173.
Запрос: [Слава Зайчиков]
Результат поиска: страниц – 64, сайтов – не менее 33.
Совершенно идентичные предыдущим результаты были получены и на запросах из трех слов:
[одна баба сказала] и [Одна Баба Сказала]
Результат: Вы искали: одна баба сказала, найдено сайтов: 42056, документов: 619112
Результат: Вы искали: Одна Баба Сказала, найдено сайтов: 42054, документов: 619112.
6. Стоп-слова и оператор «кавычки».
Подобно Яндексу, Рамблер при обработке запроса может проигнорировать стоп-слова. Авторы системы утверждают, что для принудительного включения указанных элементов (или каких-либо других, подобных им) в выдачу, нужное слово следует заключить в кавычки.
Эксперимент расставил акценты иначе. Стоп-слова, независимо от того, закавычены они или нет, одинаково попадают в выдачу.
А вот остальным словам (не входящим в список стоп-слов), которые необходимо в обязательном порядке включить в выдачу, кавычки действительно обеспечивают обязательное включение в результат. Это эквивалентно оператору «плюс» в Яндексе и Гугле.
Вы искали: «с» пингвином, найдено сайтов: 15468, документов: 166651
Вы искали: с пингвином, найдено сайтов: 15468, документов: 166651.
Вы искали: «the» apple please, найдено сайтов: 2700, документов: 16047
Вы искали: the apple please, найдено сайтов: 2700, документов: 16047.
Пример работы кавычек в иных случаях, а не только со стоп-словами, приведен в следующем разделе – Логическое «И».
Кроме того, как мы уже говорили, кавычки могут выступать аналогично оператору «восклицательный знак» в Яндексе. Слово, указанное в запросе в кавычках, будет присутствовать в результатах поиска лишь в той форме, в которой вы его зададите.
7. Логическое «И».
Как и в Яндексе с Гуглом, роль логического «И» в Рамблере выполняет пробел. В принципе, можно ввести вместо пробела слово AND, но на практике, по вполне понятным причинам, так обычно не делается.
Подобно Яндексу, Рамблер достаточно вольно обращается со словами, которые соединены пробелом – он может легко выдать не только те документы, где присутствуют ВСЕ слова запроса, но и те, где на одно-два слова меньше.
В этом можно убедиться, сравнив два запроса:
[кошки собаки верблюды зебры носороги]
Вы искали: кошки собаки верблюды зебры носороги, найдено сайтов: 42, документов: 296
http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Rambler_bez_Nosorogov.html
и
[ «кошки» «собаки» «верблюды» «зебры» «носороги»]
Вы искали: «кошки» «собаки» «верблюды»…, найдено сайтов: 9, документов: 53
http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Rambler_s_Nosorogami.html.
Во втором случае все без исключения элементы запроса принудительно включены в выдачу – за счет кавычек, поэтому документов в выдаче значительно меньше.
8. Логическое «ИЛИ».
Написание этого оператора приспособлено как для любителей Яндекса, так и для тех, кто предпочитает работать с Гуглом.
Как и в Яндексе, в Рамблере логическое «ИЛИ» может быть представлено вертикальной чертой |.
Для тех, кто привык к логическому «ИЛИ» Гугла, данная система предоставляет возможность пользоваться также оператором OR.
Приоритета нет ни у одного из этих двух указанных вариантов.
Наример:
Вы искали:
дуоденогастрэктомия OR циклопентанпергидрофенантрен,
найдено сайтов: 266, документов: 813.
Вы искали:
дуоденогастрэктомия | циклопентанпергидрофенантрен,
найдено сайтов: 266, документов: 813
9. Логическое «НЕ».
Логическое «НЕ» в Рамблере похоже на таковое в Гугле и распространяется на весь документ. Сузить запрос, подобно Яндексу, до предложения, эта система не позволяет. Записывается логическое «НЕ» как NOT.
Запрос: [журавль]
Вы искали: журавль, найдено сайтов: 43085, документов: 554542
Запрос: [журавль NOT колодец]
Вы искали: журавль NOT колодец, найдено сайтов: 41447, документов: 528644
Запрос: [журавль NOT (колодец | птица)]
Вы искали: журавль NOT (колодец | птица), найдено сайтов: 33059, документов: 390789
Запрос: [журавль NOT (колодец | птица | «журавль»)]
Вы искали: журавль NOT (колодец | птица | «журавль»), найдено сайтов: 23824, документов: 225549
Запрос: [журавль NOT (колодец | птица | «журавль» | «журавлей»)]
Вы искали: журавль NOT (колодец | птица | «журавль» | «журавлей»), найдено сайтов: 21197, документов: 192387
10. Стемминг (а также wildcard).
Рамблер НЕ поддерживает ни стемминг, ни вилдкард.
11. Поиск с заданным расстоянием.
Рамблер не очень качественно поддерживает поиск с расстоянием, несмотря на то, что его «Помощь» утверждает обратное.
Рамблер говорит о том, что когда он ищет слова «в документе», то он реально ищет их на расстоянии не более 40 слов друг от друга. Это, конечно, не поиск с расстоянием, а скорее ограничение расстояния, но, по крайней мере, это прямо заявленное ограничение.