На главную  
Главная страница
Основные поисковые машины
Язык поисковых запросов
Применение языка запросов
Об авторах
   

Язык поисковых запросов

Поисковый запрос может состоять из одного или нескольких слов, в нем могут присутствовать различные знаки препинания. Составлять самые простые запросы можно и не вдаваясь в тонкости языка запросов. Так, если ввести в поисковую строку несколько слов без знаков препинания и логических операторов, будут найдены документы, содержащие все эти слова, причем если они находятся на ограниченном расстоянии друг от друга. Однако знание и правильное применение языка запросов поисковой машины поможет сделать Ваш поиск быстрым и эффективным.

Регистр

В общем случае, регистр написания поисковых слов и операторов значения не имеет, то есть слова «дом», «Дом», «доМ» и «ДОМ» - все будут восприниматься одинаково. Это полностью касается и латиницы. Так, «Not» и «nOt» и даже «noT», «not» и «NOT» все они для поиска одинаковы. И лишь иногда, в целях повышения качества поиска, регистр слов поискового запроса принимается во внимание.

Так, если запрос состоит из двух, трех или четырех слов, каждое из которых написано с большой буквы, то предполагается поиск по имени собственному и автоматически производится изменение ограничения расстояния между словами запроса со значением по умолчанию на величину (n-1)*2, где n – количество слов запроса. Это позволяет находить группу слов запроса, внутри которой есть не более одного «лишнего» слова или знака препинания, например: «М.Лермонтов», «Баден-Баден», «Шарль де Костер», «Федор Михайлович Достоевский» и т.п.

Операторы

Современные поисковые машины используют операторы для поиска в компьютерных сетях. Под операторами здесь понимается инструкция поиска. По этой причине запрос, включающий несколько слов, может содержать операторы. Поиск указанных операторов в документе не производится. Они служат лишь инструкцией поисковой машине. По этой причине они имеют свою биографию и синтаксис. Все операторы поисковой машины бинарные, то есть имеют левую и правую часть, каждая из которых также является запросом (по умолчанию состоящим из одного слова). Для изменения сферы действия операторов (группировки нескольких слов запроса в аргумент оператора) применяются скобки и кавычки.

Два запроса, соединенные оператором AND (логическое И) образуют сложный запрос, которому удовлетворяют только те документы , которые одновременно удовлетворяют обоим этим запросам. Иными словами, ‘самолеты AND авиация’ найдутся только те документы, которые содержат и слово ‘самолеты’, и слово ‘авиация’ одновременно. Если эти слова встретятся в текстах отдельно, поисковая машина Вам эти тексты не покажет. Контрольная проверка может быть осуществлена по логике фразы : «И ТО И ДРУГОЕ».

Сложному запросу, состоящему из двух запросов, соединенных оператором OR (логическое ИЛИ) удовлетворяют все документы, удовлетворяющие хотя бы одному из этих двух запросов. По запросу ‘самолеты OR авиация’ найдутся документы, в которых есть хотя бы одно из этих двух слов, или либо оба эти слова вместе. Логическая контрольная проверка может быть осуществлена по фразе : «ИЛИ ТО ИЛИ ДРУГОЕ, ИЛИ ОБА ВМЕСТЕ».

Оператор NOT (логическое И-НЕ) образует запрос, которому отвечают документы, удовлетворяющие левой части запроса и не удовлетворяющие правой. Так результатом поиска по запросу ‘самолеты NOT авиация’ будут показаны все документы, в которых есть слово ‘самолеты’ и при этом в данном документе отсутствует слово авиация. Контрольная логическая проверка может быть осуществлена по фразе : «ПЕРВОЕ, НО ТОЛЬКО БЕЗ ВТОРОГО».

Обратите внимание ! Если оператор явно не указан, используется оператор по умолчанию AND: находятся только документы, содержащие все слова запроса. Так запрос ‘информация школа успеваемость’ будет истолкован как ‘информация AND школа AND успеваемость’ . На странице Расширенного поиска оператор по умолчанию может заменить на OR (Искать слова запроса : хотя бы одно).

Каждый из операторов имеет своё сокращенное обозначение, соответствие их приведено в таблице :


ОператорСокращенное обозначение
AND &
OR |
NOT !

Запрос из нескольких слов, перемежающихся операторами, будет истолкован в соответствии с их приоритетом. Операторы AND и NOT традиционно имеют более высокий приоритет, поэтому запрос из нескольких слов при обработке сначала группируются по операторам AND и NOT, и лишь потом по операторам OR. (Вспомните, для примера , приоритеты арифметических действий. Так знаки «*» и «/» имеют равный приоритет, но больший чем знаки «+» и «-» ). Изменить порядок группировки можно, как и в математике, используя скобки.

Скобки

При построении запросов иногда возникает необходимость объединения слов запроса в группы, которые будут аргументами некоторого оператора. Такие группы заключаются в скобки. Как правило, в большинстве поисковых машин используют только скобки вида ().

Часть запроса, заключенная в скобки, сама является запросом, и на неё распространяются все правила языка построения запросов. Использование скобок позволяет строить вложенные запросы и передавать их оператором в качестве аргументов, а также перекрывать приоритеты операторов, принятые по умолчанию.

Если запрос был задан без скобок, например : ‘машина самолет | аэродром’ , он эквивалентен запросу ‘машина AND самолет OR аэродром’ и в соответствии с приоритетами операторов, обозначает «найти документы, содержащие либо слова ‘машина’ и ‘самолет’ в одном документе, либо найти в нем слово ‘аэродром’. В то время как запрос со скобками ‘машина (самолет | аэродром)’ равносилен запросу ‘машина AND (самолет OR аэродром)’, что означает «найти документы, содержащие слово ‘машина’ и одно из слов ‘самолет’ или ‘аэродром’.

Кавычки

Для поиска цитат можно использовать типовые (двойные) кавычки, вида « или ". Слова запроса, заключенного в двойные кавычки, ищутся в документах именно в том виде и в том порядке, как они были заданы Вами в запросе.

Таким образом, двойные кавычки, можно использовать и просто для поиска слова в заданной форме (по умолчанию слова находятся во всех формах). Например, запросу : ‘теплоход «причалил» посадка’ удовлетворяет документ, содержащий текст ‘...теплоход причалил для осуществления посадки пассажиров … ‘, и не удовлетворяют документам: с ‘... теплоход причалился для посадки пассажиров … ‘ , или ‘... теплоход был причален и на него была проведена посадка пассажиров … ‘.

Метасимволы

Далеко не всякая поисковая машина может поддерживать поиск строк с использованием метасимволов ( ‘*’, ‘?’), которые обычно используются в значении «любая подстрока» и «произвольный (любой) одиночный символ» соответственно. Тем не менее, эти операторы нередко бывают зарезервированы для подобного использования в будущем. Например, на поисковой машине www.mail.ru.

Перейти к следующему разделу
   




Hosted by uCoz