Стартовая

Почему именно Google

0

Почему только Google

1

Google — краткая история, возможности и особенности

2 3 4 5 6

Поиск для нетерпеливых

7 8 9 10 11

Терминология и немного теории

12 13 14 15 16 17 18 19

Первоначальная настройка

20 21 22 23

Поиск для терпеливых

24 25 26 27 28 29 30 31 32 33 34 35 36

Тематический поиск

37 38 39 40 41 42 43 44 45 46 47 48 49 50 51

Программные средства Google

52 53 54 55 56 57 58 59 60 61 62 63 64 65 66

Лаборатории Google

67 68 69 70 71 72 73

Платные услуги

74 75 76 77 78

Популяризация сайта с помощью Google

79 80 81

Заключение

82

Координаты каждого документа в этом пространст­ве зависят от содержащихся в нем терминов (от их весовых коэф­фициентов, положения внутри документа, от "расстояния" между терминами и т.п.). В результате оказывается, что документы с по­хожим набором терминов располагаются в этом пространстве по­близости. Получив запрос, поисковая система удаляет лишние сло­ва, выделяет значимые термины, вычисляет вектор запроса в про­странстве документов и выдает ссылки на документы, попавшие в определенную область пространства.

В пространственно-векторной модели термины "взаимодейст­вуют" друг с другом, что повышает релевантность найденных до­кументов запросу пользователя. Поисковая машина, работающая в соответствии с такой моделью, лучше воспринимает запросы на естественном языке, чем машина, использующая более привыч­ную "матричную" модель (в которой просто составляется матрица "термины-документы"; если в докуме1сте упоминается какой-то термин, в матрице проставляется число, учитывающее его весо­вой коэффициент, не упоминается — ставится ноль).

Схема работы каждой поисковой системы держится в секрете. Выше мы в весьма упрощенной форме изложили лишь основы алгоритма работы поисковой системы. В реальности механизм индексации и структура базы данных ИПС значительно сложнее. Но и сказанного вполне достаточно для того, чтобы при форму­лировке запросов вы старались выбирать слова, наиболее точно характеризующие предмет поиска. Впрочем, о точности и полноте поиска мы более подробно поговорим в следующем разделе.

Полнота и точность поиска

Если бы интеллект поисковой машины был сравним с челове­ческим, в результате поиска мы получали бы несколько докумен­тов, содержащих исчерпывающую информацию о предмете поис­ка. К сожалению, это (пока) не так, и в результатах запроса обыч­но фигурируют сотни документов, не имеющих отношения к тому, что мы на самом деле хотели получить. Называются такие доку­менты нерелевантными. Более подробно этот термин (точнее, про­тивоположный ему по значению) обсуждается ниже.

Релевантность

Итак, релевантным (от англ. relevant — подходящий, относя­щийся к делу) называется документ, имеющий отношение к сде­ланному вами запросу, т.е. содержащий нужную вам информацию.

Следует отметить, что обсуждение понятия релевантности в кон­тексте информационно-поисковых систем ведется уже около полуве­ка, но его конкретного общепринятого определения все еще нет.

По-разному дают определение релевантности и словари. Так, "Экономический словарь", расположенный на сайте www.km.ru, считает, что релевантность — это смысловое соответствие между ин­формационным запросом и полученным сообщением. Поисковый узел Yandex (www.yandex.ru) трактует этот термин как меру соот­ветствия результатов поиска задаче, поставленной в запросе (что, в общем-то, эквивалентно определению "Экономического словаря ").

Но иногда этому термину дают несколько расширенное толкова­ние. Так, в одной из статей на том же поисковике Yandex говорится, что "при поиске в Internet важны две составляющие— полнота (ничего не потеряно) и точность (не найдено ничего лишнего). Обычно это все называют одним словом — релевантность". Другими словами, релевантность — это опять-таки соответствие ответа вопро­су, но с учетом таких понятий, как полнота и точность поиска.

Коэффициенты полноты и точности

Коэффициентом полноты поиска (или просто полнотой поиска) называют


<< назад вперед >>