В
частности, если вас заинтересовали параметры,
которыми оценивается эффективность поиска в Internet, то в одном случае
ссылка на статью, содержащую исчерпывающую информацию по данному вопросу, может
оказаться семнадцатой (рис. 5.6), в другом среди первых 20-ти ссылок нужный
нам документ (не обязательно тот же самый, ссылка на который была первой при
предыдущем варианте поиска) отсутствует (рис. 5.7). Пришлось бы потратить
немало времени на изучение еще нескольких десятков ссылок, чтобы найти нужную
информацию. Кроме того, существенно отличается и полнота поиска. При
использовании в качестве одного из ключевых слов Internet результаты поиска содержат 32 400 ссылок, при использовании
слова интернет —
S1
400. (Напомним, что Google не различает строчные и прописные
буквы, так что можно с равным успехом вводить ключевые слова интернет и Интернет.)
Следует отметить, что в обоих случаях нами
применялась одна и та же ИПС, использующая одни и те же алгоритмы поиска, определения
релевантности и ранжирования. То есть, в относительной "неудаче"
одного из поисков ИПС "не виновата".
Бывают случаи, когда даже записанные кириллицей термины
имеют варианты написания. За примерами ходить недалеко: броузер и браузер,
апплет и аплет, дескриптор, тег и даже (уже практически не употребляющийся)
тэг.
Если вы ищете в Сети тексты книг Роджера Зилязны, не мешает
проверить и вариант Роджер Желязный; существует также вариант Роджер Желязны.
Для этого вы, конечно, должны знать, чго это — известный американский писатель
польского происхождения (отсюда и разные варианты транскрипции его фамилии).
Поисковик Google нашел в первом случае всего лишь 6 документов, во втором
— 112. Сказанное может относиться к другим фамилиям и именам (Хаксли и Гексли,
Уильям и Вильям).
Фамилия
Фишер относится к числу распространенных. Если вас интересует информация о
знаменитом некогда шахматисте Роберте Фишере, вы, для повышения релевантности
поиска, можете ввести в качестве ключевого слова его имя. Но во многих
публикациях шахматист фигурировал как Бобби Фишер, и они могут попасть в число
последних при выводе результатов поиска (которые просматривать до самой
последней ссылки вы, конечно же, не станете). Значит, нужно проверить и второй
вариант. Но в данном конкретном случае целесообразнее, по-видимому, в качестве
второго ключевого слова использовать "шахматы" (Фишер & шахматы) —
релевантность поиска сразу повысится, поскольку из его результатов будут
исключены ссылки на "полных тезок" великого шахматиста.
ИПС следующих поколений, не исключено, будут уметь самостоятельно
варьировать запросы пользователя, а пока, дабы не проводить два поиска вместо
одного, используйте уже знакомый вам оператор OR (ИЛИ) или его эквивалент
|. То есть, для охвата упомянутых выше вариантов запроса "эффективность
поиска в Internet" и "эффективность поиска в Интернет" в
строке запроса следует ввести эффективность
поиска в Internet OR интернет
либо эффективность поиска в Internet
| интернет. В результате будут получены ссылки на 89 100 документов. Как
видите, полнота поиска повысилась, а ссылки в результатах представлены в
порядке, отличающемся от предыдущих вариантов поиска (рис. 5.8). Иногда он
может оказаться более "правильным", иногда менее.
• В каталоге обязательно бывают
представлены все наиболее популярные Web-узлы по той или иной теме
(из числа представленных в каталоге),