Найдет в Сети тот...
Опубликовано в журнале "Компьютер Price" http://www.comprice.ru/
Юлий Симоненко <ergon2000@mail.ru>
-Будьте добры, скажите, пожалуйста, как
мне отсюда выбраться?
-Многое зависит от того, куда тебе нужно
добраться, - сказал Кот.
Льюис Кэррол. "Алиса в Стране
Чудес"
Кто умеет искать в Сети?
Победители соревнований по поиску в Интернете и
профессионалы - не в счет. Нет, не все находится в Сети, или не
сразу, или не у всех. Как быть? Попавшиеся в публикациях
разноплановые рекомендации можно свести воедино и "себе присвоить ум
чужой". При этом следует помнить, что чем больше возможностей
становится у машин-поисковиков, тем больше внимания надо уделить
правильному "сотрудничеству" с ними.
Опечатки казнить нельзя...
В Интернете
поисковых систем - как грибов после дождя. Технические ухищрения,
нужные для поиска, есть в Сети по темам: "Организация поиска" и
"Формулирование запроса", "Простой поиск из одного слова", "Простой
поиск из множества слов" и т.д. Но о человеческих ошибках там - ни
полслова. А ведь именно из-за примитивной ошибки в написании слова
поиск потерпит полный провал. Например, нельзя делать
орфографических ошибок в наборе поискового запроса. Но можно ли
обойтись без опечаток? Увы, нет.
Чтение знакомого текста с листа сопровождается
ошибками. Одна-две "опечатки" - обычная норма. Если же волнуется....
Конечно, сервер может подправить ошибку, если "поймет" ее. "Слепой"
метод набора текста для поиска в Сети необходим для кириллицы и для
латиницы. Да, еще, кодировки. Забыли переключиться на латиницу -
будете злиться. Станьте внимательнее или используйте подходящую
помощницу, программу-утилиту. Кто не забывал поменЯть регистр?
Запросы вводятся в нижнем регистре (иначе качество
поиска снижается). Но имена собственные и названия нужно записывать
с большой буквы.
Вот вам и первые рекомендации по учету "человеческого
фактора". Простенькая, как кожура банана.
Что искать?
(рефераты-плагиаты, "сборные солянки",
"тренировка ума", "кирпичи развития").
По чему искать?
По коду хорошо искать узкоспециальный термин, номер
модели или ее код по каталогу, прайсу, по номеру документа. Но и в
этом случае надо помнить, что поисковая машина может тебя
неправильно "понять". Например, клавиатуру или какой-нибудь
неведомый "винчестер". Ввели точнехонько его код FHgf 811801-
Р9899у8, и все. Но как воспримет машина дефис или дробную черту?
Лучше сделать запрос из двух половинок - FHgf 811801 и Р9899у8.
По нескольким признакам
За ключевыми словами прячутся признаки того, что надо
найти. Нет уникального отличительного признака - придется
использовать их комплекс, который и станет отличительным признаком.
Не сложно обстоит дело с поиском телефона друга по телефонному
справочнику в Сети, если помнишь его отчество и день рождения. Нет,
надо делать "ход конем" и найти его по именам родственников, других
друзей.
Поиск по фрагменту текста
Задал учитель поиск стихотворений Пушкина по
фрагментам. Зачем? Чтобы побудить учеников к просмотру многотомных
собраний сочинений в библиотеке. С такой "обязаловкой" дети
справляются мигом - через Интернет. Но, бывает, найти по фрагменту
понравившегося текста его автора или весь текст значительно труднее.
Попробуйте найти, кто написал: "Смертью кончается все. И палубу
быстрого "Арго" ветер заносит песком. Радуйся, злобный Эйет...".
Найти не удалось. Может, его и нет в Сети? Так же можно
искать нормативный документ по его фрагменту.
Поиск неизвестно чего по неизвестно чему
Сочинять
самостоятельно жалобу на соседа Ивана Никифоровича - одно, "сдирать"
ее с образца - совершенно другое. Аналоги, прототипы, материалы надо
искать в Интернете. К их поиску надо относиться, как к поиску
материалов для школьных или студенческих рефератов - есть несколько
подходов.
Можно "в лоб": набрать запрос: "реферат" и получить
компост из сайтов, содержащих рефераты. Может быть, лучше задать
себе вопросы: "Зачем мне нужен реферат? Свой реферат написать, или
подойдет бывшая в употреблении "рубленая котлета"? Конкретная тема в
запросе даст несколько ссылок на заданную тему, выведет на файл,
который можно скачать для формального отчета. Нужно, конечно,
предусмотреть возможность доработки....
Еще путь составления документа и, соответственно, путь
поиска - конкретизировать тему, переформулировать ее. Да так, чтобы
понять тему с разных сторон. Так, исторический аспект поможет
разобраться с происхождением проблемы, сфера деятельности (от
торговли до медицины) поможет понять, зачем все ЭТО? Что потом
делать с результатами работы. Если реферат выполнялся как разовая
работа, это хорошо. Но если документ может быть использован много
раз, в разных инстанциях - это совсем другое дело. Тогда и поиск
информации в Сети будет совсем другим - структурированным. Придется
подчинить поиск информации и подготовку документа с задачами
развития своей индивидуальности. Не зря психологи говорят, что
решение мыслительной задачи представляет собой переструктурирование
ее условий. То есть, переосмыслить задачу - будет означать хорошую
подготовку поиска.
Кого мы спрашиваем?
Хорошо, когда на компьютере стоит метапоисковая
система. Но не всегда же мы может ее иметь. Да и не стоит, если есть
специализированные сайты, базы данных. Надо учитывать особенности
базы данных и поисковых систем, как рыболов применяет разные снасти
в горной речке и в тихом омуте. Поэтому лучше учесть, что системы
общего назначения сканируют веб-страницы в целом и требуют более
развернутых запросов.
Каталоги же, находящиеся на сайтах с краткими
аннотациями, составленными специалистами, могут хорошо сработать по
запросу в 1-2 слова. Надо только, чтобы эти слова запроса -
"ключевые слова" действительно стали золотым ключиком к волшебной
дверце. Как же их подобрать?
Синонимы-антонимы-омонимы
Не подходит одно слово, ключевым можно использовать его
синонимы. "Дорога" и "кремнистый путь" - имеют общий смысл. Это
синонимы. Помогут и антонимы, которые "задом наперед, совсем
наоборот", - как говорили персонажи из Страны чудес Алисе. Вспомним:
"Эх ты, горе горькое, Сладкое житье! Рваное пальтишко, Австрийское
ружье!" - Блок, "Двенадцать".
Если слово одно, а значений много, это омонимы.
Интересно, что даст запрос: "плата по разным таксам"? Во всяком
случае, запрос "масло", написанный по-английски, принесет и моторные
масла, и живопись маслом "в одном флаконе". Королева Страны Чудес
хотела отрубить голову садовнику "за то, что он принес кухарке
луковки тюльпанов вместо лука". С точки зрения задач поиска,
основания для его наказания были.
Объем понятия
- Ключевые слова должны "притащить", как бредень
поисковика, из Сети нужные ссылки, тексты. А какие нужны?
Релевантные - то есть, соответствующие запросу. Но, с другой
стороны, запрос должен соответствовать поисковой задаче. Значит,
надо учесть объем понятия, которое выражают ключевые слова. Сравните
"чайник" и "посуда", "утварь", "валюта" и "доллар", "стол" и
"мебель". Известная тяжба Ивана Ивановича с Иваном Никифоровичем
прекратилась бы, если бы последний не назвал вновь первого
"гусаком", а назвал бы "птицей".
- Можно менять формулировку запроса по отношению к
результатам поиска, с одной стороны. И можно менять ее по отношению
к смыслу решаемой задачи. Допрос бравого солдата Швейка жандармским
вахмистром мог бы иметь иной результат. Но жандармский вахмистр,
страстно желавший видеть в заблудившемся бравом солдате Швейке
русского шпиона, использовал на допросе понятия - ключевые слова
одного объема, а Швейк в своих простодушно-хитрых ответах - другого:
- "А хорошенькие девочки в России есть?".
- "Хорошенькие девочки во всем мире имеются, господин
вахмистр".
Сколько слов достаточно?
Для чего - для отражения искомого или для получения не
слишком большого (малого) количества ссылок? Это надо решить до
запроса. Обычно запрос в одно слово недостаточен. Смотря, конечно,
какое это слово. Насколько оно уникально. Например, юридический
термин. Если хочется узнать, откуда взялись "синерукие джамбли",
этого фрагмента текста в запросе вполне достаточно, чтобы точно
попасть в нужное место. То есть, дело не в количестве слов, а, если
можно так сказать, в их "ловкости", захвате - "ловят" или нет.
Отражают ли то, что надо найти? Плохо ловят, придется сузить объем
понятия. Это тем более полезно, что в процессе этого сужения самому
станет яснее, что же именно ищется.
Один специалист по боксу мечтал приобрести компьютер,
чтобы собрать из Интернета всю информацию о боксе. Подумайте сами,
что бы это значило. Как это сделать и какой в этом смысл.
Кстати, каталоги составляются тоже людьми, рубрикацию и
классификацию информации исполняют они же. То, что "Доктор Хелп"
может попасть в медицинский отдел, - не шутка из "№ 7-8 Магии ПК".
Подбирая ключевые слова и ориентируясь на определенный электронный
каталог, можно учесть возможные "разночтения" терминов.
Объем понятия и само его полезно уточнить в
соответствующих словарях. Раскрытие этимологии, истории
происхождения и использования слова поможет не только поиску, но
углубленному пониманию смысла поиска. Кем работал дядя Евгения
Онегина, спросили студента. Тот ответил: "Редактором. Он ведь самых
честных правил, а правит редактор". Трудно выяснить значение слова
"зюзя" из того же произведения А.С. Пушкина, хотя "был пьян как
зюзя" понимают обычно во втором классе средней школы и раньше.
Обычно же поисковый запрос состоит из 3-4 слов.
Логические операторы - синтаксис языка
Кроме грамматики естественного языка поиску помогает
грамматика языка машинного - логические операторы. Соединяя слова,
высказывания запроса специальными символами - логическими
операторами (И, ИЛИ, НЕ), можно помочь поисковой системе идти в
своем поисковом движении по правильному пути. Они напоминают знаки
дорожного движения и дорожную разметку - запрещают, разделяют
потоки, предписывают. Их надо знать и учитывать особенности у разных
поисковых систем, которые подскажет ссылка "Помощь".
Тезаурус поможет
Запрос можно организовать тезаурусом (по-гречески -
сокровище). В нем слова связаны смыслом, семантикой. Лингвистический
тезаурус содержит слова, отобранные анализом текстов. Статистический
тезаурус - на основе совместной встречаемости их в текстах. Тезаурус
помогает находить разные способы выражения одной и той же мысли.
Составляя тезаурус для поиска, надо предусмотреть обработку
синонимов, омонимов и морфологических вариаций ключевых слов.
Структура тезауруса выглядит как семантические срезы,
где для каждого термина строится таблица важных слов и слов-помех.
Помочь в их составлении могут программы-помощники, анализ словарного
состава текста, редакторы ассоциативных полей, система экспертной
оценки.
В целом, для поиска нужно:
1. Предельно ограничить область, круг поиска и точно
сформулировать название главного объекта поиска.
2. Определить форму представления информации - рисунок,
картинка, звуковой файл, архив с программой, таблица, текст
(электронная версия книги и статья), краткая аннотация и ссылки "где
купить" товары, сообщение о пользователях в чатах, в группах
новостей или форумах, биография, набор "имя-телефон-email" (в
справочник "белые страницы") и т.д.
3. Использовать несколько конкретных запросов вместо
одного широкого, "комплект". Указать несколько ключевых слов,
которые по отдельности или в сочетании друг с другом имеют отношение
к интересующей теме.
4. Подготовить несколько вариантов терминов ("рефераты"
и "курсовые работы", "работы курсовые".)
5. Использовать различные ассоциации (по сходству,
смежности, контрасту) при подборе формулировок запроса.
6. Использовать разные кодировки кириллицы, либо
обратиться к системе, отсылающей запросы, оптимизируя их для поиска
на русском языке.
7. Изучить и использовать логические операторы.
8. Употреблять термины, слова, выражения, сленг,
использующиеся авторами искомых документов.
9. Искать в каталогах и аннотациях более короткие и
общие ключевые фразы, а в полнотекстовых поисковых системах -
конкретные и развернутые.
10. Ознакомиться с особенностями сервера.
11. Изучить требования поисковой системы к написанию
слов.
12. Избегать "опечаток".
13. Разбивать длинные номера моделей, кодов на короткие
фрагменты.
14. Искать в найденных документах новые уточнения
терминов и связей между ними.
15. Пользоваться специализированными серверами.
16. Менять ключевые слова при плохом результате поиска
в первой десятке ссылок и запрашивать другими словами (длиннее и
поточнее, покороче) или у другой системы.
Итак, найдет тот, кто знает как искать, чем искать, а
главное - что, зачем он ищет. Правда, после этого появляется другой
вопрос, может быть, самый важный для получения конечного результата
не только поиска, но и всей работы в Сети: "Что делать с найденным?
Как понимать то, что принес поиск? Какие выводы сделать из "улова"?
Как избежать логических ошибок в понимании полученного материала?".
Но это предмет продолжения разговора о том, как читать результаты
поиска и что с ними делать.
А вообще-то, поиск в Интернете не сложнее охоты на
Снарка, которого искали "...с упованьем и крепкой дубиной,
понижением акций пугали при том и пленяли улыбкой невинной".
Главное, все-таки, не технические трюки. Главное - решить для себя:
"Куда ж нам плыть?" и помнить, что если кому-то везет больше, то это
лишь подтверждение, что самый крупный картофель растет у самого
глупого крестьянина.

Реклама в журнале