Реклама в журнале

Найдет в Сети тот...

Опубликовано в журнале "Компьютер Price" http://www.comprice.ru/

Юлий Симоненко <ergon2000@mail.ru>

-Будьте добры, скажите, пожалуйста, как мне отсюда выбраться?
-Многое зависит от того, куда тебе нужно добраться, - сказал Кот.
Льюис Кэррол. "Алиса в Стране Чудес"

Кто умеет искать в Сети?

Победители соревнований по поиску в Интернете и профессионалы - не в счет. Нет, не все находится в Сети, или не сразу, или не у всех. Как быть? Попавшиеся в публикациях разноплановые рекомендации можно свести воедино и "себе присвоить ум чужой". При этом следует помнить, что чем больше возможностей становится у машин-поисковиков, тем больше внимания надо уделить правильному "сотрудничеству" с ними.

Опечатки казнить нельзя...

В Интернете поисковых систем - как грибов после дождя. Технические ухищрения, нужные для поиска, есть в Сети по темам: "Организация поиска" и "Формулирование запроса", "Простой поиск из одного слова", "Простой поиск из множества слов" и т.д. Но о человеческих ошибках там - ни полслова. А ведь именно из-за примитивной ошибки в написании слова поиск потерпит полный провал. Например, нельзя делать орфографических ошибок в наборе поискового запроса. Но можно ли обойтись без опечаток? Увы, нет.

Чтение знакомого текста с листа сопровождается ошибками. Одна-две "опечатки" - обычная норма. Если же волнуется.... Конечно, сервер может подправить ошибку, если "поймет" ее. "Слепой" метод набора текста для поиска в Сети необходим для кириллицы и для латиницы. Да, еще, кодировки. Забыли переключиться на латиницу - будете злиться. Станьте внимательнее или используйте подходящую помощницу, программу-утилиту. Кто не забывал поменЯть регистр?

Запросы вводятся в нижнем регистре (иначе качество поиска снижается). Но имена собственные и названия нужно записывать с большой буквы.

Вот вам и первые рекомендации по учету "человеческого фактора". Простенькая, как кожура банана.

Что искать?
(рефераты-плагиаты, "сборные солянки", "тренировка ума", "кирпичи развития").
По чему искать?

По коду хорошо искать узкоспециальный термин, номер модели или ее код по каталогу, прайсу, по номеру документа. Но и в этом случае надо помнить, что поисковая машина может тебя неправильно "понять". Например, клавиатуру или какой-нибудь неведомый "винчестер". Ввели точнехонько его код FHgf 811801- Р9899у8, и все. Но как воспримет машина дефис или дробную черту? Лучше сделать запрос из двух половинок - FHgf 811801 и Р9899у8.

По нескольким признакам

За ключевыми словами прячутся признаки того, что надо найти. Нет уникального отличительного признака - придется использовать их комплекс, который и станет отличительным признаком. Не сложно обстоит дело с поиском телефона друга по телефонному справочнику в Сети, если помнишь его отчество и день рождения. Нет, надо делать "ход конем" и найти его по именам родственников, других друзей.

Поиск по фрагменту текста

Задал учитель поиск стихотворений Пушкина по фрагментам. Зачем? Чтобы побудить учеников к просмотру многотомных собраний сочинений в библиотеке. С такой "обязаловкой" дети справляются мигом - через Интернет. Но, бывает, найти по фрагменту понравившегося текста его автора или весь текст значительно труднее. Попробуйте найти, кто написал: "Смертью кончается все. И палубу быстрого "Арго" ветер заносит песком. Радуйся, злобный Эйет...".

Найти не удалось. Может, его и нет в Сети? Так же можно искать нормативный документ по его фрагменту.

Поиск неизвестно чего по неизвестно чему

Сочинять самостоятельно жалобу на соседа Ивана Никифоровича - одно, "сдирать" ее с образца - совершенно другое. Аналоги, прототипы, материалы надо искать в Интернете. К их поиску надо относиться, как к поиску материалов для школьных или студенческих рефератов - есть несколько подходов.

Можно "в лоб": набрать запрос: "реферат" и получить компост из сайтов, содержащих рефераты. Может быть, лучше задать себе вопросы: "Зачем мне нужен реферат? Свой реферат написать, или подойдет бывшая в употреблении "рубленая котлета"? Конкретная тема в запросе даст несколько ссылок на заданную тему, выведет на файл, который можно скачать для формального отчета. Нужно, конечно, предусмотреть возможность доработки....

Еще путь составления документа и, соответственно, путь поиска - конкретизировать тему, переформулировать ее. Да так, чтобы понять тему с разных сторон. Так, исторический аспект поможет разобраться с происхождением проблемы, сфера деятельности (от торговли до медицины) поможет понять, зачем все ЭТО? Что потом делать с результатами работы. Если реферат выполнялся как разовая работа, это хорошо. Но если документ может быть использован много раз, в разных инстанциях - это совсем другое дело. Тогда и поиск информации в Сети будет совсем другим - структурированным. Придется подчинить поиск информации и подготовку документа с задачами развития своей индивидуальности. Не зря психологи говорят, что решение мыслительной задачи представляет собой переструктурирование ее условий. То есть, переосмыслить задачу - будет означать хорошую подготовку поиска.

Кого мы спрашиваем?

Хорошо, когда на компьютере стоит метапоисковая система. Но не всегда же мы может ее иметь. Да и не стоит, если есть специализированные сайты, базы данных. Надо учитывать особенности базы данных и поисковых систем, как рыболов применяет разные снасти в горной речке и в тихом омуте. Поэтому лучше учесть, что системы общего назначения сканируют веб-страницы в целом и требуют более развернутых запросов.

Каталоги же, находящиеся на сайтах с краткими аннотациями, составленными специалистами, могут хорошо сработать по запросу в 1-2 слова. Надо только, чтобы эти слова запроса - "ключевые слова" действительно стали золотым ключиком к волшебной дверце. Как же их подобрать?

Синонимы-антонимы-омонимы

Не подходит одно слово, ключевым можно использовать его синонимы. "Дорога" и "кремнистый путь" - имеют общий смысл. Это синонимы. Помогут и антонимы, которые "задом наперед, совсем наоборот", - как говорили персонажи из Страны чудес Алисе. Вспомним: "Эх ты, горе горькое, Сладкое житье! Рваное пальтишко, Австрийское ружье!" - Блок, "Двенадцать".

Если слово одно, а значений много, это омонимы. Интересно, что даст запрос: "плата по разным таксам"? Во всяком случае, запрос "масло", написанный по-английски, принесет и моторные масла, и живопись маслом "в одном флаконе". Королева Страны Чудес хотела отрубить голову садовнику "за то, что он принес кухарке луковки тюльпанов вместо лука". С точки зрения задач поиска, основания для его наказания были.

Объем понятия

- Ключевые слова должны "притащить", как бредень поисковика, из Сети нужные ссылки, тексты. А какие нужны? Релевантные - то есть, соответствующие запросу. Но, с другой стороны, запрос должен соответствовать поисковой задаче. Значит, надо учесть объем понятия, которое выражают ключевые слова. Сравните "чайник" и "посуда", "утварь", "валюта" и "доллар", "стол" и "мебель". Известная тяжба Ивана Ивановича с Иваном Никифоровичем прекратилась бы, если бы последний не назвал вновь первого "гусаком", а назвал бы "птицей".

- Можно менять формулировку запроса по отношению к результатам поиска, с одной стороны. И можно менять ее по отношению к смыслу решаемой задачи. Допрос бравого солдата Швейка жандармским вахмистром мог бы иметь иной результат. Но жандармский вахмистр, страстно желавший видеть в заблудившемся бравом солдате Швейке русского шпиона, использовал на допросе понятия - ключевые слова одного объема, а Швейк в своих простодушно-хитрых ответах - другого:

- "А хорошенькие девочки в России есть?".

- "Хорошенькие девочки во всем мире имеются, господин вахмистр".

Сколько слов достаточно?

Для чего - для отражения искомого или для получения не слишком большого (малого) количества ссылок? Это надо решить до запроса. Обычно запрос в одно слово недостаточен. Смотря, конечно, какое это слово. Насколько оно уникально. Например, юридический термин. Если хочется узнать, откуда взялись "синерукие джамбли", этого фрагмента текста в запросе вполне достаточно, чтобы точно попасть в нужное место. То есть, дело не в количестве слов, а, если можно так сказать, в их "ловкости", захвате - "ловят" или нет. Отражают ли то, что надо найти? Плохо ловят, придется сузить объем понятия. Это тем более полезно, что в процессе этого сужения самому станет яснее, что же именно ищется.

Один специалист по боксу мечтал приобрести компьютер, чтобы собрать из Интернета всю информацию о боксе. Подумайте сами, что бы это значило. Как это сделать и какой в этом смысл.

Кстати, каталоги составляются тоже людьми, рубрикацию и классификацию информации исполняют они же. То, что "Доктор Хелп" может попасть в медицинский отдел, - не шутка из "№ 7-8 Магии ПК". Подбирая ключевые слова и ориентируясь на определенный электронный каталог, можно учесть возможные "разночтения" терминов.

Объем понятия и само его полезно уточнить в соответствующих словарях. Раскрытие этимологии, истории происхождения и использования слова поможет не только поиску, но углубленному пониманию смысла поиска. Кем работал дядя Евгения Онегина, спросили студента. Тот ответил: "Редактором. Он ведь самых честных правил, а правит редактор". Трудно выяснить значение слова "зюзя" из того же произведения А.С. Пушкина, хотя "был пьян как зюзя" понимают обычно во втором классе средней школы и раньше. Обычно же поисковый запрос состоит из 3-4 слов.

Логические операторы - синтаксис языка

Кроме грамматики естественного языка поиску помогает грамматика языка машинного - логические операторы. Соединяя слова, высказывания запроса специальными символами - логическими операторами (И, ИЛИ, НЕ), можно помочь поисковой системе идти в своем поисковом движении по правильному пути. Они напоминают знаки дорожного движения и дорожную разметку - запрещают, разделяют потоки, предписывают. Их надо знать и учитывать особенности у разных поисковых систем, которые подскажет ссылка "Помощь".

Тезаурус поможет

Запрос можно организовать тезаурусом (по-гречески - сокровище). В нем слова связаны смыслом, семантикой. Лингвистический тезаурус содержит слова, отобранные анализом текстов. Статистический тезаурус - на основе совместной встречаемости их в текстах. Тезаурус помогает находить разные способы выражения одной и той же мысли. Составляя тезаурус для поиска, надо предусмотреть обработку синонимов, омонимов и морфологических вариаций ключевых слов.

Структура тезауруса выглядит как семантические срезы, где для каждого термина строится таблица важных слов и слов-помех. Помочь в их составлении могут программы-помощники, анализ словарного состава текста, редакторы ассоциативных полей, система экспертной оценки.

В целом, для поиска нужно:

1. Предельно ограничить область, круг поиска и точно сформулировать название главного объекта поиска.

2. Определить форму представления информации - рисунок, картинка, звуковой файл, архив с программой, таблица, текст (электронная версия книги и статья), краткая аннотация и ссылки "где купить" товары, сообщение о пользователях в чатах, в группах новостей или форумах, биография, набор "имя-телефон-email" (в справочник "белые страницы") и т.д.

3. Использовать несколько конкретных запросов вместо одного широкого, "комплект". Указать несколько ключевых слов, которые по отдельности или в сочетании друг с другом имеют отношение к интересующей теме.

4. Подготовить несколько вариантов терминов ("рефераты" и "курсовые работы", "работы курсовые".)

5. Использовать различные ассоциации (по сходству, смежности, контрасту) при подборе формулировок запроса.

6. Использовать разные кодировки кириллицы, либо обратиться к системе, отсылающей запросы, оптимизируя их для поиска на русском языке.

7. Изучить и использовать логические операторы.

8. Употреблять термины, слова, выражения, сленг, использующиеся авторами искомых документов.

9. Искать в каталогах и аннотациях более короткие и общие ключевые фразы, а в полнотекстовых поисковых системах - конкретные и развернутые.

10. Ознакомиться с особенностями сервера.

11. Изучить требования поисковой системы к написанию слов.

12. Избегать "опечаток".

13. Разбивать длинные номера моделей, кодов на короткие фрагменты.

14. Искать в найденных документах новые уточнения терминов и связей между ними.

15. Пользоваться специализированными серверами.

16. Менять ключевые слова при плохом результате поиска в первой десятке ссылок и запрашивать другими словами (длиннее и поточнее, покороче) или у другой системы.

Итак, найдет тот, кто знает как искать, чем искать, а главное - что, зачем он ищет. Правда, после этого появляется другой вопрос, может быть, самый важный для получения конечного результата не только поиска, но и всей работы в Сети: "Что делать с найденным? Как понимать то, что принес поиск? Какие выводы сделать из "улова"? Как избежать логических ошибок в понимании полученного материала?". Но это предмет продолжения разговора о том, как читать результаты поиска и что с ними делать.

А вообще-то, поиск в Интернете не сложнее охоты на Снарка, которого искали "...с упованьем и крепкой дубиной, понижением акций пугали при том и пленяли улыбкой невинной". Главное, все-таки, не технические трюки. Главное - решить для себя: "Куда ж нам плыть?" и помнить, что если кому-то везет больше, то это лишь подтверждение, что самый крупный картофель растет у самого глупого крестьянина.


Играйте и выигрывайте! Интернет лотерея iLoto.net
Реклама в журнале

Copyright © <LMTH>. Все материалы являются собственностью их авторов.
При перепечатывании ссылка на http://www.magaz.org/ как на источник
информации обязательна. Правила использования материалов журнала