Раздел 3.
ВСЕМИРНАЯ ПАУТИНА И ПОИСК В СЕТИ.
3.6. Поиск информации в сети Интернет.
Интернет растет взрывообразно, особенно русскоязычный, поэтому вероятность найти в нем необходимую информацию резко возрастает. Но чтобы получить информацию, необходимо найти ее адрес. Как раз для этого и предназначены поисковые системы (ПС). Их много и именно они помогают всем, кто живет в Internet не утонуть в океане информации.
ПС представляют собой сетевые компьютеры с мощными каналами связи. Они ежесекундно обслуживают тысячи посетителей и требуют от владельцев значительных затрат на поддержку и обновление. Тем не менее, почти все они отвечают на вопросы посетителей абсолютно бескорыстно, а платят за это спонсоры и рекламодатели, которые в свою очередь не остаются в накладе.
У каждой поисковой системы, как и у любого другого сервера, есть адрес. Его лучше знать или иметь в своих закладках.
Ниже будут приведены примеры поисковых систем их адреса и основные правила работы с ними.
Поисковые системы условно можно разделить на несколько классов:
- каталоги (directories)
- подборки ссылок (bookmarks)
- машины WEB-поиска (search engines)
- базы данных адресов электронной почты (e-mail addresses database)
- поиск в архивах Gopher (Gopher archives)
- система поиска FTP файлов (FTP Search)
- системы поиска в Usenet News.
WWW-страницы являются самым масштабным и ценным, но далеко не единственным источником информации в Интернете. Существуют специальные системы по поиску статей в новостях Usenet, по поиску отдельных файлов, людей, организаций и т.д.
3.6.1. Каталоги ресурсов сети Интернет.
Это первый тип поисковых инструментов. Они представляют собой постоянно обновляющийся и пополняющийся иерархический (древовидный) каталог, на верхнем уровне которого собраны самые общие категории, такие как "бизнес", "наука", "искусство" и т.д., а элементы самого нижнего уровня представляют собой отдельные WWW-сервера с кратким описанием их содержимого. Гарантии того, что вы найдете все, что относится к данной теме, конечно, нет.
Упорядоченность содержимого в тематическом каталоге делает его не заменимым в тех случаях, когда вы не имеете никакой информации о цели своих поисков. Можно просто спускаться по "ступенькам". То есть двигаться от более общих категорий к более конкретным. Если вас интересует обувь для езды на велосипеде, то достаточно начать спускаться сверху в низ по иерархии англоязычной поисковой системы WWW.YAHOO.COM (Business and Economy - Companies - Sport - Cycling - Shoes) - и, в конце концов, вы отыщете то, что вам нужно, раздел, посвященный исключительно велосипедной обуви в нем может быть все что угодно: фирмы производители, адреса подборок ресурсов по заданной теме, статьи, ссылки на журналы и т.д. Еще одним преимуществом тематических каталогов является то, что пояснения к ссылкам делаются создателями сервера и отражают его содержание, а не вырезку из текста как в адресных индексах, то есть дает возможность точнее определить, на сколько соответствует содержание сервера цели вашего поиска.
Кроме этого некоторые тематические каталоги также позволяют искать по ключевым словам. Однако поиск этот происходит не в содержимом WWW-серверов, а в их кратком описании, хранящихся в каталоге. Иначе говоря, зная как называется велосипедная обувь по-английски, вы можете ввести это магическое слово или сочетание слов в специальном поле, нажать кнопку - и сервер сразу сообщит вам, что на эту тему имеется специальный раздел, и поможет перенестись в него одним щелчком мыши.
3.6.1.1. Русскоязычные тематические каталоги.
· Созвездие Интернет http://www.stars.ru/
наиболее представительный русскоязычный каталог, где можно получить, в том числе и адреса поисковых систем и тематических каталогов, ссылка на него удобно расположена на домашней странице нашего сервера
· Россия-он-лайн http://www.online.ru/rmain/
представляет интерес для русскоязычных пользователей. Каталог содержит довольно пестрое собрание ссылок на зарубежные источники плюс тематический обзор российских и русскоязычных ресурсов WWW, о некоторых из которых сложно найти информацию где-нибудь в другом месте.
3.6.1.2. Международные тематические каталоги.
· Yahoo http://www.yahoo.com/
наиболее популярный из тематических каталогов. Удобная система поиска предоставляет возможность искать по ключевым словам и иерархическому дереву разделов. Правила использования поиска по ключевым словам рассмотрена в разделе машины WEB-поиска ниже.
3.6.2. Подборки ссылок на информационные ресурсы сети Интернет.
Подборки ссылок представляют собой отсортированные по темам www-адреса. Они достаточно сильно отличаются друг от друга по наполнению, поэтому желательно походить по ним самостоятельно чтобы составить собственное мнение или найти подборку наиболее полно отвечающую вашим интересам.
3.6.2.1. Подборка ссылок "Сокровища Интернет" АО "Релком"
http://www.relcom.ru/Internet/Treasures/
Содержание
детская площадка, досуг, здоровье и медицина, информационные агентства и службы, краеведческий музей, литература, милые дамы, музыка, немного о прекрасном, образование, окружающий мир, осети интернет, периодическая печать, популляпные радиостанции и телепрограммы, прогноз погоды, религия, служба знакомств, спорт, туризм, экономика и финансы, юридическая информация/
3.6.2.2. Подборка ссылок "Прогулки по Интернет" компании "Deol"
http://cp1251.deol.ru/walk/
Содержание
Москва (транспорт, бизнес, законы, справки), культура, искусство, развлечения, авто, спорт, туризм, интернет, игры, женские страницы, пресса.
3.6.2.3. Тематическая подборка ссылок компании MARK-ITT
http://www.mark-itt.ru/index_r.html
Каталог большой, его с полной уверенностью можно заносить в свою папку "Избранное", просто масса интересных ресурсов.
3.6.2.4. Тематический каталог сервера "РОССИЯ-ОН-ЛАЙН"
http://www.online.ru/
Содержание
новости, газеты и журналы, бизнес и финансы, компьютеры и программы, наука и техника, законодательство, политика, хобби, дом и семья, справочники, магазины, развлечения и спорт, культура и искусство, путешествия, погода, другие разделы.
3.6.3. Поисковые системы и параметры поиска информации в сети.
Машинами WEB-поиска называются информационные системы, которые позволяют осуществлять поиск в WEB-пространстве.
К наиболее известным относятся Alta Vista, Excite, Hot Bot, InfoseeK, Lycos, WebCrawler. К русскоязычным относятся Яndex, Rambler, Апорт, Alta Vista.
Основное преимущество этих систем - большая скорость поиска и поиск по ключевым словам. Поисковая машина выдает списки и точные адреса тех документов, в которых это ключевое слово встречается. Это означает возможность найти специализированную информацию.
Поисковые машины работают по следующему принципу (понять его достаточно важно, для то чтобы оценить возможности поиска информации с их помощью).
2. Затем начинает работать индексирующая программа ("робот") или производится зеркальное дублирование всего информационного материала.
3. Потом производится собственно индексация, при которой фиксируются положения всех более или менее значащих слов, которые называются "ключевыми" (к "не ключевым" словам относятся наиболее часто употребляемые в речи союзы, предлоги, местоимения и т. д.; индексация бывает полнотекстовой, при которой обрабатывается весь текст, и неполнотекстовой, когда обрабатываются отдельные наиболее значащие части теста: заголовки, названия, ключевые поля, начальные слова разделов и т. д.).
4. Полученная база данных о ключевых словах добавляется к существующей.
5. Если был сделан зеркальный дубль (п. 2) он стирается;
6. Повторяются п.п. 2-5 для каждого адреса, полученного в п. 1.
К образовавшейся в результате индексирования базе данных можно обращаться посредством специального интерфейса. Кроме этого интерфейса, пользователь практически ничего не видит.
При одинаковой канонической структуре поисковые системы различаются по многим параметрам:
-- пространство индексируемых серверов например, Alta Vista все еще продолжает полнотекстовую обработку всей сети Интернет; эта амбициозная, но нереальная задача стоит также перед Hot Bot, однако уже стало ясно, что она практически не решаема (последнее связано еще и с тем, что информация быстро устаревает и необходимо производить регулярную переиндексацию всех серверов, а это требует огромных компьютерных мощностей и информационных потоков);
-- процедура создания запросов к поисковым системам здесь основным критерием служит возможность создавать сложные запросы типа: "бананы и/или апельсины морским транспортом из Марокко или Колумбии, но не Эквадора";
-- характер выдаваемой информации наиболее удобные поисковые системы выдают отсортированные списки и сопровождают найденные адреса небольшими фрагментами текста, содержащими искомые ключевые слова.
Кроме того, результаты поиска на некоторых машинах могут быть сохранены в виде закладок (т. е. поисковая машина готова для каждого завести на сервере соответствующий файл).
Таким образом, если вы знаете, какими ключевыми словами характеризуется нужная информация, смело пользуйтесь поисковыми машинами.
Но нужно учесть, что машине все равно что будет обозначать в конкретном тексте ваше ключевое слово.
Общие правила работы с поисковыми машинами.
Существуют общие правила работы с поисковыми машинами, которые мы рассмотрим на примере русскоязычной поисковой системы Rambler, но эти правила могут быль несколько модифицированы в зависимости от поисковой системы, поэтому желательно читать иногда раздел HELP на домашних страницах поисковых серверов.
Чтобы работать с поисковой системой RAMBLER, как и с любой другой, необходимо выйти на домашнюю страницу сервера, набрав в строке "адрес" адрес машины поиска в данном случае: http://www.rambler.ru/
На домашней странице вы увидите окно для ввода ключевых слов и кнопку рядом с ним (Найти), при нажатии которой машина осуществляет поиск.
У RAMBLER, как и у многих поисковых систем есть следующие возможности:
- простой и сложный поиск
- чувствительность к величине символов;
- возможность поиска по частям слов, целым словам или фразам (подобно "русское искусство");
- использование булевых (OR, AND, NOT) в комбинации ключевых слов;
- структурированные запросы;
Примечание: Существует такое понятие как "Язык поиска Информации" - особый язык запроса к поисковой системе, который значительно сокращает время поиска информации. Стандарта на него, к сожалению, нет. Каждая поисковая система имеет свой "Язык поиска". Обычно особенности каждой поисковой системы описаны прямо на странице поиска на ссылке "Помощь".
Принцип поиска Информации в Интернет достаточно прост.
1). Установите соединение с Интернет ("Мой компьютер" - папка "Удаленный доступ к сети" - запустить настроенное соединение с Интернет - нажать кнопку "Подключиться")
2). Запустите браузер Microsoft Internet Explorer 5.0 и в "Адресной строке" введите адрес одной из поисковых машин.
Например: http://www.rambler.ru
3). После загрузки страницы вы сможете искать информацию по каталогу, либо сами введете запрос на интересующую вас информацию в "Поле поиска".
|