Раздел 10.
ИЗУЧЕНИЕ ОСНОВ АРХИТЕКТУРЫ И ВОЗМОЖНОСТЕЙ СИСТЕМЫ RETRIEVALWARE.
10.4. Выполнение основных типов поиска.
10.4.1. Выбор библиотек.
Перед выполнением поиска Вам необходимо выбрать библиотеки, по которым будет производиться поиск. Для этого в закладке 'Данные' откройте список библиотек, нажав мышью на соответствующую пиктограмму. Выберите с помощью мыши одну или более библиотек из списка.
Теперь Вы готовы перейти в закладку 'Запроc' для ввода параметров поиска.
Обратите внимание: Если Вы не выбрали библиотеку, то поиск будет невозможен.
10.4.2. Выполнение основного запроса.
В закладке 'Запрос' введите строку запроса и любые дополнительные параметры поиска, которые Вы хотите использовать. Существуют три основных режима запроса: по Смыслу, по Шаблону и Логический. Режимы запроса по Смыслу и по Шаблону позволяют Вам вводить запросы на естественном языке (без специальных операторов) и пользоваться уникальными возможностями RetrievalWare, о которых говорилось ранее. Логические запросы должны вводиться при помощи стандартных логических операторов (AND, OR, NOT и т.п.). Этот режим поиска не использует всех возможностей RetrievalWare.
Время поиска постоянно меняется(это зависит от построения Вашего запроса, типа запроса и его параметров, от размера Вашей базы данных и от конфигурации Вашего компьютера), но в целом время поиска очень мало. Быстрый поиск возможен благодаря тому, что поисковая программа ищет в индексах, созданных по документам, находящимся в Вашей базе данных, вместо того, чтобы непосредственно искать в самих документах.
10.4.3. Темы и вопросы.
При вводе запросов помните, что RetrievalWare предназначен не для того, чтобы отвечать на вопросы, а для того, чтобы искать текст с заданной тематикой. Если Вы введете вопрос, Вы получите не ответ, а список документов, которые могли бы содержать ответы на введенный вопрос. Обычно лучше делать запрос по интересующей Вас теме вместо того, чтобы вводить вопрос или команду. Запросы по теме содержат меньшее количество малозначащих (или 'шумовых') слов, чем вопросы или команды. Следовательно, они проще для ввода и для обработки. Ниже приведено несколько примеров:
ОБЫЧНО: найти статьи о молекулярной физике ЛУЧШЕ: молекулярная физика.
ОБЫЧНО: как мне вырастить помидоры? ЛУЧШЕ: выращивание помидоров.
10.4.4. Ввод запроса по шагам.
Чтобы выполнить основной запрос, необходимо выполнить следующие шаги:
В закладке 'Запрос', выберите тип запроса (по Смыслу, по Шаблону или Логический).
Для ввода текста запроса установите курсор (мигающую вертикальную палочку) в область ввода запроса, находящуюся в верхней части окна.
Вы можете уже находиться в нужной области. Если это не так, то Вам нужно использовать мышь, чтобы переместить I - образный указатель на соответствующую область, и нажать кнопку мыши для установки туда курсора. Область ввода запроса находится рядом с кнопкой Поиск.
Введите Ваш запрос.
Какие буквы Вы используете (строчные или заглавные) - не имеет значения. Поисковой программой это не обрабатывается, так что самое простое - это напечатать все строчными буквами. Если Вы сделали ошибку во время ввода, то нажмите кнопку BACKSPACE и повторно наберите правильные символы.
Для самого простого поиска, выберите стиль поиска (искать сильно похожие, похожие или слабо похожие).
или
Для более точного поиска, нажмите на Больше параметров.
При выборе Больше параметров вводятся дополнительные параметры поиска и/или поля для рубрикации документов.
Установите параметры запроса и введите соответствующие поля для запроса, который Вы собираетесь выполнить (параметры запроса и поля будут подробно описаны в этой главе).
Чтобы выполнить запрос, нажмите на кнопку Поиск.
Когда поиск выполнен, то автоматически открывается закладка 'Результаты' в которой выведены результаты поиска.
Чтобы просмотреть документ, нажмите на его заголовок в верхней части закладки.
Текст документа выводится в нижней части закладки 'Результаты'. Вы можете также использовать кнопки ВПЕРЕД и НАЗАД (в конце списка документов) чтобы просмотреть весь список документов.
Список документов выводится по частям (по умолчанию количество одновременно просматриваемых документов - 25, но Вы можете изменить это число в закладке 'Установки'). Чтобы просмотреть следующую группу заголовков, переместитесь в нижнюю часть списка и выберите следующую группу, которую Вы хотите видеть.
Если ни одно из слов Вашего запроса в библиотеке не найдено, то в закладке 'Результаты' выводиться сообщение о том, что не было возвращено ни одного документа. Если это произошло, то просто введите другой запрос.
10.4.5. Использование режима поиска по смыслу.
В режиме поиска по Смыслу Вы вводите запрос на естественном языке. Слова запроса расширяются по семантической сети связанными с ними словами до уровня расширения, который Вы установили в закладке 'Запрос' (выбирая Стиль Поиска или устанавливая Уровень Расширения в Больше параметров).
Уровень расширения слова определяет то, по каким смысловым связям в семантической сети система будет производить поиск. Чем выше Вы устанавливаете уровень расширения, тем большей будет полнота поиска, но, с другой стороны, он будет более медленным (поскольку к запросу может быть добавлено гораздо больше слов). Вообще, мы рекомендуем для запроса в режиме поиска по Смыслу устанавливать уровень расширения не больше, чем "похожие понятия".
Используйте режим поиска по Смыслу, если в Вашем запросе есть специфические слова, если просматриваемая библиотека относительно небольшая, если Вы знакомы с содержанием библиотеки или если Вы вместе с полями используете текстовый запрос. При невысоком уровне расширения, запрос в режиме поиска по Смыслу должен дать быстрые и точные результаты.
При выполнении запросов в режиме поиска по Смыслу имейте в виду следующее:
Если Вы не уверены, какой уровень расширения установить, установите его небольшим ("близкие понятия" или ниже), так как запрос будет выполнен быстрее (если возвращено недостаточно документов Вы всегда можете увеличить уровень и заново выполнить запрос).
Число возвращаемых документов установите по крайней мере равным 100 (для больших библиотек 300-400), чтобы гарантировать хорошую полноту поиска.
Если Вы знакомы с содержанием Вашей библиотеки и хотите ограничить результаты, то используйте поля.
Если слова запроса имеют разные значения, то для получения наиболее подходящих результатов используйте закладку 'Эксперт'.
10.4.6. Специальные операторы.
В режиме поиска по Смыслу (отдельно или в комбинации) Вы можете использовать любые из следующих операторов. Слова с этими операторами не будут расширены по Смыслу. Для пояснения смотрите Главу 10.3.
- Расширение по Шаблону (~)
- Двойные кавычки (" ")
- Круглые скобки ()
- Расширение по Подстановкам (?, *, [искомое выражение])
10.4.7. Использование режима поиска по шаблону.
Так же, как и в режиме поиска по Смыслу, запросы в режиме поиска по Шаблону вводятся на естественном языке и могут быть сформулированы и выполнены очень быстро. Используйте режим поиска по Шаблону, если Вы не уверены в правильности написания какого-либо слова или если Вы просматриваете документы, имеющие ошибки распознавания отсканированного текста.
Выберите режим поиска по Шаблону и перед выполнением запроса в закладке 'Запрос' проверьте параметр 'Число расширений по шаблону'. Чем выше Вы устанавливаете это число, тем больше становится полнота поиска, и тем медленнее происходит поиск (так как в него будет включено намного больше расширений по шаблону). Мы рекомендуем устанавливать число расширений не менее 15.
При выполнении запросов в режиме поиска по Шаблону имейте в виду следующее:
Если Вы не уверены, какое необходимо установить число расширений по шаблону, чтобы не допустить ошибку, установите его равным 10 или меньше - так, чтобы запрос выполнялся быстрее (Если результат будет неудовлетворительным, Вы можете всегда увеличить число расширений и заново выполнить запрос).
Чтобы гарантировать хорошую полноту поиска установите 'число возвращаемых документов' по крайней мере равным 100 (300-400 для больших библиотек).
Если Вам известно содержание библиотеки и Вы хотите ограничить результаты поиска, то используйте поиск по полям.
10.4.8. Специальные операторы.
В режиме поиска по Шаблону (отдельно или в комбинации) Вы можете использовать любые из следующих операторов. Слова с этими операторами не будут расширены по шаблону. Для более подробной информации смотри главу 10.3.
- Расширение по Смыслу (!)
- Двойные кавычки (" ")
- Круглые скобки ( )
10.4.9. Использование логического режима поиска.
Логические запросы должны задаваться при помощи стандартных логических операторов, а не на естественном языке. Формулировка Логических запросов более трудная, потому что порядок слов и синтаксис запроса существенны для достижения желаемых результатов, особенно если Вы используете вложенные инструкции.
В закладке 'Запрос' выберите Логический режим поиска. Так как в Логическом режиме поиска не выполняется ни расширение слов, ни ранжирование по степени соответствия запросу, то единственные параметры запроса, которые Вы могли бы изменять - это Число возвращаемых документов и Порядок сортировки. Так как ранжирования нет, то по умолчанию документы сортируются в хронологическом порядке (берутся даты добавления документов в базу данных, а не даты их создания). Если Вы используете этот тип сортировки, то учтите, что документы, наиболее соответствующие запросу, могут находиться в любом месте списка возвращенных документов. По этой причине не устанавливайте число возвращаемых документов слишком низким, иначе Вы можете пропустить наиболее подходящие документы.
При вводе запроса используйте логические операторы (более подробная информация находится ниже). Оператор 'AND' задан по умолчанию, т.е., если не были введены никакие логические операторы, то между словами запроса ставится этот оператор. Запрос 'яблоки апельсины' даст те же самые результаты что и запрос 'яблоки AND апельсины'.
Идиомы в Логическом режиме поиска обрабатываются скорее как отдельные слова, чем как идиомы; например, "железная дорога" является идиомой, но в Логическом режиме поиска в документах будут искаться отдельные слова "железная" и "дорога". Для того, чтобы сделать запрос по идиоме - где соответствующие слова расположены по соседству в заданном порядке - идиому заключают в кавычки: "железная дорога".
В Логическом режиме поиска "стоп-слова", как и идиомы, обрабатываются по-другому. В Логическом режиме поиска большинство стоп-слов удаляется, однако, если стоп-слово - логический оператор (AND, OR, BUT, NOT, WITHIN), то оно не будет удалено. (Если Вам нужна дополнительная информация, то обратитесь к Вашему системному администратору).
При поиске имен собственных и слов или фраз, которые, как Вы знаете, находятся в базе данных, Логический режим поиска является наилучшим. Например, если Вы ищите только название компании, имя человека или заголовок отдельной публикации, Логический режим запроса быстро возвратит Вам наиболее точный список совпадений. Однако, если Вы хотите найти соответствующее имя собственное наряду с другими словами запроса, которые должны быть расширены, Вы могли бы использовать режим поиска по Смыслу или по Шаблону, заключая соответствующие слова в двойные кавычки, чтобы сделать их точной фразой.
10.4.10. Логические операторы.
При вводе запросов в Логическом режиме поиска используют логические операторы или эквивалентные им символы:
AND или &
OR или |
NOT или ^
WITHIN (эквивалентного символа нет)
ADJ (эквивалентного символа нет)
Оператор BUT аналогичен оператору AND и обычно используется вместе с оператором NOT ("это BUT NOT то", или "это AND NOT это").
AND/OR: В Логическом режиме поиска оператор AND используется по умолчанию, а оператор OR должен быть записан внутри запроса. Например, если Вы вводите запрос электронные коммуникации, поисковая программа будет искать документы, содержащие оба этих слова и будет возвращать только те документы, которые содержат оба этих слова. Если Вы вводите запрос электронные OR коммуникации, поисковая программа возвратит те документы, в которых есть хоть одно из этих слов.
NOT: Если по Вашему запросу могут выдаваться ответы, которые Вам не нужны, то используйте оператор NOT для устранения ненужных вариантов ответов. Например:
Билл Клинтон NOT Хиллари
Автоматический OR NOT ручной
NOT Интерфакс AND NOT Би-Би-Си AND NOT Рейтер
WITHIN: В логических запросах для увеличения точности поиска, Вы можете использовать оператор WITHIN, ограничивая расстояния между словами. Оператор WITHIN определяет, что некоторые слова должны появиться неболее, чем через заданное количество слов друг от друга. Например:
cеть AND защита WITHIN 1 найдет: 'сеть' и 'защита' по сходству
cеть AND защита WITHIN 2 с одним словом между ними
cеть AND защита WITHIN 3 с двумя словами между ними
Число после оператора WITHIN представляет собой число "прыжков", необходимых, чтобы добраться от одного слова до другого.
Ограничение расстояния обычно улучшает точность поиска, так как будет возвращено меньшее количество неподходящих документов (где присутствуют все слова поиска, но очень далеко друг от друга). (В настоящее время оператор WITHIN может использоваться только для слов, будущие версии позволят использовать его для предложений или параграфов).
Когда Вы используете WITHIN (особенно во вложенных инструкциях), будьте внимательны при использовании круглых скобок. Операторы WITHIN и AND должны быть на одном уровне вложенности. Например:
Правильно: сеть AND защита WITHIN 1
Правильно: (основная защита WITHIN 3) AND (электрическая схема WITHIN 3) WITHIN 40
Неправильно: (сеть AND защита) WITHIN 1
ADJ: этот оператор проверяет расстояние между словами так же, как и оператор WITHIN, но кроме того, он проверяет порядок этих слов. Например:
яйцо AND фаберже ADJ 5
По этому запросу проверяется, находятся ли эти слова на расстоянии 5 слов друг от друга, и стоит ли слово "фаберже" вторым.
ВЛОЖЕННЫЕ ИНСТРУКЦИИ: Заключенные в круглые скобки вложенные инструкции могут также улучшать точность запроса:
(Стенограмма AND заседание) AND ("законодательная палата" OR палата) AND (импичмент) WITHIN 50
Этот запрос возвращает документы, содержащие стенограммы заседаний Законодательной палаты Государственной Думы, связанные с объявлением импичмента.
10.4.11. Специальные операторы.
В Логическом режиме поиска (отдельно или в комбинации) Вы можете использовать любые из следующих операторов. Слова с этими операторами не будут обрабатываться как логические термины. Для более подробной информации смотри Главу 10.3.
- Расширение по Смыслу (!)
- Расширение по Шаблону (~)
- Круглые скобки ( )
- Подстановки (?, *, [искомое выражение])
10.4.12. Использование экспертного режима поиска.
Для более точного составления запросов Вы можете использовать Экспертный режим поиска вместе с любым из основных типов запросов (по Смыслу, по Шаблону или Логическим). Вы можете выбирать отдельные значения слов (для расширения по Смыслу), выбирать отдельные расширения слов (для расширения по Шаблону или по Подстановкам) и устанавливать значимость слов запроса.
Выбор значений.
Выбор значений может значительно увеличивать точность (и скорость выполнения) Вашего запроса по Смыслу, так как исключаются посторонние связи в семантической сети. Когда Вы не выбираете значения, то все значения всех слов запроса расширяются. Например, если Вы сделали запрос по слову "курс" (имея в виду стоимость ценных бумаг), но не выбрали только соответствующие значения, то найдутся слова, связанные со словом курс в контексте "курс корабля", "учебный курс", "образ действия" и т.п.
При выборе значений, если слово запроса имеет несколько значений, которые близко связаны, выберите их все. Словарные значения получены из нескольких различных источников, которые были объединены вместе, чтобы образовать семантическую сеть. Если Вы выберете только одно значение, Вы можете неосторожно устранить связанные слова из других источников, которые могли бы быть важны. Если слово запроса имеет только одно значение, которое удовлетворяет Вашему запросу, то выберите только его.
Выбор расширений по шаблону и по подстановкам.
Выбор отдельных расширений слов для расширений по Шаблону и по Подстановкам может значительно увеличить точность (и скорость выполнения) Вашего запроса, удаляя из него заведомо посторонние слова. Если Вы не выбираете расширения, то используются все расширения всех слов запроса.
Установка значимости слов.
Установка значимости на некоторые слова запроса сообщает поисковой программе, какие слова более важны, чем остальные. Документы, в которых встречаются слова, которым Вы установили более высокую значимость, ранжируются выше, хотя поисковая программа все равно будет искать все слова запроса и связанные с ними слова.
10.4.13. Выполнение экспертного поиска.
Чтобы выполнить Экспертный поиск, выберите основной тип запроса (по Смыслу, по Шаблону или Логический) и установите следующие параметры запроса:
В зависимости от условий Вашего запроса установите следующие уровни расширения:
- Для расширения по Смыслу установите Уровень расширения
- Для расширения по Шаблону установите Число расширений по Шаблону
- Для расширения по Подстановкам установите Число расширений по Подстановкам.
Чтобы гарантировать хорошую полноту поиска установите число возвращаемых документов по крайней мере 100 (300-400 для больших библиотек).
Введите Ваш запрос, затем нажмите на закладку 'Эксперт', которая выглядит приблизительно так:
|