Главная страница О программе Дистанционное обучение Контакты Карта сайта

Оглавление

Раздел 1

Раздел 2

Раздел 3

Раздел 4

Раздел 5

Раздел 6

Раздел 7

Раздел 8

Раздел 9

Раздел 10




 
Раздел 10.
ИЗУЧЕНИЕ ОСНОВ АРХИТЕКТУРЫ И ВОЗМОЖНОСТЕЙ СИСТЕМЫ RETRIEVALWARE.

    10.7. Глоссарий
    Антоним (Antonym)
    Cлово, значение которого противоположно значению данного; антонимы включаются в запрос в режиме поиска по Смыслу, когда уровень расширения запроса устанавливается равным 6 или выше.
    Библиотека (Library)
    Набор документов и полей, который Вы можете выбирать для проведения поиска; Вам могут быть доступны несколько библиотек, в которых можно производить поиск по отдельности или одновременно.
    Варианты написания (Inflected form)
    Различные способы написания слова, отражающие изменения в падеже, роде, числе, времени, лице, наклонении или залоге; варианты написания (например, "шёл" к "идти") будут включены в запрос в режиме поиска по Смыслу, когда уровень расширения запроса установлен равным 2 или выше.
    Вложенные инструкции (Nested statement)
    Способ структурирования логических запросов, который состоит в использовании круглых скобок для изменения порядка выполнения логических операций, c целью уточнения условий поиска.
    Грубое ранжирование (Coarse Grain Ranking)
    Действие при поиске, когда найденные документы ранжируются по степени соответствия запросу в зависимости от того, как много слов из запроса в них присутствует, сколько присутствует связанных с ними слов , и каково семантическое расстояние между ними. Относится к поиску по Смыслу и по Шаблону, но не к Логическому поиску.
    Данные (Database)
    Набор документов и структурированных полей, по которым Вы можете выполнять поиск. Документы могут быть объединены в одну или несколько библиотек, которые могут быть интегрированы с реляционной базой данных.
    Запрос (Query)
    Слова или фразы, которые Вы хотите найти, вместе с выбранными Вами параметрами поиска, такими как режим поиска или уровень расширения; запросы могут быть сохранены (в том числе со списком найденных документов) и даже отредактированы и/или заново выполнены.
    Запрос По Образцу (Query By Example, QBE)
    Специальный вид запроса, при котором Вы выбираете один определённый документ и 'просите', чтобы система нашла другие похожие на него.
    Значимость (Weight)
    Величина, которую Вы можете использовать в Экспертном режиме поиска, чтобы сообщить системе относительную важность слов запроса. Применяется в режимах поиска по Смыслу и по Шаблону, но не Логического поиска.
    Индекс (Index)
    Файл, который содержит информацию обо всех словах в библиотеке документов, включая информацию о положении слов в каждом документе; используется программой RetrievalWare при поиске и ранжировании документов.
    Итеративный поиск (Recurent search)
    Специальный запрос, который позволяет Вам выполнять последующие запросы к группе документов, возвращенных предыдущими.
    Контрастные слова (Contrasted words)
    Слова, которые не похожи по значению на данное слово, но не так сильно как антонимы; контрастные слова включаются в запрос в режиме поиска по Смыслу, когда уровень расширения слова установлен равным 9.
    Логический поиск (Boolean Mode)
    Вид поиска, при котором документы в библиотеке (или новые документы, в случае автоматической рубрикации) сопоставляются с точными условиями запроса. Найденные документы не ранжируются по степени соответствия запросу. Для управления сопоставлением могут быть использованы логические операторы (AND, OR, NOT, WITHIN, ADJ). Для указания расширения отдельных слов запроса по смыслу(!), шаблону (~) и подстановке ( * ,?, [ поисковое выражение] ) используются специальные операторы.
    Морфологический анализ (Morphological analyses)
    Удаление окончаний и изменения написания слова так, чтобы свести его к более простой словарной форме (например, "младенцев" к " младенец, " или "высочайший" к "высокий"); морфологические варианты слов запроса всегда включаются в любой поиск (включая Логический и точный поиск фразы)
    Неточное написание (Fuzzy spelling)
    (см. " Расширение По Шаблону ")
    Обработка идиом (Idiom processing)
    Операция, выполняемая RetrievalWare для того, чтобы выделить фразы, значения которых отличаются от значений входящих в них слов (например, "Соединенные Штаты" или "железная дорога")
    Поиск по полям (Fielded search)
    Специальный запрос, в котором Вы можете ограничивать область поиска, вводя условия на поиск в отдельных полях (автор, заголовок, дата и т.д.). Чтобы этот запрос мог выполняться, администратор системы должен определить и проиндексировать поля для каждой библиотеки и указать, какое поле будет статистическим, а какое - логическим фильтром.
    Поиск по Смыслу (Concept mode)
    Вид поиска, при котором искомые слова расширяются связанными с ними словами при помощи семантической сети; затем с ними сопоставляются документы в библиотеке (или новые документы, в случае автоматической рубрикации); каждый документ получает оценку, показывающую вероятную степень его соответствия Вашему запросу. С отдельными словами запроса могут использоваться специальные операторы для указания расширения по Шаблону (~), подстановкам (*,?, [ поисковое выражение]) или запрет на расширение (" ").
    Поиск по Шаблону (Pattern mode)
    Вид поиска, при котором слова запроса расширяются до слов с похожим написанием, затем с ними сопоставляются документы в библиотеке (или новые документы, в случае автоматической рубрикации); каждый документ получает оценку, показывающую вероятную степень его соответствия Вашему запросу. С отдельными словами запроса могут использоваться специальные операторы для указания расширения по по Смыслу (!), подстановкам (*,?, [искомое выражение]) или запрет на расширение (" ").
    Поиск группы слов (Grouped term search)
    Специальный запрос, в котором слова, связанные с общим для них понятием, сгруппированы вместе в круглых скобках, чтобы повысить точность поиска; слова внутри круглых скобок расширяются, ищутся и ранжируются по степени соответствия запросу как группа, а не как отдельные слова. Применяется к режимам поиска по Смыслу, по Шаблону, но не к Логическому поиску.
    Поле (Field)
    Заголовок документа или другая информация (например, название, автор, дата, тип документа и т.д.) , по которой можно делать запрос отдельно от тела документа.
    Полнота Поиска (Recall)
    Мера способности системы поиска текста возвращать все соответствующие запросу документы.
    Пороговая оценка (Document ranking threshold)
    Параметр автоматической рубрикации, определяющий минимальную степень соответствия запросу, которую должен получить новый документ для того, чтобы попасть в рубрику. Относится к режиму поиска по Смыслу и по Шаблону, но не к Логическому режиму поиска.
    Разбор текста (Tokenize)
    Действие, разбивающее строку символов на слова; может включать специальные средства для обработки дат, номеров телефонов, переносов, и т.п.
    Ранжирование (Ranking)
    Действие, выполняемое для того, чтобы разместить найденные документы в порядке их вероятной степени соответствия запросу. Применяется к режимам поиска по Смыслу и по Шаблону, но не Логического поиска.
    Расширение по Подстановкам (Wildcard expansion)
    Действие, которое добавляет слова, соответствующие указанному образцу в первоначальный список слов запроса; в режимах поиска по Смыслу и Логического поиска(но не поиска по Шаблону), Вы можете расширить подстановками отдельные слова запроса, заменяя часть букв, цифр и/или знаков препинания одним(или более) символом подстановки (*,?,[ искомый образец]). Обычно подставляется вместо неизвестных слов или частей слов.     Расширение по Шаблону (Pattern expansion)
    Действие, которое добавляет слова с похожим написанием к первоначальному списку слов запроса. В режиме поиска по Шаблону все слова запроса расширяются по Шаблону. В режимах Логического поиска и поиска по Смыслу, Вы можете расширять значение отдельных слов, вводя тильду (~) перед ними.
    Реляционная база данных (Relational database)
    Множество данных, объединенных в таблицы, с правилами, управляющими связями между столбцами, строками, и таблицами данных; RetrievalWare обеспечивает полнотекстовой поиск в реляционной базе данных как структурированных так и неструктурированных данных.
    Ретроспективный поиск (Retrospective search)
    Запрос, который выполнен в текущей библиотеке документов, в противоположность тому, который сохранен для автоматической рубрикации и используется для сопоставления с новыми документами.
    Рубрика (Real time search agent, Profile)
    Сохраненный запрос, в котором остаются ссылки на удовлетворяющие ему новые документы. Вы можете создавать так много рубрик, как Вы желаете, и удалять их, когда они больше не необходимы.
    Связанное слово (Related word)
    Слово, которое похоже по значению на данное слово, но не настолько, чтобы считаться синонимом; связанные слова будут включены в запрос по Смыслу, когда уровень расширения запроса установлен равным 8 или выше.
    Семантическое расстояние (Semantic distance)
    Мера того, как сильно два слова связаны друг с другом по Смыслу.
    Семантическая связь (Semantic link)
    Связь между словами или понятиями в семантической сети; используется RetrievalWare, чтобы найти слова и понятия, связанные со словами запроса.
    Семантическая сеть (Semantic network)
    Структура, которая связывает вместе слова и понятия; каждое понятие или смысл слова -это узел, который связан с другими узлами через связи слова (синоним, антоним, и т.д.)
    Синоним (Synonym)
    слово, имеющее то же самое значение что и данное; синонимы включаются в запрос по Смыслу, если уровень расширения запроса установлен равным 4 или выше.
    Словарь (Dictionary)
    Список значений, где каждое значение содержит синтаксическую информацию, и группу слов связанных с этим значением
    "Смешанный" поиск ("Mixed" search)
    Специальный запрос, в котором Вы можете использовать одновременно различные режимы поиска (по Смыслу, по Шаблону и Логический) внутри одного запроса, используя специальные операторы с отдельными словами запроса.
    Смысловое расширение (Concept expansion)
    Действие при запросе, которое добавляет в первоначальный список слов запроса связанные с ними по Смыслу слова; в режиме поиска по Смыслу, все слова запроса расширяются таким образцом; в режимах поиска по Шаблону и Логического поиска вы можете расширить по смыслу отдельные слова, вводя после них восклицательный знак ( ! )
    Совпадения (Hit)
    Слова или фразы, соответствующие запросу, найденные в возвращенном после поиска документе, программой RetrievalWare; пользователь может выбирать, как эти слова будут выделяться на фоне остального текста (цветом, курсивом, жирным шрифтом и т.п.)
    'Стоп' слова (Stop words)
    Список "шумовых" слов и идиом, которые не индексируются и автоматически удаляются из запросов до их обработки
    Точное ранжирование (Fine grain ranking)
    Действие при запросе, когда найденным документам назначается окончательная оценка, основанная на грубой оценке, с учетом близости по смыслу (как, близко по смыслу слова к друг другу) и плотности (сколько из общего количества слов - искомые). Относится к режимам поиска по Смыслу и по Шаблону, но не Логического поиска.
    Точный поиск фразы (Exact phrase search)
    Специальный запрос, в котором Вы можете искать определённые слова или фразы, которые, как Вы знаете, находятся в библиотеке; слова заключённые в кавычки (" ") не могут быть расширены по Смыслу или по Шаблону, и должны встречаться в точно таком же порядке и на том же расстоянии, как и в запросе; может использоваться в любых типах запросов (по Смыслу, по Шаблону, или Логическом).
    Точность поиска (Precision)
    Мера способности системы поиска текста возвращать только соответствующие запросу документы
    Уровень расширения запроса (Word expansion level)
    Параметр запроса, который определяет, связи какого типа используются при выборе слов из семантической сети при Смысловом расширении.
    Усечение (Stemming)
    Менее сложный, чем морфологический анализ способ приведения слов к их основам.
    Фильтр запроса (Query filter)
    Условие над полем или группой полей, которое используется, чтобы ограничить результаты поиска только теми документами, которые содержат определенную информацию в полях. Поля могут действовать или как статистические или как логические фильтры
    Экспертный режим поиска (Expert search)
    Тип запроса, который позволит Вам уточнить условия поиска и увеличить его точность, указав те расширения слов, которые необходимо добавить в запрос и присвоив отдельным словам запроса более высокие веса, чем другим. Для смыслового расширения Вы можете выбрать значения для расширения; для поиска по Шаблону и подстановок, Вы можете выбрать слова из базы данных, сопоставимые с запросом. Может использоваться при любом типе запросов (по Смыслу,по Шаблону, или Логическом)

Назад В начало Вперед
Дмитрий Шван © 2001-2002 г. Dmitriy Schwan
Hosted by uCoz