Информационно-поисковые системы

Информационно-поисковые системы

ПС с огромным набором функций и способностей обычно входят в состав СУБД и называются информационно-поисковыми системами. Они также создаются и употребляются для действенного нахождения юзерами нужных им данных, в том числе в Вебе.

Терминологически "информационно-поисковая система" (англ. "information retrieval system", IRS) - представляет систему, созданную для поиска и Информационно-поисковые системы хранения инфы; пакет программного обеспечения, реализующий процессы сотворения, актуализации, хранения и поиска в информационных базах и банках данных.

Информационно-поисковая система трактуется и как система, обеспечивающая поиск и отбор нужных данных на базе информационно-поискового языка и соответственных правил поиска, а база данных - как совокупа средств и способов описания, хранения Информационно-поисковые системы и манипулирования данными, облегчающих сбор, скопление и обработку огромных информационных массивов. Организация разных БД отличается видом объектов данных и отношений меж ними.

Функционирование современных ИПС основано на 2-ух догадках:

1) документы, нужные юзеру, объединены наличием некого признака либо композиции признаков;
2) юзер способен указать этот признак.

Оба эти догадки на практике не Информационно-поисковые системы производятся, и можно гласить только о вероятности их выполнения. Потому, процесс поиска инфы обычно представляет собой последовательность шагов, приводящих при посредстве системы к некому результату, и позволяющих оценить его полноту. При всем этом поведение юзера, как организующее начало управления процессом поиска, мотивируется не только лишь информационной потребностью Информационно-поисковые системы, да и многообразием стратегий, технологий и средств, предоставляемых системой.

Юзер обычно не имеет исчерпающих познаний об информационном содержании ресурса, в каком проводит поиск. Оценить адекватность выражения запроса, как и полноту получаемого результата, он может, отыскав дополнительные сведения, либо так организовав процесс, чтоб часть поисковых результатов могла употребляться для доказательства либо отрицания Информационно-поисковые системы адекватности другой части. В то же время, для пользователей-профессионалов свойственна устойчивость направленного на определенную тематику профиля. Когда они являются "информационно-ориентированными", то им характерно желание и способность организовать информационное место препядствия. Это значит, что юзер создаёт по существу новый, "самостоятельный" проблемно-ориентированный, персонально обновляемый и пополняемый ИР Информационно-поисковые системы, включающий кроме подборок документов также и метаинформацию, к примеру, словари специальной терминологии, классификаторы предметных областей, описания ресурсов и т.д.

Особенность работы юзера в режиме "самообслуживания", в контексте задачки автоматизации совокупной деятельности, значит, что система должна представлять среду, обеспечивающую поддержку функций потребителя по обработке отысканной инфы, также обычно Информационно-поисковые системы относящихся к функциям информационного посредника (интерпретация запроса, его перевод на информационно-поисковый язык, выбор ИР, автоматический поиск и ручной отбор материалов), но также и такие "обеспечивающие" функции, как: структурирование информационной потребности, лексическая адаптация запроса, оценка, классификация и обработка поисковых результатов, причём на уровне как отдельного документа, так и информационных ресурсов в целом Информационно-поисковые системы. Технические способности, которыми располагает юзер, позволяют ему создавать информационный ресурс - сформировывать массивы, классифицировать и создавать наружные представления их содержания для собственного либо наружного использования.

ИПС делятся на: классические (ручные, механические, электромеханические) и автоматические (электрические).

Автоматические ИПС (АИПС), употребляют компьютерные программно-технические средства и технологии и предназначаются Информационно-поисковые системы для нахождения и выдачи юзерам инфы по данным аспектам. Определяющими для осознания способов автоматизации поиска являются два последующих фактора:

1) сравниваются не сами объекты, а описания - так именуемые "поисковые образы";
2) сам процесс является сложным (составным и не одноактным) и обычно реализуется последовательностью операций.

Данные в АИПС вводятся на базе специально разрабатываемых форматов Информационно-поисковые системы ввода. Все сведения об одном объекте в ИПС представляются в виде систематизированных данных, образующих одну строчку таблицы и именуются записью. При всем этом, если ИПС представляет электрический каталог библиотеки, то хоть какое библиографическое описание (БО) документа в нём - это одна запись, состоящая из полей, равных количеству частей БО. Совокупа записей Информационно-поисковые системы образует БД, которая, обычно, хранится в одном файле. Совокупа БД, объединенных одной СУБД, образует банк данных.

Так как АИПС инструмент, применяемый человеком при поиске (а не умственным автомат для поиска инфы - готовых решений задач основной деятельности), эффективность её использования находится в зависимости от того, как отлично Информационно-поисковые системы человек знает природу операционных объектов и характеристики инструмента, средством которого он работает с этими объектами.

Информационный поиск предполагает внедрение определённых стратегий, способов, устройств и средств. Поведение юзера, осуществляющего управление процессом поиска, определяется не только лишь информационной потребностью, да и инструментальным многообразием системы - технологиями и средствами, предоставляемыми системой.

Стратегия поиска Информационно-поисковые системы - общий план (концепция, предпочтение, установка) поведения системы либо юзера для выражения и ублажения информационной потребности юзера, обусловленный как нравом цели и видом поиска, так и системными "стратегическими" решениями - архитектурой БД, способами и средствами поиска в определенной АИПС. Выбор стратегии в общем случае является оптимизационной задачей. На практике в значимой Информационно-поисковые системы степени он определяется искусством заслуги компромисса меж практическими потребностями и способностями имеющихся средств.

Способ поиска - совокупа моделей и алгоритмов реализации отдельных технологических шагов: построения поискового вида запроса (ПОЗ), отбора документов (сравнение поисковых образов запросов и документов), расширения и реформулирования запроса, локализации и оценки выдачи.

Поисковый образ запроса - записанный на Информационно-поисковые системы ИПЯ текст, выражающий смысловое содержание информационного запроса и содержащий указания, нужные для более действенного воплощения информационного поиска.

Способы поиска, т.е. выделение подмножества документов, потенциально содержащих описание решения задачки отбора документов (ОД), являются отражением процесса нахождения решения и зависят от нрава задачки и предметной области.
Рассматривая поиск как итеративный процесс Информационно-поисковые системы, способы сокращения места перебора (просматриваемого подмножества) образуют по существу методологическую базу стратегии поиска и могут быть разбиты на последующие классы - способы поиска в:

1) одном пространстве (обычно, направленном на определенную тематику);
2) иерархически упорядоченном пространстве;
3) других местах;
4) динамическом (изменяющемся в процессе поиска) пространстве.

Реализуемый способ построения ПОЗа должен обеспечивать действенные методы построения Информационно-поисковые системы запроса для заслуги целей разного типа.

Механизмы поиска - совокупа реализованных в системе моделей и алгоритмов процесса формирования выдачи документов в ответ на запрос в поисковике.

Средства поиска, с одной стороны, - взаимозависимый комплекс информационно-поисковых языков (ИПЯ) и языков определения/управления данными, обеспечивающий структурные и семантические преобразования объектов обработки (документов Информационно-поисковые системы, словарей, совокупностей поисковых результатов), а с другой, - объекты пользовательского интерфейса, обеспечивающие управление последовательностью выбора операционных объектов определенной АИПС.

Поисковые технологии - унифицированные (оптимизированные в рамках определенной АИПС) последовательности действенного использования отдельных средств поиска в процессе взаимодействия юзера с системой для устойчивого получения конечного и промежных результатов.

Навигация как реализация процесса поиска Информационно-поисковые системы по запросу в избранной БД - целенаправленная, определяемая стратегией, последовательность использования способов, средств и технологий определенной АИПС для получения и оценки результата.

Средства навигации позволяют юзеру производить управление процессом поиска. Они предоставляются юзеру в видеинтерфейса, позволяющего организовать более либо наименее действенный процесс взаимодействия с БД. При всем этом "дружественность Информационно-поисковые системы" интерфейса характеризуется не только лишь эргономичностью и понятностью, да и вариантностью выбора операционных объектов.

Процесс поиска инфы представляет последовательность шагов, приводящих при посредстве системы к некому результату, и позволяющих оценить его полноту. Потому что юзер обычно не имеет исчерпающих познаний об информационном содержании ресурса, в каком проводит поиск, то Информационно-поисковые системы оценить адекватность выражения запроса, равно как и полноту получаемого результата, он может, основываясь только на наружных оценках либо на промежных результатах и обобщениях, сопоставляя их, к примеру, с прошлыми.

Процесс поиска можно представить в виде последующих главных компонент:

1) формулирование запроса на естественном языке, выбор поисковых системы и сервисов, формализация Информационно-поисковые системы запроса на соответственном ИПЯ;
2) проведение поиска в одной либо нескольких поисковых системах;
3) обзор приобретенных результатов (ссылок);
4) подготовительная обработка приобретенных результатов: просмотр содержания ссылок, извлечение и сохранение релевантных и пертинентных данных;
5) по мере надобности, модификация запроса и проведение повторного (уточняющего) поиска с следующей обработкой приобретенных результатов.

Для уменьшения объёма отобранных Информационно-поисковые системы материалов производят фильтрацию поисковых результатов по типу источников (веб-сайтов, порталов), теме и другим основаниям.

По применяемым поисковым технологиям ИС можно разбить на 4 категории:

1. Направленные на определенную тематику сборники;
2. Спец сборники (онлайновые справочники);
3. Поисковые системы (полнотекстовый поиск);
4. Средства метапоиска.

В Вебе ИПС располагается на одном либо нескольких серверах. В Информационно-поисковые системы ИПС собирается, индексируется и регится информация о документах, имеющихся в обслуживаемой системой группе веб-серверов. В документах индексируются все значащие слова либо только слова из заголовков.

Направленные на определенную тематику сборники предугадывают обработку документов и отнесение их к одной из нескольких категорий, список которых заблаговременно задан. Практически Информационно-поисковые системы это индексирование на базе систематизации. Индексирование может проводиться автоматом либо вручную при помощи профессионалов, разглядывающих пользующиеся популярностью веб-узлы и составляющих короткое описание документов-резюме (ключевики, инструкция, реферат).

Спец сборники либо справочники создаются по отдельным отраслям и темам, по новостям, по городкам, по адресам электрической почты и т. п.

Поисковые системы Информационно-поисковые системы (самое развитое средство поиска в Вебе) реализуют технологию полнотекстового поиска. Индексируются тексты, расположенные на опрашиваемых серверах. Индекс может содержать информацию о нескольких миллионах документов. К примеру, в индексе пользующейся популярностью ИПС "AltaVista" более 56 млн. URL-адресов.

При использовании средств метапоиска запрос осуществляется сразу несколькими поисковыми машинами. Итог поиска Информационно-поисковые системы соединяется воединыжды в общий, упорядоченный по степени релевантности перечень. Любая система обрабатывает только часть узлов сети, что позволяет расширить базу поиска. К схожему классу можно отнести и "индивидуальные программки поиска", дозволяющие сформировывать свои собственные инструменты метапоиска (к примеру, автоматом опрашивать нередко посещаемые узлы).

Базы информационных данных могут содержать фактически Информационно-поисковые системы любые виды инфы, в том числе в хоть какой композиции. Информационный поиск осуществляется как по имеющимся в полнотекстовых ЭИР терминам, так и по особым элементам, входящим в состав ИПЯ. Для формирования запросов употребляются особые информационно-поисковые языки.

ИПС снутри отысканной подборки обычно пробуют расположить документы в порядке их "релевантности Информационно-поисковые системы", другими словами близости к введенному юзером запросу. Критериев таковой близости много и выявление близких "по смыслу" к запросу документов не решает трудности получения инфы при отсутствии релевантного документа. Схожая ситуация довольно элементарна, в том числе и поэтому, что юзер часто отыскивает документ, который сам собирается написать. Необходимо подчеркнуть, что в Информационно-поисковые системы итоге проведенного поиска юзер может получить как релевантные, пертинентные, так и нерелевантные и непертинентные подмассивы данных.

ИПС практически являются системами информационного обеспечения и представляют собой базы и банки данных. В качестве объекта в их выступает индивидум, организация, ветвь, регион и т.п. Субъектом информационного обеспечения является специалист-информатик Информационно-поисковые системы, хоть какой потребитель инфы.

Организация поиска

Предлагается функцию поиска нужной инфы поделить на девять главных шагов:

· Определение области познаний;

· Выбор типа и источников данных;

· Сбор материалов нужных для заполнения информационной модели;

· Отбор более полезной инфы;

· Выбор способа обработки инфы (систематизация, кластеризация, регрессионный анализ и т.д.);

· Выбор метода поиска закономерностей Информационно-поисковые системы;

· Поиск закономерностей, формальных правил и структурных связей в собранной инфы;

· Творческая интерпретация приобретенных результатов;

· Интеграция извлеченных "познаний".

Для проведения поиска сначало на компьютере юзера загружается интерфейс работы с соответственной БД. Это может быть локальная либо удалённая БД. Сначало следует обусловиться с видом поиска (обычной, расширенный и т.д.). Потом с Информационно-поисковые системы набором предлагаемых для поиска полей. ИПС могут предложить для ввода одно либо несколько полей. В последнем случае это обычно поля: создателя, заглавия (наименования), временного периода, вида документа, ключевиков, рубрик и др. При формировании запроса фактически все системы позволяют использовать логические элементы "И", "Либо", "НЕТ".


informacionnij-byulleten-profsoyuza-5-43-2002-g-stranica-14.html
informacionnij-byulleten-profsoyuza-558-2004-g-stranica-5.html
informacionnij-byulleten-profsoyuza-651-2003-g.html