ISSN 1991-3087
Рейтинг@Mail.ru Rambler's Top100
Яндекс.Метрика

НА ГЛАВНУЮ

Структурная модель системы информационного поиска в объектно-реляционных базах данных.

 

Воронин Евгений Алексеевич,

доктор технических наук, профессор,

Бородин Олег Николаевич,

соискатель, ассистент кафедры Вычислительной техники и прикладной математики.

ФГОУ ВПО «Московский государственный агроинженерный университет имени В. П. Горячкина».

 

В государственных организациях Агропромышленного комплекса увеличиваются массивы текстовой информации, подлежащие хранению и систематизации. Накапливаемые данные включают разнообразную текстовую информацию, которая содержит электронные версии юридических документов, аналитические обзоры, а так же научно техническую информацию.

Проблемой поиска информации в структурированных массивах данных занимается междисциплинарная область науки, именуемая информационным поиском, базирующаяся на достижениях лингвистики и информатики. Под термином информационный поиск практически подразумевается выявление из множества информационных документов, подмножества, соответствующего определённой теме, удовлетворяющего определённому информационному запросу. Под информационным запросом понимается формализованное выражение информационной потребности пользователя информационной системы, сформулированное на естественном языке.

Выполнение задач информационного поиска происходит в результате работы программно-аппаратного комплекса, который образуется вследствие объединения совокупности программных и аппаратных элементов, находящихся в информационных отношениях между собой. Под информационно-поисковой системой в объектно-реляционных базах данных понимается совокупность программных элементов, взаимодействие между собой которых обеспечивает решение задач информационного поиска. Несмотря на то, что любая информационно-поисковая система является выделенной из окружающей среды СУБД, взаимодействие со средой осуществляется через входные параметры [1].

На  информационно поисковую систему в СУБД воздействуют следующие входные величины:

1.                  Контролируемые входные переменные - информационные документы, сформированные на естественном языке и подлежащие хранению в объектно-реляционной базе данных. Второй входящей переменной являются  информационные запросы - текстовые сообщения, содержащие информационные требования необходимые для поиска релевантных документов (соответствующих информационному запросу).

2. Переменные управления, формируемые путём административного воздействия включающего определение правил доступа к информации и выполнение конфигурационного управления, направленного на обеспечение параметров быстродействия и отказоустойчивости системы.

Основным выходящим параметром информационно-поисковой системы, является множество релевантных документов (соответствующих информационному запросу). Представление системы в качестве преобразователя информации без раскрытия её внутренней структуры с определением только входных и выходных параметров называется  кибернетической моделью (модель чёрного ящика).

Кибернетическая модель является начальным этапом описания системы. Для изучения внутреннего устройства системы необходимо разработать более детальное описание, включающее разработку модели состава системы, определяющей функции и численности основных элементов системы. Для отображения взаимосвязи и взаиморасположения основных элементов системы недостаточно разработать модель состава системы, так как необходимо показать организованность системы, а также устойчивость и упорядоченность элементов и связей, возникающих между элементами системы. В результате проведения операции декомпозиции системы возникает схема связей между элементами, называемая моделью структуры системы [1]. Структурная модель отражает, как правило, статистическое состояние системы (рис. 1).

Функциональная характеристика основных элементов системы:

1.                  Ввод / редактирование текстовой информации.

Элемент системы обрабатывающий входной поток текстовых документов путём преобразования содержания документа в массив слов с последующим лингвистическим анализом в результате взаимодействия с модулем лингвистической обработки текста.

 

Рис. 1.

Структурная модель системы информационного поиска в СУБД.

 

2.                  Модуль лингвистической обработки текста.

Этот элемент выполняет функции морфологического анализа  слов информационного документа. В результате его работы в индексные таблицы, построенные по атрибутам реляционных отношений вкдючаются слова русского языка, имеющие одну морфологическую основу. Морфологическая обработка текстового содержания информационного документа необходима, так как русский язык относиться к языкам флективного типа. В флективных языках существуют флексии – особые части слова, такие как окончания, выражающие грамматическое значение [3].

3. Компонент формирования информационного запроса.

Построитель запроса интегрирует лингвистически обработанное  текстовое содержание информационного запроса со структурой неименованного отношения, построенного в результате выполнения реляционных операций на основе отношений, находящихся в табличном пространстве объектно-реляционной базы данных [2]. Результатом работы компонента формирования информационного запроса является информационный контейнер, представляющий собой многомерный массив данных, отсортированный в порядке значения релевантности.

4. Компонент - источник данных содержит классификатор неименованных отношений, построенных на основе атрибутов, принадлежащих реляционным отношениям.

 В результате взаимодействия совокупности элементов, объединенных между собой информационными связями, возникает структурная модель информационно-поисковой системы, обладающая определёнными интегративными свойствами такими как:

1. Информационно-накопительное свойство - основное предназначение системы заключается в хранении и классификации текстовой информации.

2.  Информационно-преобразовательное свойство - система аналитически обрабатывает информацию при выполнении функций морфологической обработки текстового содержания информационного документа, представленного на естественном языке.

3. Информационно-поисковое свойство - в результате обработки информационного запроса в качестве выходного параметра система представляет пользователю коллекцию определённых текстовых документов.

Взаимодействие системных элементов в определённом порядке с отражением основных взаимосвязей между элементами определяет структуру системы, соответствующую кольцевому типу.

 

Литература.

 

1.                  Антонов А.В. Системный анализ. Учебник для вузов. / А.В. Антонов. - 2-е изд. стер. М.: Высш. шк., 2006.

2.                  Конноли Т,  Бегг К., Страчан А. Базы данных: проектирование, реализация, сопровождение. Теория и практика 2-е изд.: Пер. с анг.: Уч. пос.  – М.: Вильямс, 2000.

3.                  Леонтьева Н.Н. Автоматическое понимание текстов: системы, модели, ресурсы / Н.Н. Леонтьева. – Москва Академия, 2006.

 

Поступила в редакцию 3.03.2008 г.

2006-2019 © Журнал научных публикаций аспирантов и докторантов.
Все материалы, размещенные на данном сайте, охраняются авторским правом. При использовании материалов сайта активная ссылка на первоисточник обязательна.