ISSN 1991-3087
Рейтинг@Mail.ru Rambler's Top100
Яндекс.Метрика

НА ГЛАВНУЮ

Узкоспециализированные технологии систематизации разрозненной информации

 

Лезов Александр Петрович,

аспирант кафедры вычислительной техники факультета информационных технологий Владимирского государственного университета,

аналитик ЗАО «КРОК Инкорпорейтед».

Научный руководитель – доктор технических наук, профессор

Ланцов Владимир Николаевич.

 

В этой статье будут рассмотрены узкоспециализированные технологии, не предназначенные для частного массового использования, а именно:

·         OLAP технологии и многомерные кубы.

·         Специализированные приложения систематизации информации.

·         Мессенджеры.

OLAP-технологии – это технологии многомерного анализа данных в результате которого собирается отчет, имеющий размерность N. Пример подобного отчета приведен на рисунке 1. OLAP-функциональность может быть реализована различными способами, начиная с простейших средств анализа данных в офисных приложениях и заканчивая распределенными аналитическими системами, основанными на серверных продуктах.

 

Рис. 1. Трехмерный набор агрегатных данных.

 

Системы поддержки принятия решений обычно обладают средствами предоставления пользователю агрегатных данных для различных выборок из исходного набора в удобном для восприятия и анализа виде. Как правило, такие агрегатные функции образуют многомерный и, следовательно, нереляционный набор данных, нередко называемый гиперкубом или метакубом, оси которого содержат параметры, а ячейки – зависящие от них агрегатные данные. Храниться такие данные могут и в реляционных таблицах, но в данном случае мы говорим о логической организации данных, а не о физической реализации их хранения. Вдоль каждой оси данные могут быть организованы в виде иерархии, представляющей различные уровни их детализации. Благодаря такой модели данных пользователи могут формулировать сложные запросы, генерировать отчеты, получать подмножества данных.

Прежде всего, OLAP технология позволяет однотипно структурировать агрегированную информацию, полученную из базы данных, и представлять ее в виде многомерных кубов. Переходя от одного представления к другому может возникнуть такая ситуация, что т.к. таких представлений очень много, то, чтобы добраться до необходимого пользователю, придется потратить значительное количество времени.

Тематические форумы, специализированные чаты и различные месенджеры по сути своей чем-то схожи с порталами, т.к. создают единую информационную среду между их участниками. Данные средства являются лишь инструментом для получения знаний, которые имеют другие пользователи. Данные средства по принципу действия можно сравнить с телефоном с телефонным справочником, которые использует пользователь, чтобы получить нужную ему информацию.

Таким образом, пользователь «вживую» получает необходимую ему информацию, а не на основе каких либо преобразований и методологий. В связи с этим далее данная группа рассматриваться не будет.

Последняя группа, рассматриваемая в даннай статье, - это различные специализированные приложения по систематизации разрозненной информации. На российском IT-рынке они пока еще мало известны. Представителями данного семейства программных продуктов являются:

·                    Auto-Categorizer 1.1 фирмы Applied Semantic.

·                    MetaTagger 3.0 фирмы Interwoven.

·                    Texis Categorizer 4.1 фирмы Thunderstone Software.

Все эти системы работают с несистематизированным контентом из различных источников, который вводится одномоментно или по мере его создания. Механизм систематизации анализирует содержимое и включает каждый его элемент в одну из категорий. После того, как контент полностью классифицирован, его можно передавать в самые разные корпоративные приложения, интегрированные с механизмом систематизации. Каждая из приведенных выше систем имеет свой собственный алгоритм систематизации.

Каждый из представленных выше продуктов имеет свой собственный уникальный алгоритм систематизации:

·                    Auto-Categorizer 1.1 - определяет категории;

·                    MetaTagger 3.0 - создает контент;

·                    Texis Categorizer 4.1 - категоризирует информацию;

т.е. все приложения являются специализированными и могут хорошо решать только какую-то одну узконаправленную задачу.

В завершении необходимо отметить следующее:

·                    Средств систематизации существует много.

·                    Каждое из них решает только одну узконаправленную задачу.

·                    Полученные данные могут быть интерпретированы неоднозначно.

·                    Из-за разнородности и многоформатности исходного контента не весь контент может быть систематизирован средствами одной технологии.

 

Литература.

 

1.                  Введение в OLAP: часть 1. Основы OLAP. – Код доступа: http://www.olap.ru/basic/OLAP_intro1.asp.

2.                  Википедия. – Код доступа: http://ru.wikipedia.org.

3.                  Джим Рапоза «Разложим данные по полочкам». – Код доступа: http://www.ssga.ru/erudites_info/info_technology/content/Raslogim_dannie.html.

4.                   Стандарты систематизации информации. Джим Рапоза. – Код доступа:  http://www.ssga.ru/erudites_info/info_technology/content/standart.html.

 

Поступила в редакцию 26.08.2008 г.

2006-2019 © Журнал научных публикаций аспирантов и докторантов.
Все материалы, размещенные на данном сайте, охраняются авторским правом. При использовании материалов сайта активная ссылка на первоисточник обязательна.