Технологии систематизиации
разрозненной информации массового использования
Лезов
Александр Петрович,
аспирант кафедры вычислительной техники
факультета информационных технологий Владимирского государственного
университета,
аналитик ЗАО «КРОК Инкорпорейтед».
Научный руководитель – доктор
технических наук, профессор
Ланцов
Владимир Николаевич.
Информационные технологии могут составить основу
конкурентной борьбы компании при условии их рационального и своевременного
использования. Каждая преуспевающая компания имеет целый ряд программных
продуктов, позволяющих эффективно решать ее задачи, – от самых обычных файловых
менеджеров, которые распространяются бесплатно, и до корпоративных
информационных систем стоимостью в сотни тысяч и миллионы долларов. Информация
в электронном виде, которая скапливается в этих системах, часто становится десистематизированной и противоречивой. Соответственно пользователь
не сможет найти в подобном хранилище нужные данные и решить поставленные перед
ним задачи. Чаще всего в подобных ситуациях проблема может быть решена посредством
обычного текстового поиска. В этом случае пользователю предоставляется весь
перечень найденной информации, соответствующей критериям поиска, но далее ему самому
приходится ее самостоятельно систематизировать и уточнять – подходит ли она ему
или нет.
Существенно
же помочь в поиске и систематизации необходимого контента способны специализированные механизмы
систематизации, работающие с разнообразными корпоративными приложениями. Это
различные средства информационных технологий, которые можно разбить на
следующие группы:
·
Технологии массового использования:
§
технологии информационных порталов;
§
глобальные поисковые системы.
·
Узкоспециализированные технологии:
§
OLAP-технологии
и многомерные кубы;
§
специализированные программные механизмы
систематизации;
§
тематические форумы, чаты, различные месенджеры.
В
этой статье будет рассмотрена группа технологий массового использования.
Технологии информационных порталов
позволяют обеспечить развитие единого информационного пространства,
организовать использование информационных ресурсов и управление информационными
потоками компании. Портальная технология позволяет рационально подойти к
решению таких задач как:
1.
Создание единого информационного
пространства организации с полной компьютеризацией всех
административно-хозяйственных и производственных служб, подключение к
региональным, федеральным и международным сетям.
2.
Разработка интегрированных
автоматизированных систем управления структурными подразделениями с
возможностью планирования, документирования и контроля производственного
процесса, по средствам предоставлением справочной информации по всем аспектам производственной
и административной деятельности.
3.
Разработка специализированных и
универсальных учебно-методических комплексов на базе новых информационных
технологий, предоставляющих возможности самообучения и самоконтроля новых
сотрудников.
4.
Создание эффективной методики оценки
знаний сотрудников и качества их работы.
Прежде
всего, портальная технология создает единое
информационное пространство, но то, на сколько
излагаемая на портале информация систематизирована, однородна и однозначна к
пониманию - целиком и полностью зависит от множества сторонних факторов:
1.
Человеческий фактор.
2.
Используемые базы данных.
3.
Используемые системы формирования
отчетов.
4.
Разноформатность
представляемого материала: PDF,
MS
Word
и Excel,
текстовые документы, ссылки на web-страницы.
Таким
образом на систематизацию представляемых данных по
портальной технологии влияют следующие факторы:
§
Тип БД.
§
Тип отчетов.
§
Разнородность портального
контента.
Глобальные поисковые системы,
такие как GOOGLE, YAHOO!, ЯНДЕКС, РАМБЛЕР, предназначены,
прежде всего, для того чтобы быстро сформировать точный и полный ответ,
адекватный запросу пользователя. В глобальных базах (вследствие их всеобъемлющего
характера) с очень большой вероятностью может быть найден какой-нибудь
подходящий ответ практически на большинство запросов пользователей даже без
привлечения для этих целей серьезного методического и систематизирующего
аппарата.
Несмотря
на широкую популярность подобных систем, при реализации информационно-поисковых
процедур на больших объемах информации наряду с полезной передается много
лишней, «шумовой» информации. Задача собственно выбора подходящих сведений
среди отобранной по запросу информации возлагается на пользователя. К тому же
полученная информация выдается не в систематизированном виде, а ссылками на
какие-то ресурсы, где найден фрагмент, удовлетворяющий критериям поиска.
Таким
образом, систематизация полученной по результатам поиска информации целиком и
полностью относится к компетенции пользователя и в большинстве случаев в связи
с огромным количеством ссылок приводит к путанице и поверхностному пониманию
интересующего вопроса.
В
качестве итога необходимо выделить следующее:
-
Технологии порталов и глобальных
поисковых систем для конечных пользователей являются бесплатными,
общедоступными и как следствие - наиболее массово используемыми.
-
Представляемая по данным технологиям информация
имеет неоднозначную интерпретацию и не является полностью систематизированной,
но при этом находится в рамках одной предметной области.
-
Получаемая информация является избыточной
с точки зрения объемов предоставления для человеческого восприятия и анализа и
недостаточной с точки зрения полноты и системности представления.
Литература.
1.
Википедия.
- Код доступа: http://ru.wikipedia.org.
2.
Задачи поиска. - Код доступа: http://www.asknet.ru/IS/Technology/searchtask.htm.
3.
Образовательные порталы как средство
систематизации и структурирования информации. - Код доступа: http://www.bankrabot.com/work/work_8695.html.
Поступила в редакцию
26.08.2008 г.