СИСТЕМАТИЗАЦИЯ И СТРУКТУРИРОВАНИЕ WEB-ПОРТАЛА
Алмаз Я.А.
В настоящее время порталы становятся неотъемлемой частью комплексных информационных систем. Интеграция портала с системами электронного документооборота, управленческого анализа и аналитическим ПО – это дополнительные возможности, соответствующие информационные системы, где портал играет роль «своеобразного фронтального экрана». На нем пользователь может видеть всю требуемую ему информацию
Портал - это площадка с большим количеством разнообразных сервисов, совмещающий разнонаправленные группы сервисов, а, возможно и направлений деятельности, объединенные единой концепцией.
Смысл разработки web-портала ИГХ СО РАН заключается в оперативности и объеме предоставляемой на нем гео-информации. Web-портал представляет из себя средство сбора, анализа и доведение до посетителей информации с целью решения круга вполне конкретных задач. Наличие определенных информационных целей подразумевает наличие общедоступного гео-информационного пространства, возможность общения пользователей и обмена мнениями по данной тематики. Для этого на информационном портале публикуется информация на конкретную тематику в виде новостей, карт, полевых дневников, статей, метаданных и т.п.
Вся информация, находящаяся на web-портале должна быть систематизирована. Пользователь, посетивший портал, должен без всяких затруднений найти необходимые данные. Для этого необходимо создать разделы, помещая информацию четко в свой раздел. Например, можно создать следующие разделы – «О нас», «Общие разделы», «Раздел геологии», «Аналитический раздел», «Карты», «ДДЗ», «Экспедиции», «Полевые работы», «Каталог метаданных», «Публикации», «Техподдержка», «Обратная связь» и т.д.
Кроме анализа отдельных страниц сайта ИГХ СО РАН для достижения успеха сайта критически важно представлять, какой вклад вносят эти страницы в эффективность всего сайта, а также навигация по сайту в целом.
Принимая решение о том, какая система навигации будет лучше всего работать на web-сайте, руководствовались важнейшим принципом – простота.
Одним из лучших подходов к анализу эффективности системы навигации явилось вычерчивание ее на листе бумаги. Изучая свой рисунок, можно обнаружить такие недочеты в системе навигации, которые при ином подходе можно и не заметить.
Две другие ключевые задачи заключались в организации на портале оптимальных связей между страницами и создании средств навигации, предоставляемых посетителям. Процедуры перемещения посетителей из одного места портала в другое ни в коем случае не должны быть испытанием для их терпения. Наоборот, такой переход должен вознаграждать посетителей ценной информацией и вызывать у них ощущения легкости и непринужденности, что побудит их задержаться на портале подольше - а не уходить из портала с чувством разочарования и досады.
Рисуя макет web-страницы на бумаге, были продуманы, какие являются важнейшими и как они связаны с главной страницей. Есть ли на главной странице ссылки на все основные разделы портала?
На следующем этапе были проанализированы элементы системы навигации портала и получено подтверждение, что эта система позволяет пользователям переходить в нужное им место портала.
Что касается оборванных ссылок на портале, то каждая страница, как малозначительная, так и критически важная, имеет ссылку на другие важные страницы портала. Ключевые ссылки ведут на домашнюю страницу и главную страницу того раздела, который в данный момент просматривает пользователь.
Обдумывая настройки портала, пришлось в первую очередь озаботиться двумя проблемами: логической структурой и физической структурой портала. Под логической структурой подразумевается структура портала, нарисованная на бумаге. Глядя на нарисованный на бумаге макет можно понять где находятся разделы портала, как они организованы, из каких страниц состоит каждый раздел, как эти страницы связаны. С другой стороны, физическая структура описывает структуру файлов, составляющих портал, включая их местоположение в файловой системе web-сервера.
Разработка web-портала во многом напоминает разработку программного обеспечения. Как при разработке сайтов, так и при разработке программ, необходимо создать некую основную структуру продукта - нечто такое, с чем далее смогут работать пользователи. И в обоих случаях пользователям должен предоставляться понятный и приятный интерфейс.
Конструкция физической структуры портала зависит от сложности задач, стоящих перед web-дизайнером и программистом, которые разрабатывают и поддерживают портал. Так как размеры портала велики, файлы страниц портала будут помещены в соответствующие каталоги. Путем создания такой физической структуры разделения портала отпадает необходимость помещения на верхний уровень всех файлов, содержащихся на портале. Этот способ поможет исключить путаницу и разделит файлы по разным областям.
Систематизация информации будет иметь древовидную структуру. Данная структура позволит быстро и без всяких затруднений осуществлять поиск информации по порталу.
С учетом вышесказанного, разрабатываемая структура будет на основе блочно-модульного принципа.
Базовой единицей обмена информацией в системе Web-порталов является структурированный (размеченный) текстовый документ. В частности, структурированными текстовыми документами являются HTML-файлы – документы, например, метаописания научно-информационных ресурсов. Обработка структурированной текстовой информации занимает значительный объем работы порталов. Это и организация поисковых сервисов по электронным библиотекам и метаописаниям, перевод информации в «читабельный» вид, необходимый для интерфейсов порталов, и многое другое.
Основными информационными ресурсами и БД регионального (учрежденческого) информационного портала ИГХ СО РАН являются:
Каталог информационных ресурсов содержит метаописания геоданных информационных ресурсов, совместимых с метаописаниями общероссийских (и региональных) научных порталов. Для работы с ним должны быть реализованы следующие службы: поиск информации (в региональном каталоге, в федеральном каталоге, в собственном каталоге); различные виды сортировки информации; публикация и редактирование метаописаний; автоматический обмен данными (репликация) с региональными порталами.
База данных ресурсов содержит собственно региональные (учрежденческие) научные ресурсы (в виде реляционной и файловой БД), причем наличие такой базы не исключает возможности хранения ресурсов на других серверах, но хранение ресурса в специализированной БД дает такие преимущества как облегчение поиска, надежности, скорости доступа. Все ресурсы БД описаны в каталоге ресурсов. Для работы с такой БД должны быть реализованы следующие службы: поиск информации в региональной, федеральных БД (и собственной учрежденческой БД); различные виды сортировки информации; публикации и редактирование ресурсов; автоматический обмен данными (репликация) с региональными порталами.
Типы ресурсов соотносятся к видам хранения, а именно: текстовые ресурсы; графические иллюстративные материалы; аудиоинформация; видеоинформация; мультимедиа. Здесь следует отметить тенденцию увеличения относительного объема образовательной мультимедиа информации, определяет актуальность развертывания специализированных мультимедиа хранилищ и медиа-серверов.
Типы информации, включаемые в портал: текстовые ресурсы (документы); мedia ресурсы (image, video, applet, flash – все, что есть в документе); web-ресурсы (ссылки на др. документы); таблицы, отчеты, презентации; структурированные данные (базы данных, XML - RSS) на сервере портала; структурированные и неструктурированные данные, публикуемые на web-сайтах организации (участников создания портала по различным тематическим направлениям).
Базы данных научных учреждений в самом общем виде включают в свой состав следующие БД: база данных научных ресурсов; база данных учреждений; база данных нормативных документов; база данных персоналий; база данных «новости науки»; база данных пользователей портала (в том числе отображение регистраций пользователей в отношении установления их прав).
Ресурсы взаимодействия и совместной работы предназначены для портальной поддержки научного процесса и административной деятельности, что строится на соответствующих ресурсах взаимодействия и совместной работы, которые включают различные виды коммуникативных серверов: почтовый сервер; форумы; сервер видеоконференций; серверы рабочих групп; прочие.
Только вышеперечисленные признаки, а также требования по отношению к информационным ресурсам и БД Web-портала дают основания причислить рассматриваемую ИС к числу полноценных региональных (учрежденческих) информационных Web-порталов, тем более что научной отраслью отмечается большое число разработок на местах, не отвечающих основным принципиальным требованиям портального строительства. Особые трудности часто связаны с доступностью информационных ресурсов и неоправданными перегрузками каналов связи из-за неумелой маршрутизации, неправильно организованного поиска и зеркалирования.
Основные Функции сайта web-портала: 1) Ввключение приложений - позволяет легко развертывать и управлять различными приложениями. Возможность совместной работы - позволяет отдельным организациям объединить свои ресурсы и работать вместе. 2) Управление содержимым - придает гибкость управлению отдельными информационными ресурсами различных web-сайтов, позволяя поставлять конечному пользователю, приспособленное под него содержимое портала. 3) Управление пользователями - позволяет организации управлять пользователями, ресурсами и безопасностью внутри и вне системы сетевой защиты – знать кто, когда посетил, что копировал, выявить постоянных пользователей, определить загрузку серверов в различное время, день недели.
Использование портала позволит: 1) оперативно размещать информационные ресурсы на web; 2) привлечь к участию в работе по созданию контента многие организации; 3) ускорить доступ к информации по тематике портала – в любой момент, в любой точке нахождения пользователя, по любому району и интересам посетителя; повысить информативность лиц, принимающих решения; заинтересовать потенциальных пользователей информацией о теме; привлечь дополнительные финансовые ресурсы за счет более активного использования гео-информационных ресурсов широким кругом пользователей.
Мы создаем многофункциональную площадку с большим количеством разнообразных сервисов, совмещающую разнонаправленные группы сервисов и направлений деятельности, объединенные единой концепцией. Web-портал ИГХ СО РАН разрабатывается для информационных целей и должен иметь максимальный охват аудитории. Благодаря интеграции приложений пользователь работает уже не в каком-то одном из них, а в единой среде, ориентированной на решение конкретной задачи. Если, например, необходимо провести поиск неструктурированной, текстовой информации, то портал интегрируется со всеми существующими ИТ-системами, а средства поиска и управления контентом будут конвертировать все документы в унифицированный формат.
С помощью портала весьма эффективно решается проблема доступа. Современным портальным решениям свойственен мощный сервис каталогов (directory service), обеспечивающий развитые средства администрирования и унифицированного контроля прав доступа на основе ролей.
Технологии персонализации web-портала позволяют настраивать содержимое web-страниц портала в соответствии с потребностями отдельных пользователей и групп, предоставляя доступ к необходимым сервисам и данным предприятия. К таким технологиям относятся: фильтрация на основе правил, селективно отображающая информацию для определенной целевой аудитории, а также механизм создания отчетов, позволяющий анализировать влияние персонализированной информации на целевую аудиторию.
Предоставляемая порталом система электронного архива обеспечивает возможность централизованного хранения документов на портале и обладает следующими функциональными возможностями: 1) иерархическая структура папок для хранения документов; 2) задание метаданных документов (карточки документов); 3) работа с несколькими версиями документов; 4) коллективная работа над документами; 5) отслеживание изменений; 6) разграничение прав доступа пользователей к документам; 7) управление публикацией документов на основе механизма workflow; 8) встроенные редакторы, позволяющие создавать и редактировать документы; 9)интеграция с почтовыми приложениями портала.
Средства управления информационным наполнением (content management) предоставляют пользователям широкие возможности по работе с информацией, опубликованной на портале. Используя эти инструменты, администраторы получают возможность как централизованного управления информационным наполнением портала, так и передачи управления непосредственно авторам информации.
Одной из технологий для решения задач построения портала является технология em.Portal , которая позволяет реализовывать представительскую логику приложений для нескольких типов клиентских устройств (wap- и web-браузеры, прикладные программы). Технология обеспечивает повторное использование однажды разработанных приложений в разных проектах и пригодна для создания систем, предназначенных как для единственного владельца, так и для построения коллективных ресурсов, обеспечивающих поддержку наборов авторизованных или публичных приложений для произвольного количества пользователей. Конечным пользователям предоставляется доступ к информации по протоколам http и wap, а также обеспечивается взаимодействие со сторонними прикладными системами через специализированный протокол, обеспечивающий передачу параметров запросов и результатов обработки в формате xml.
Процесс работы информационного портала можно разделить на несколько фаз: 1) в портал из различных источников поступает информация; 2) портал производит первичное распознание информации и предоставляет ей доступ; 3) при использовании систем управления знанием формируются метаданные; 4) метаданные проходят через «фильтр», установленный пользователем, при этом ненужные данные отбрасываются; 5) отфильтрованные данные передаются пользователю (пользователь также может настроить «фильтр» под свои личные требования).
Информационный портал разделен на две части: 1) внутренний портал (Интранет), в котором расположена приватная информация, предназначенная для использования ограниченным числом пользователей (используется локальная сеть); 2) внешний портал, который доступен для общественного использования и в котором расположена публичная информация. Используется сеть Internet.
Функциональная структура информационного web-портала разбита на следующие составляющие: 1) приложения (браузер или навигатор); 2) система обеспечения безопасности (задание пароля, присваивание идентификатора); 3) репозитарий (хранилище метаданных об информационных объектах, пользователях, рабочих группах и т.д.; метаданные указывают тип объекта, раздел, к которому он принадлежит, формат документа и даже его содержание); 4) подсистема публикаций и подписки, которая позволяет пользователям публиковать свои документы и подписываться на получение необходимой информации и внешних источников; 5) механизмы анализа и планирования; 6) Модуль CRM (customer relationship management), позволяет сформировать информационную базу с данными о клиентах, службу информационной поддержки клиентов, настраивать портал под требование клиента (например, выдавать пользователю список информации, основываясь на прошлых обращениях) и т.д.; 7) приложения интеллектуального анализа или система управления знанием (knowledge management), средства, позволяющие структурировать и категоризировать неучтенные данные, сформировать удобные механизмы доступа к ним используя специальные аналитические методы, сконструировать отчеты о собранной информации, аннотирование существующих документов, формирование на базе аннотаций, описывающих документы, метаданных и размещение их в информационном хранилище вместе со ссылками на исходный документ; при этом устанавливается язык документа, его тема, дата создания и принадлежность. Одновременно создаются специальные словари или базы данных встречающихся в документе имен, терминов и других атрибутов с указанием их источника. Результатом деятельности является разбиение текстового документа на связанные категории, посредством эвристического анализа смысловой и терминологической близости распределяемых по иерархическим рубрикам текстов.
Преимущества, которые предоставляет информационный портал: 1) портал структурирует данные, находящиеся в базе геоданных ИГХ СО РАН и предоставляет их в удобной для использования форме; 2) портал отслеживает и извлекают информацию из сети Internet и фильтруют ее, основываясь на требованиях пользователей; 3) портал обеспечивает всеобщий доступ к публичной информации, основываясь на возможностях Сети (реклама при использовании внутренних возможностей компании); 4) использование возможностей гипертекста для перемещения по ссылкам, вставленным прямо в текст; 5) использование графических, аудио и видео образцов; 6) использование одной универсальной программы -web-браузера – для работы со всеми видами информации.
Итак, для того, чтобы можно было удобно работать с большими объёмами информации, нужно создать механизмы поиска, структурировать имеющуюся информацию и придать ей единый формат. Напрашивается сравнение с большой библиотекой. Попробуйте там что-либо найти, если у Вас нет каталога или книги расставлены без определенного порядка. Так вот, объём информации в Интернете на много порядков превышает объём любой библиотеки. Поэтому мы создаем инструмент, который позволит ориентироваться в этом море геоданных.
К списку докладов