Бесплатный автореферат и диссертация по наукам о земле на тему
Исследование и разработка структур баз геоданных информационно-телекоммуникационных систем
ВАК РФ 25.00.35, Геоинформатика

Автореферат диссертации по теме "Исследование и разработка структур баз геоданных информационно-телекоммуникационных систем"

На правах рукописи

КРАСНОБОРОДЬКО АЛЕКСАНДР ВЛАДИСЛАВОВИЧ

Исследование и разработка структур баз геоданных информационно-телекоммуникационных систем

Специальность 25 00 35 - «Геоинформатика»

Автореферат диссертации на соискание ученой степени кандидата технических наук

Москва-2007

003175394

Работа выполнена на кафедре Информационно-измерительных систем Московского государственного университета геодезии и картографии (МИИГАиК)

Научный руководитель доктор технических наук,

профессор Майоров А А

Официальные оппоненты доктор технических наук

профессор Цветков В Я кандидат технических наук Гречищев А В

Ведущая организация Государственный научно-внедренческий

центр геоинформационных систем и технологий ФГУП «ГосГисЦентр»

Защита состоится 23c^Jii/x 2007 года, в fC) часов на заседании диссертационного совета Д 212 143 03 при Московском государственном университете геодезии и картографии по адресу 105064, Москва, Гороховский пер , д 4, ауд 321

С диссертацией можно ознакомиться в библиотеке Московского государственного университета геодезии и картографии

Автореферат разослан «¿^ » Qx^cifS^Zlf 2007 г

Ученый секретарь

диссертационного совета ^/¡LiaJbK-^' Климков Ю.М

Общая характеристика работы

Актуальность работы

Современное развитие информационных технологий способствовало накоплению организациями и ведомствами большого количества геопространственной информации, которая представлена в различных видах и системах В настоящее время идет поиск наиболее интересного, с точки зрения организации системы, метода, позволяющего легко и эффективно использовать глобальные и локальные сети для объединения данных и их использования в распределенных информационных системах Последние исследования в области применения единых хранилищ данных для геопространственной и атрибутивной информации позволяют сделать дополнительные шаги к единому представлению данных, методам эффективной обработки, использования информации, а также простого доступа к получению необходимых сведений

Актуальность диссертационного исследования определяется необходимостью разработки эффективных методов формализации, структурирования и хранения геопространственной информации и недостаточной проработанности проблем интеграции различных видов геоданных, а также управления и анализа этих данных

Цель диссертационной работы

Целью диссертационной работы является исследование и разработка структуры базы геоданных распределенной информационно-телекоммуникационной системы, содержащей ресурсы геопространственных данных, которые доступны через сеть

Задачи работы

Для достижения поставленной цели в работе были поставлены и решены следующие задачи

1 Анализ существующих баз геоданных информационно-телекоммуникационных систем, сравнение, определение недостатков;

2 Исследование методов получения геопространственной информации через сеть,

3 Разработка структуры каталога метаданных геопространственной информации в виде древовидной иерархической структуры,

4 Разработка структуры базы геоданных информационно-телекоммуникационных систем, методов доступа к данным и их обработки,

5 Выбор методов преобразования моделей геопространственных данных для просмотра через Интернет,

6 Разработка функциональной схемы информационно-телекоммуникационной системы для работы разработанной базы геоданных,

7 Исследования эффективности применения разработанной структуры базы геоданных в информационно-телекоммуникационных системах

Научная новизна работы

Основные результаты диссертационной работы, представляющие научную новизну, заключаются в следующем

1 Разработана модель каталога метаданных геопространственной информации в виде древовидной иерархической структуры, позволяющая повысить производительность работы с большим набором данных,

2 Получены модель структуры базы геоданных информационно-телекоммуникационной системы, модель доступа к данным и их обработки;

3 Разработана архитектура и функциональная схема распределенной информационно-телекоммуникационной системы для работы с базой

геоданных, отвечающая требованиям высокой производительности и низкой нагрузки на транспортную составляющую, а также позволяющая консолидировать геоданные в едином хранилище

Практическое значение работы

Практическая значимость исследования заключается в том, что созданная структура базы геоданных позволяет различным потребителям информации получать удобный и оперативный доступ к геоданным, расположенным в большом количестве удаленных источников При этом использование центральной базы данных, т е хранение не самих данных, а ссылок на них, позволяет значительно снизить нагрузку на сеть, а также значительно сократить затраты на хранение информации в базах данных центрального сервера системы

Результаты диссертационной работы внедрены при создании информационного портала Морской коллегии при правительстве Российской Федерации

Основные результаты, выносимые на защиту

1 Разработанная модель и структура базы геоданных информационно-телекоммуникационных систем, позволяющая объединить геоданные, поступающие с различных источников,

2 Архитектура информационно-телекоммуникационной системы для работы с базой геоданных распределенных источников информации,

3 Алгоритмы и реализация модуля информационно-телекоммуникационной системы «Каталог Метаданных»

Апробация работы

По теме диссертации были сделаны доклады на ежегодных научно-технических конференциях МИИГАиК в 2002 - 2006 годах, а также на Международной конференции пользователей программных продуктов ЕБШ в 2002 — 2004 годах

Публикации

По теме диссертации опубликовано 4 научные работы.

Объем и структура работы

Диссертация состоит из введения, четырех глав, заключения и списка литературы, а также трех приложений Работа изложена на 102 страницах, включая 28 рисунков и 13 таблиц Список используемой литературы включает 53 наименования

Содержание работы

Введение. Во введении обосновывается актуальность выбранной темы диссертации, сформулированы цели и задачи работы, ее научная новизна и практическая значимость

ГЛАВА 1. Анализ баз геоданных информационно-телекоммуникационных систем В этой главе диссертационной работы приводится классификация баз данных распределенных информационно-телекоммуникационных систем, а также проводится сравнительный анализ существующих систем для работы с геоданными, их характеристики, методы обеспечения данными пользователей сетей общего пользования

На первом этапе анализа проводится классификация баз данных распределенных информационно-телекоммуникационных систем В качестве основы для построения базы данных используются несколько видов их построения, основные это-

1 Построение единой базы данных системы,

2 Построение центральной базы данных

Создание единой базы данных путем копирования информации со всех источников в единое хранилище данных позволяет получать доступ к данным, независимо от доступности в данный момент времени удаленного источника Отрицательной стороной подобного подхода являются большие объемы данных, которые необходимо хранить и передавать в единое хранилище Такое ко-

личество информации требует дополнительных методов по обеспечению ее целостности и корректности

Центральная база данных системы работает по принципу сбора некоторых заголовков системы и последующего получения информации непосредственно из удаленного источника Такая конструкция позволяет представить базу данных в виде множества относительно небольших баз данных, интегрированных посредством некоторого приложения или другой «обобщенной» базы данных

Основные характеристики типов баз данных приведены в таблице 1 1

Таблица 1 1 Сравнительные характеристики подходов при построении БД

Тип базы данных Единая (интегрированная) Центральная

Хранение данных В центральном хранилище В удаленных базах данных

Необходимость регулярной репликации данных Да Нет

Для доступа к данным необходимо, чтобы источник данных «был в сети» Нет Да

Наличие высоких требований к скорости соединений Да Да

Необходимость актуализации данных Да Нет

В дальнейшем определяются задачи представления геопространственной информации в распределенных информационно-телекоммуникационных системах, а также рассматривается структура таких систем Проведенная в диссертационной работе классификация информационно-телекоммуникационных систем, в которых обрабатываются геоданные, позволяет определить основные характеристики таких систем, а также оценить их преимущества и недостатки В первом типе систем (доступ в ГИС через Интернет) представлены унифицированные данные, а также возможен доступ к распределенным источникам данных Второй тип систем (Интернет каталоги ресурсов) позволяет охватить заве-

домо более широкое количество ресурсов, поскольку в каталог можно добавить все известные ресурсы На основании всего вышесказанного можно сделать вывод, что современные распределенные информационно-телекоммуникационные системы имеют широкие, но не достаточные возможности для представления геоинформации в своих базах данных таким образом, чтобы у пользователя был удобный доступ к этой информации, а также возможность быстро найти интересующие его данные Использование комбинированного подхода для построения базы данных информационной системы позволит значительно повысить возможности представления геопространственных данных, представленных на большом количестве ресурсов

ГЛАВА 2. Моделирование базы геоданных распределенной информационной системы, содержащей сетевые ресурсы геопространственных данных. В этой главе производится моделирование структуры базы геоданных Исходными объектами информационно-телекоммуникационной системы являются геоданные Геоданные - геопространственная информация, а также атрибутивные данные Особенностью этих исходных объектов является то, что они могут быть представлены в различных видах и вариантах, поскольку находятся в различных системах и источниках Унификация данных для работы в одной информационной системе возможна применением некоторого стандартизованного описательного формата данных Таким форматом данных является метаданные геоинформационной системы

Международный стандарт (профиль) ISO 19115 «Географическая информация Метаданные» состоит из набора следующей информации общее описание данных, местонахождение данных, время создания данных, организация-производитель В основе пакета метаданных лежит следующая информация о геоданных

1 идентификатор файла метаданных или записи о метаданных в БД,

2 стандарт, используемый для описания метаданных,

3. язык составления метаданных,

4 дата составления метаданных,

5 сведения о стороне, поставляющей метаданные Перечень этих данных позволяет четко определить объект геоданных и произвести к нему непосредственное обращение

Целью моделирования структуры базы геоданных является создание именно такой структуры данных, которая способна консолидировано хранить метаданные геоданных распределенной информационно-

телекоммуникационной системы

Простое размещение метаданных в структуре базы геоданных распределенной информационно-телекоммуникационной структуры является недостаточным потому, что простое нагромождение данных только усложнит работу системы В качестве решения проблемы обнаружения требуемой информации в базе геоданных необходимо выбрать метод сортировки данных в базе геоданных На основе системного анализа делается вывод, что представление широкого набора различных данных в виде иерархического списка наиболее удобно с точки зрения доступа к данным пользователя Приводятся методы построения иерархических данных, а также иерархические структуры представления геоданных В целях решения задачи централизованного доступа к данным, их классификации, унификации и определения свойств и методов для их обработки используется каталог данных Каталог данных представляет собой древовидную иерархическую структуру, в которой на различных уровнях иерархии находятся все элементы системы Причем, следует отметить, что элементы системы не всегда являются элементами иерархии

Разработана математическая модель иерархической каталога структуры базы геоданных, позволяющая описать алгоритмы для доступа к элементам иерархии Математическая модель строится на основе ряда объединений Первое объединение - это объединение в группу с одинаковым иерархическим уровнем Такое объединение будем называть обобщенным вектором уровня иерархии т, те Ат, где ш числа натурального ряда от 1 до N Таким образом, математическая модель БД — А представляет собой последовательность обобщенных векторов Ах,А2 Ам

Второе объединение - это объединение в группу, соответствующую элементу более высокого иерархического уровня Иными словами, в математической модели информационной системы, построенной на иерархическом принципе, каждому элементу более высокого уровня соответствует группа элементов текущего уровня Подобные группы и являются независимыми обобщенными координатами векторов. В каждой такой группе число элементов будет , где г - номер группы в векторе Ат г - натуральное число от 1 до Ит, 3 — число групп в векторе Ат

Число элементов в векторе Ат определяется по формуле.

А« = (1)

г=1

Необходимо отметить, что

N, = 1,= ! ' (2)

А число групп обобщенного вектора Д,,+1 равно числу элементов вектора Д„,те

= Ьт (3)

Число элементов во всей математической модели БД определяется следующим образом.

N

^ХХХ* (4)

т=1 /=1

Каждый элемент математической модели определяется тремя индексами

1 к 9

где к — номер элемента в группе г, и 1 <к< 1т1

В представленной математической модели легко осуществить поиск необходимой информации в иерархической структуре путем вычисления сквозных номеров интересующих нас элементов по соответственным формулам

Найдем (в соответствии с иерархической структурой математической модели БД) для атлк соответствующую группу элементов иерархического уровня

т+1 Введем дополнительный индекс] Сквозной номер аи,и в Ат определяется по формуле

7=1

(5)

1 при т = 1

Аи,а ~ ^ ^ ПРи 1 ~ 1 (6)

к + при г > 1.

7=1

Аналогично искомый номер в Ат+1 будет равен Ьт, к, обозначим его г/, т е г1 = Ьт а, (7)

тогда соответствующие элементы будут

ат+1 и к, где 1 <к< 1т+ ш (8)

Сквозной номер к будет

т й

=СУ,^1)~Ьт + £ + 1 ^

7=1

7=1

или

к + Ь2 +1 /и = 1

к + при г\>\

7=1

/я—1 ¡1-1

(10)

7=1 7=1

На основе представленной математической модели строятся алгоритмы информационной системы для работы с иерархией объектов базы геоданных

Проводятся исследования для определения наиболее эффективного способа хранения иерархических данных в базах данных Самый простой метод моделирования структуры подразумевает простой рекурсивный проход по дереву и получение информации о всех структурах Модификация простого метода заключается в нагрузке рекурсивной таблицы дополнительными данными Эти данные содержат полезную дополнительную информацию, такую как путь от самого верха до раздела, вложенность раздела, количество дочерних элементов, самый верхний уровень, и все, что может показаться нужным при разработке программы

Рассмотренный иерархический каталог метаданных системы представляет основную конструкцию системы, через которую производятся манипуляции с данными Иерархический каталог связан с хранением данных и доступом к ним В качестве основы иерархического каталога может существовать естественная иерархия документов Для геоданных эта иерархия может выстраиваться по масштабу, а также по охвату территорий Иерархический каталог представляет собой описание метаданных информации, которой располагает система распределенных источников данных Метаданные содержат помимо основных свойств информации еще и ряд дополнительных параметров Структура метаданных базы геоданных информационно-телекоммуникационной системы представлена в таблице 1 2

Использование метаданных для описания элементов системы позволяет представить информацию в наиболее удобном виде, при этом появляется возможность представить данные таким образом, что можно осуществить связь между ними и иерархическим каталогом

Следует отметить, что характеристики объектов могут быть расположены в отдельных таблицах базы геоданных, что позволит использовать словари значений атрибутов Модель БД представлена на рис 1 1

Таблица 1 2

Структура метаданных системы

Наименование параметра Описание

Ключ объекта Уникальный ключ источника данных

Наименование объекта геоданных Текстовое название объекта

Описание объекта геоданных Текстовое описание источника данных, используется для дополнительного краткого описания объекта

Путь до источника геоданных Путь в сети до источника данных

Характеристики геоданных Характеристики данных, которые описывают информацию, предоставляемую источником данных Их может быть неограниченное множество

Рис 1 1 Структура таблиц каталога метаданных Далее описываются методы преобразования моделей геопространственных и атрибутивных данных В удаленных источниках данных геоданные хра-

13

нятся в различном виде Для работы необходимо использовать дополнительное преобразование между объектными моделями, в которых представлены данные, и существующими объектными моделями веб-документов

Рис 1 2 Функциональная схема преобразования данных В функциональной схеме, представленной на рис 1 2, отмечен блок процесса обработки и преобразования данных Этот функциональный блок содержит алгоритмы преобразования данных - методы трансляции данных из объектной модели источника к объектной модели документа (DOM)

Объектная модель источника при помощи программных интерфейсов приводится в соответствии с Объектной моделью документов В качестве примера можно привести обработку объектов при помощи дополнительных программных средств уже на стороне пользователя (например, DHTML, динамичный язык разметки документов) на последнем этапе

Преобразования данных системы производятся с помощью алгоритмов приведения соответствий моделей данных Исходная модель данных преобразуется в один из возможных вариантов модели данных Интернет страницы (HTML, DHTML, XML, GML) В качестве конечной используется Объектная модель документа (DOM) и ее расширения, например, расширения для обработки векторной графики, как было сказано выше

Преобразование данных проводится в соответствии с установленными соответствиями объектов исходной объектной модели и Объектной модели документа, которая является конечной для преобразования

Преобразование атрибутивной информации в ряде случаев может вообще не потребоваться (рис 1 3), поскольку информация, представленная в качестве атрибутивной, в большинстве случаев хранится в реляционных таблицах базы данных, к которым можно подключиться напрямую Такой подход также возможен, поскольку на протяжении всех преобразований данных сохраняется ссылка на первоначальные ключи, которые могут определить информационный объект и после его преобразования

Таким образом, получаем как бы «сквозную» схему движения информации через блок преобразования, который в данном случае затрагивает только транслирование данных из удаленных источников в запрашиваемый документ

Рис 1 3 Преобразование атрибутивных данных ГЛАВА 3. Разработка структуры базы геоданных и архитектуры распределенной информационно-телекоммуникационной системы. В этой главе рассматривается метод разработки структуры базы геоданных информационно-телекоммуникационных систем В начале главы приводится список основных задач информационно-телекоммуникационной системы, обслуживающей исследуемую структуру базы геоданных (рис 1 4)

1 Интеграция в единой структуре базы геоданных средств хранения, обновления и обработки картографических ресурсов на основе данных, имеющихся в удаленных источниках информации,

2 Разработка геоинформационной системы, позволяющей обеспечить оперативными картографическими информационными ресурсами заинтересованных лиц и учреждений

Обработка

и данных и ь

о>

X 1=1

Пользователь информации

N И

Рис. 1.4. Функциональные задачи системы Представленная на рис. 1 5 общая функциональная схема системы позволяет определить место каждого элемента

Удаленные базы данных

Рис 1 5 Схема системы Система на основе принципов и методов организации исследуемой структуры базы геоданных позволяет организовать совместную работу поль-

зователей с данными, снабжена средствами поиска и категоризации информации Одним из основных требований к системе является обеспечение надежного взаимодействия распределенных информационных ресурсов и доступа к ним пользователей, т е непосредственного функционирования базы геоданных

Далее приводится модель исследуемой структуры базы геоданных информационно-телекоммуникационной системы

Рис 1 6 Структура базы геоданных распределенной информационно-

телекоммуникационной системы Структура (рис 1 6) представляет собой связь двух основных элементов системы для отображения и доступа к геопространственным и атрибутивным данным Основными компонентами являются каталог метаданных системы, а также таблицы сервера хранения запросов системы Кроме этого, в базе геоданных существует ряд дополнительных таблиц таблицы для хранения данных объектных моделей для преобразования данных и таблицы, которые определяют связи для таблиц преобразования данных

Рассматривается архитектура обслуживающей информационно-телекоммуникационной системы (рис 1 7) и подробно описывается каждый

элемент Сервер службы данных - приложение, обеспечивающее доступ к источникам данных и выполнение запросов клиента на предоставления выбранных им данных Каталог метаданных системы — обеспечивает регламентированный многопользовательский доступ к данным удаленных источников Менеджер каталога метаданных — клиент-серверное приложение, предназначенное для организации и администрирования каталога данных Документатор -клиент-серверное приложение, предназначенное для документирования процедуры формирования запрашиваемых геоданных из источника данных

Клиентские приложения Сервер системы Базы данных

Рис 1 7 Архитектура системы Приведенные в диссертации алгоритмы работы системы описывают принципы работы программной составляющей системы В работе представлены алгоритмы добавления данных в ручном, полуавтоматическом и автоматическом режиме, алгоритм работы с каталогом, алгоритм представления данных Приведем алгоритм добавления нового объекта в полуавтоматическом режиме (рис 18) Документатор получает информацию от пользователя только об адресе объекта, а также об имени пользователя и пароли доступа к объекту Затем

в автоматическом режиме Документатор подключается к объекту и самостоятельно заполняет все необходимые данные для каталога метаданных

Рис 1 8 Алгоритм полуавтоматического добавления данных В схеме эксплуатации структуры базы геоданных помимо самой геоинформационной системы существует еще два модуля - модуль Потребителя и модуль Подготовки данных (рис 1 9)

Модуль Потребителя объединяет непосредственных пользователей системы, которые получают информацию для анализа и обработки Модуль Подготовки данных выполняет функции подготовки ГИС проектов по требованию потребителей При подготовке информации выполняется ряд типовых функциональных задач данного модуля преобразование (если это не выполняется

автоматически) формата представления отдельных слоев, координатные преоб-

19

разования к единой проекционной системе, операции с атрибутивными данными, мультимедийное оформление проекта При этом, поскольку сохраняется связь с базами данных ГИС портала, возможно наличие ссылок на уже имеющиеся в системе данные

Клиентские приложения Сервер системы Базы данных

ГЛАВА 4. Результаты экспериментальных исследований информационно-телекоммуникационной системы на основе разработанной структуры базы геоданных. В этой главе представлены результаты экспериментальных исследований компонентов структуры базы геоданных. В качестве экспериментальной модели системы был выбран проект создания информационного портала для Морской Коллегии РФ. На основе экспериментальной модели базы геоданных были проведены ряд тестов производительности базы геоданных - тесты на производительность работы базы геоданных в обслуживающей системе и тесты на удобство пользования. Был составлен список для древовидного классификатора, исходя из организационной структуры портала. На основе этого списка проводилась классификация источников данных и самих данных системы.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

Рис. 1.10. Скорости каналов связи.

Проведенный тест на производительность показал, что средняя скорость обмена трафиком между источниками и центральным сервером составляла 5,5 Мбит/сек (рис. 1.10.). Полуавтоматический алгоритм ввода данных произвел работу по добавлению 21 источника информации в течении 140 секунд. В дальнейшем проводился тест удобства использования системы. Для определения этого «не четкого» параметра была набрана группа из 15 человек, ранее работавших в различных информационных системах и ГИС. Оценка велась по пяти-

21

балльной шкале Оценка в среднем составляла 4 6 балла, максимальное отклонение - 1 1 балл, минимальное отклонение - 0 1 балл, дисперсия - 0 20 По таким показателям как удобство просмотра данных и выполнение поиска информации средний балл составил 4 9 Проведенный тест определения скорости доступа к данным посредством преобразования модели данных системой показал, что скорость канала с источником составляет 2 5 Мбит/с, время соединения с источником составило 25 секунд Пользователь начал получать преобразованные данные системы уже через 30 секунд после начала эксперимента, таким образом, время преобразования моделей составило 5 секунд В ходе теста нагрузка на процессор сервера системы составляла в среднем не более 14%, и в пиковые моменты до 49% (рис 111)

Нагруэха %

Рис 111 Загрузка процессора В заключении диссертации приведены итоги проведенной работы, представлены результаты исследования и направления дальнейшей работы

Заключение

В ходе проведенных исследований решена основная задача диссертации -исследована и разработана структура баз геоданных информационно-телекоммуникационных систем, а также применена на практике методика проектирования базы геоданных, предназначенной для консолидированного хранения распределенных геоданных В работе выполнен анализ существующих информационно-телекоммуникационных систем, использующих базы геодан-

в Подключение к данным Я Проверка доступности источника

□ Получение данных

□ Преобразование подели ■ Просмотр данных

В Переходы между уровнями каталога И Полное формирование каталога

ных, определена классификация их основных типов, а также пути повышения их качества на основе анализа известных исследований и практики использования

Разработана модель представления каталога метаданных геоданных в виде древовидной иерархической структуры Получены модель структуры базы геоданных информационно-телекоммуникационной системы, модель доступа к данным и их обработки, а также функциональная схема информационно-телекоммуникационной системы для работы с разработанной базой геоданных Разработаны принципиальные схемы и алгоритмы работы информационно-телекоммуникационной системы, на основе которых произведена реализация модулей этой системы

Полученное решение задачи представления геопространственных данных путем применения структурированных каталогов метаданных позволяет повысить эффективность работы распределенных информационно-телекоммуникационных систем, поднять производительность системы в области обработки и хранения данных и снижения нагрузки на каналы связи, а также увеличить удобство эксплуатации и поиска нужной информации

Список опубликованных работ по теме диссертации

1 Сбор данных от удаленных измерительных станций и оперативное отображение информации на основе технологии ГИС/ А В Краснобо-родько, В В Зайцев // Известия высших учебных заведений Геодезия и аэрофотосъемка - 2002 - Спец вып - С 97-103

2 Разработка интегрированной автоматизированной информационной системы вуза с поддержкой анализа геопространственных данных/ ИН Кондауров, А В Краснобородько, А А Майоров // Известия высших учебных заведений Геодезия и аэрофотосъемка - 2004 - Спец вып-С 64-68

3 Исследование и разработка модуля анализа информации "Автоматизированной системы учета недвижимого имущества и земельного кадастра «Минобразования России» / Савиных В П , Майоров А А , Кон-

дауров И Н, Краснобородько А В // Сборник докладов Международной научно-технической конференции, посвященной 225-летию МИИГАиК, Москва 2004, - С 107-112

4 Архитектура автоматизированной системы обработки геопространственных данных портала «Морская коллегия»/ А-15 Краснобородько, И Н Кондауров // Известия высших учебных заведений Геодезия и аэрофотосъемка - 2006 - № 5 - С 167-172

Подписано в печать 22 10 2007 Гарнитура Тайме Формат 60x90/16 Бумага офсетная Печать офсегная Объем 1,5 уел печ л Тираж 80 экз Заказ №218 Цена договорная

Отпечатано в типографии МИИГАиК

Содержание диссертации, кандидата технических наук, Краснобородько, Александр Владиславович

Введение

ГЛАВА 1. Анализ баз геоданных информационно-телекоммуникационных систем

1.1. Классификация баз данных распределенных информационно-телекоммуникационных систем

1.2. Определение и структура информационно-телекоммуникационной системы

1.3. Задачи представления геопространственной информации в распределенных информационно-телекоммуникационных системах

1.4. Классификация моделей геопространственных данных

1.5. Классификация информационно-телекоммуникационных систем, обслуживающих геопространственные данные

1.6. Метаданные геоинформационных систем

1.7. Выводы по главе

ГЛАВА 2. Моделирование базы геоданных распределенной информационной системы, содержащей сетевые ресурсы геопространственных данных

2.1. Иерархические структуры представления геоданных

2.2. Математическая модель иерархической структуры базы геоданных информационно-телекоммуникационной системы

2.3. Представление иерархической структуры модели базы геоданных информационно-телекоммуникационной системы

2.4. Иерархический каталог информационно-телекоммуникационной системы

2.5. Преобразование моделей геопространственных и атрибутивных данных

2.6. Отображение объектов через Интернет

2.7. Выводы по главе

ГЛАВА 3. Разработка структуры базы геоданных и архитектуры распределенной информационно-телекоммуникационной системы

3.1. Задачи информационно-телекоммуникационной системы

3.2. Возможности распределенной информационно-телекоммуникационной системы

3.3. Модель структуры базы геоданных информационно-телекоммуникационной системы

3.3. Архитектура распределенной информационно-телекоммуникационной системы

3.5. Логическая схема работы системы

3.6. Алгоритм работы системы

3.7. Технические характеристики системы

3.8. Функциональная схема работы системы

3.9. Выводы по главе

ГЛАВА 4. Результаты экспериментальных исследований информационно-телекоммуникационной системы на основе разработанной структуры базы геоданных

4.1. Описание экспериментальной системы

4.2. Структура базы геоданных экспериментальной системы

4.3. Описание портала

4.4. Визуализация организационной структуры

4.5. Работа с картами

4.6. Результаты эксперимента

4.7. Выводы по главе

Введение Диссертация по наукам о земле, на тему "Исследование и разработка структур баз геоданных информационно-телекоммуникационных систем"

Современное развитие информационных технологий способствовало накоплению организациями и ведомствами большого количества геопространственной информации, которая представлена в различных видах и системах. Существующие информационно-телекоммуникационные системы позволяют оперировать данными, но в недостаточной степени геопространственными. Построение таких систем на основе распределенных баз данных позволяет повысить эффективность и управляемость данными, а также простоту их получения и обработки.

Геоинформационная система - это, в первую очередь, данные, которые хранятся в базах данных, базах геоданных, отдельных файлах. Существует множество различных форматов и принципов описания данных. Существуют методы, которые позволяют консолидировано хранить эти данные, описывать их единым образом для потребления ГИС.[1]

Бурное развитие сетевых технологий и методов, особенно развитие Интернета, способствует выводу «в сеть» различных вариантов систем. Это сводится как к простому разрешению доступа к данным через Интернет, так и к более сложному использованию специальных приложений для работы через сеть. Готовые решения ведущих производителей программного обеспечения ГИС позволяют создать практически полную функциональность ГИС. Использование различных программ для организации работы через сеть позволяет не только получать геопространственную информацию, но и модифицировать ее, обновлять и т.д., в общем, работать с ней как в обычной настольной ГИС. [2]

В настоящее время идет поиск наиболее интересного, с точки зрения организации системы, метода, позволяющего легко и эффективно использовать глобальные и локальные сети для объединения данных и их использования в распределенных информационных системах. [8] Последние исследования в области применения единых хранилищ данных для геопространственной и атрибутивной информации позволяют сделать дополнительные шаги к единому представлению данных, методам эффективной обработки, использования информации, а также простого доступа к получению необходимых сведений.

Все географические информационные системы строятся на основе формальных моделей, описывающих размещение в пространстве объектов и процессов. [3] Формальная модель представляет собой обобщенную и четкую систему понятий, она задает тот лексикон, который может быть использован для описания и объяснения объектов и процессов. Географическая модель данных определяет лексикон для описания и объяснения объектов и процессов, находящихся на земле. Географические модели данных являются тем основанием, на котором строятся все географические информационные системы. Точно также географические модели данных определяют собственный набор понятий и отношений, которые должны быть понятны. Эти понятия определяют возможности воспроизведения географической информации средствами компьютерной системы.

Большинство современных программных средств ГИС определяют единую основу для представления географической информации в базе данных посредством нескольких наиболее обобщенных моделей данных.

Каждая из этих обобщенных моделей обладает собственным лексиконом, используемым для описания и объяснения географической информации. Представляя в ГИС различные объекты, прежде всего, необходимо решить, какую из указанных общих моделей использовать. Каждая модель данных определяет то, как именно будет отбираться и представляться географическая информация, как она будет визуализироваться, какие связи между элементами можно представить, и какие операции запросов и анализа можно будет адресовать к имеющимся данным.

Использование моделей данных для создания различных видов представления информации широко применимо и в информационных сетях.

Такой подход позволяет создать то представление данных, которое будет доступно для программного обеспечения пользователя.

Интернет возможности ГИС сейчас достаточно широки, но, в тоже время, использование это подхода для комплексной и широкой системы для хранения и отображения геопространственных данных затруднительно. Возникают трудности как технического, так и пользовательского характера, иногда существует избыточность функциональности веб-приложений для решения не очень сложных задач по выводу информации и ее интерпретации.

Целью диссертационной работы является исследование и разработка структуры базы геоданных распределенной информационно-телекоммуникационной системы, содержащей ресурсы геопространственных данных, доступные через сеть. В работе проводится анализ эффективного представления каталога этих ресурсов в информационной системе, а также рассматривается функциональная схема такой системы.

В качестве направлений исследования были выбраны следующие:

1. Исследование структур баз геоданных современных систем для отображения геопространственной информации распределенной информационно-телекоммуникационной системы;

2. Определение путей представления распределенных источников геоданных в информационной системе для повышения эффективности работы с ней пользователей;

3. Разработка структуры базы геоданных информационно-телекоммуникационной системы;

4. Разработка функциональной схемы информационной системы для работы с удаленными источниками пространственных данных.

В качестве основы для построения базы данных современных систем используются два основных типа БД - единая БД, центральная БД. Создание единой базы данных путем копирования информации со всех источников в единое хранилище данных позволяет получать доступ к данным, независимо от доступности в данный момент времени удаленного источника. Отрицательной стороной подобного подхода являются большие объемы данных, которые необходимо хранить и передавать в единое хранилище. Такое количество информации требует дополнительных методов по обеспечению ее целостности и корректности.

Центральная база данных системы работает по принципу сбора некоторых заголовков системы и последующего получения информации непосредственно из удаленного источника. Такая конструкция позволяет представить базу данных в виде множества относительно небольших баз данных, интегрированных по средствам некоторого приложения или другой «обобщенной» базы данных.

В работе проводятся исследования организации центральной базы данных системы, которая позволяет представить записи о различных источниках данных в виде каталога метаданных системы, при этом каталог представляет собой иерархическую структуру.

В первой главе диссертационной работы приводится классификация баз данных распределенных информационно-телекоммуникационных систем, а также проводится сравнительный анализ существующих систем для работы с геопространственными данными, их характеристики, методы обеспечения данными пользователей сетей общего пользования. В заключение главы поставлены цели исследования.

Вторая глава посвящена аналитическому решению задачи создания структуры данных, построена математическая модель иерархической структуры, произведен анализ эффективного хранения иерархических моделей в реляционных базах данных, а также рассмотрены теоретические схемы преобразования моделей данных удаленных источников к единой модели базы геоданных.

В третьей главе приведены задачи и возможности распределенной информационной системы, приведена модель структуры базы геоданных, а также архитектура распределенной информационно-телекоммуникационной системы. Описаны алгоритмы основных действий системы и отражены технические требования и принципы работы системы.

В четвертой главе дано описание функционирующей системы, которая позволяет применить на практике все положения данной работы, приведены принципы ее работы, а также методы и способы решения задач.

В заключении работы приведена общая характеристика работы и основные выводы по результатам диссертации.

На защиту выносится:

1. Разработанная модель и структура базы геоданных информационно-телекоммуникационных систем, позволяющая объединить геоданные, поступающие с различных источников;

2. Архитектура информационно-телекоммуникационной системы для работы с базой геоданных распределенных источников информации;

3. Алгоритмы и реализация модуля информационно-телекоммуникационной системы «Каталог Метаданных».

Заключение Диссертация по теме "Геоинформатика", Краснобородько, Александр Владиславович

4.7. Выводы по главе 4

На основе приведенных данных следует вывод, что проведенное экспериментальное исследование работы системы подтверждает теоретические расчеты и положения, приведенные в главах 1-3. Использование иерархического каталога позволяет повысить удобство работы системы. Применение методов преобразования данных - упростить доступ к специализированным данным. Использование центральной базы геоданных и применение каталога метаданных позволяет значительно сократить нагрузки на телекоммуникационные составляющие системы. В целом комплексная работа системы показала свою стабильность и эффективность.

Заключение

В работе выполнен анализ существующих информационно-телекоммуникационных систем, работающих с геопространственными данными, определена классификация их основных типов, а также пути повышения их качества на основе анализа известных исследований и практики использования.

Разработана модель представления данных в виде древовидной иерархической структуры каталога метаданных геопространственной информации. Получены модель структуры базы геоданных информационно-телекоммуникационной системы, модель доступа к данным и их обработки, а также функциональная схема информационно-телекоммуникационной системы для работы с геопространственными данными.

Предложены и конструктивно проработаны технические решения, связанные с разработкой иерархической структуры базы геоданных для отображения каталога данных геопространственной информации информационно-телекоммуникационной системы. Организация древовидного каталога позволяет повысить производительность поиска данных путем последовательного сокращения области поиска рядом итераций, а также снизить нагрузку на центральные сервера системы, которым не потребуется хранить большие объемы данных и поисковых индексов. Организация центральной базы данных путем сбора ссылок на источники данных позволяет значительно сократить нагрузки на каналы связи и повысить общую производительность системы.

Разработаны принципиальные схемы и алгоритмы работы информационно-телекоммуникационной системы, на основе которых произведена реализация модулей этой системы.

Создана функционирующая информационно-телекоммуникационная система, обслуживающая разработанную структуру базы геоданных. В ее основе положен метод центральной базы данных, который позволяет внутри базы геоданных системы хранить не полный набор всех данных, а только метаданные всей системы со ссылками на соответствующие источники данных. Применение такого метода позволило сократить затраты на использование аппаратных средств, а также сократить нагрузку на сеть передачи данных.

Разработка теоретических положений и создание на их основе модели структуры базы геоданных стало возможным благодаря комплексному использованию теоретических и экспериментальных методов исследования. Решение задач, поставленных в работе, стало возможным благодаря известным достижениям и не противоречит их положениям, базируется на строго доказанных выводах фундаментальных и прикладных наук, таких как математический и системный анализ.

Разработанные теоретические положения и новые технические решения подтверждены экспериментально. Исследования проводились на экспериментальной базе Московского государственного университета геодезии и картографии (МИИГАиК) и внедрены при создании портала Морской коллегии при Правительстве РФ.

Полученное решение задачи представления геопространственных данных посредствам применения структурированных каталогов метаданных позволяет повысить эффективность работы распределенных информационно-телекоммуникационных систем путем повышения производительности системы в области обработки и хранения данных и снижения нагрузки на каналы связи, а также повысить удобство эксплуатации и поиска нужной информации.

Основные положения и результаты работы докладывались и обсуждались на семинарах и конференциях Московского государственного университета геодезии и картографии, а также на Международных конференциях пользователей программных продуктов ESRI, проводимых компанией «Дата+».

Библиография Диссертация по наукам о земле, кандидата технических наук, Краснобородько, Александр Владиславович, Москва

1. Иванников А. Д., В.П. Кулагин, А.Н. Тихонов, В .Я. Цветков, Геоинформатика, М:МаксПресс, 2001 - 349 с.2. «What is ArcGIS?», ESRI, USA, 2002

2. Майк Зейлер, «Моделирование нашего мира», Дата+, М, 1999

3. Цветков В.Я. Основы геоинформационного моделирования // Геодезия и аэрофотосъемка 1999 №4, с.147 -157

4. Бугаевский JI.M., Цветков В.Я. Геоинформационные системы. М.: "Златоуст", 2000. - 214 с.

5. Цветков В.Я. Геоинформационные системы и технологии/ Учебное пособие. М.: МГУГиК, 2000. - 69 с.

6. Справочник по математике для научных работников и инженеров, Г.Корн, Т.Корн пер. с англ. под реакцией Араманович И.Г., М.:Наука, 1984-831 с.

7. Распределенные информационные системы и базы данных, Глеб Ладыженский, http://www.citforum.ru/database/kbd96/45.shtml

8. Autodesk MapGuide 6 и ArcIMS 4. Сравнение инструментов и возможностей, Алекс Фордис, пер. Андрея Макурина, http://www.sapr.rU/Archive/SG/2005/3/13/

9. Ю.Саати Т.Л. Принятие решений. Метод анализа иерархий. М.:Радио и связь, 1993.-320 с.

10. Объектно-ориентированная ГИС в сети INTRANET, http://www.gisa.ru/841 .html

11. Краак Менно-Ян, Ферьян Ормелинг, Картография. Визуализация геопространственных данных, М.:Научный мир, 2005.

12. Харрингтон Дж.Л., Проектирование реляционных баз данных, М.: Лори, 2006

13. Ван Стеен М., Распределенные системы. Принципы и парадигмы, Спб.Литер, 2003.-887 с.

14. Проект Концепции формирования Российской инфраструктуры пространственных данных (РИПД), http://www.elrussia.ru/files/37263/npoeKT концепции РИШЫос

15. Е.Л.Китаев, Д.Л.Кузьмичев, М.И.Слепенков, Проблемы технологического обеспечения многоцелевого режима эксплуатации каталогов метаданных Интернет, http://ict.edu.ru/ft/004315/ргер2003 01 .pdf

16. А.В.Ребрий, Я.В.Степанова, Стандарт ISO/TC211 №19115 «Географическая информация. Метаданные»: перспективы практического применения, http://www.ggc.ru/docs/ISQ%2019115%20статья.Ыш

17. А.А.Кубенский, Структура и алгоритмы обработки данных. Объектно-ориентированный подход и реализация, Киев:ВНУ, 2004,- 464 с.

18. Д, Кузьменко, Древовидные (иерархические) структуры данных в реляционных базах данных, http://www.ibase.ru/devinfo/treedb2.htm

19. С.Виноградов, Моделирование иерархических объектов, http://www.rsdn.ru/article/alg/dbtree.xml2106 SGML и HTML,http://athena.wsu.ru/docs/www/html40/intro/sgmltut.html

20. Б.Тоботрас, SGML: с чем это едят?, http://www.linuxshop.ru/lib/text/SGMLwh.html

21. Andrew McDonald, «Building a Geodatabase», ESRI Press, USA, 2001

22. А.Б. Семенов, «Структурированные кабельные системы», Лайн Лтд, М, 200125.www.gisa.ru сайт ГИС-Ассоциации26.http://giscenter.icc.ru ГИС-центр

23. Г.А. Сырецкий, Информатика. Фундаментальный курс. Том 1. Основы информационной и вычислительной техники, Спб:БХВ-Петербург, 2005

24. Краснобородько А. В., Зайцев В. В., Майоров А. А. Справочно-информационная система ВУЗа на основе ГИС-технологий. ArcReview. 2003, №2, стр. 20.

25. Цветков В.Я. Модели и моделирование/ Учебное пособие. М.: МГУГиК, 2006.-94 с.

26. Арнольд В.И. «Жесткие» и «мягкие» математические модели. Дубна. 2000

27. Поляков А.А., Цветков В.Я. Прикладная информатика. М.:Янус-К, 2002.-392 с.

28. Цветков В.Я., Кулагин В.П., Введение в геоинформатику. М.:Макс Пресс, 2005-99 с.

29. Цветков В.Я. Информационные модели и информационные ресурсы // «Известия высших учебных заведений. Геодезия и аэрофотосъемка», Москва, 2005. №3, стр. 85-91.

30. Сиха Багуи. Объектно-ориентированные базы данных: достижения и проблемы // Открытые системы, 2004, №03.

31. The Object Data Standard: ODMG 3.0. R.G.G. Cattel, D.K. Barry, eds., Morgan Kauffmann, 2000.

32. J1.A. Калиниченко, «Стандарт систем управления объектными базами данных ODMG-93: краткий обзор и оценка состояния». // СУБД, № 1, 1996.

33. С.Д. Кузнецов. «Три манифеста баз данных: ретроспектива и перспективы». Доклад на конференции «Базы данных и информационные технологии XXI века», Москва, сентябрь 2003, http://www.citforum.ru/database/articles/manifests.

34. М. Аткинсон и др., «Манифест систем объектно-ориентированных баз данных», // СУБД, № 4, 1995.

35. Арк Андреев, Дмитрий Березкин, Роман Самарев, «Внутренний мир объектно-ориентированных СУБД». // Открытые системы, № 3,2001.

36. С.Д. Кузнецов. Объектно-ориентированные базы данных основные концепции, организация и управление: краткий обзор. // http://www.citforum.ru/database/articles/art 24.shtml

37. Рэнди Джей Яргер, Джордж Риз, Тим Кинг. MySQL и mSQL. Базы данных для небольших предприятий и Интернета. СПб.'.Символ-Плюс, 2000 - 560 с.

38. GIS In Telecomminications, USA, ESRI Press, 2001 120 с.

39. GIS For Everyone, USA, ESRI Press, 2003 160 c.

40. Designing Geodatabases, USA, ESRI Press, 2006-408 c.

41. Using ArcGIS Desktop, USA, ESRI Press, 2006 452 c.

42. Roger Tomlinson, Thinking about GIS: Geographic Information System Planning for Managers, USA, ESRI Press, 2007, 320 c.

43. George Korte, The GIS Book, USA, On Word Press, 2000 400 c.

44. Philippe Kruchten, The Rational Unified Process: An Introduction, Third Edition, USA, Addison-Wesley Professional, 2003 320 c.

45. Kurt Bittner, Use Case Modeling, USA, Addison-Wesley Professional, 2002-368 c.