Бесплатный автореферат и диссертация по географии на тему
Методы создания информационнгой базы банка данных "Приземная метеорология и климат"
ВАК РФ 11.00.09, Метеорология, климатология, агрометеорология

Автореферат диссертации по теме "Методы создания информационнгой базы банка данных "Приземная метеорология и климат""

ГОСУДАРСТВЕННЫЙ КОМИТЕТ СССР ПО ГИДРОМЕТЕОРОЛОГИИ

ОРДЕНА ТРУДОВОГО КРАСНОГО ЗНАМЕНИ ГЛАВНАЯ ГЕОФИЗИЧЕСКАЯ ОБСЕРВАТОРИЯ им. А.И. ВОЕЙКОВА

На правах рукописи

СИВАЧОК Сергей Григорьевич

УДК 551.501:681.3.067

МЕТОДЫ СОЗДАНИЯ ИНФОРМАЦИОННОЙ

БАЗЫ БАНКА ДАННЫХ «ПРИЗЕМНАЯ МЕТЕОРОЛОГИЯ И КЛИМАТ»

11.00.09 — метеорология, климатология, агрометеорология

Автореферат диссертации на соискание ученой степени кандидата физико-математических наук

ЛЕНИНГРАД — 1990

Работа выполнена во Всесоюзном научно-исследовательской институте гидрометеорологической информации - Мировой центре данных

Научный руководитель:

доктор физико-математических наук, профессор Г.В.ГРУЗА

Официальные оппоненты:

доктор физико-математических наук, старший научный сотрудник В.А.РОЖКОВ

кандидат физико-математических наук Ю.В.ЖИТОРЧУК

Ведущая организация:

Ленинградский гидрометеоролог-гический институт

Защита диссертации состоится "Ц"

1990 года в

"^2" часов на заседании специализированного Совета Д 024.06.01 в Ордена Трудового Красного Знамени Главной геофизической обсерватории им.А.И.Воейкова по адресу: 194018, г.Ленинград, ул. Карбышева,?.

С диссертацией можно ознакомиться в библиотеке Главной геофизической обсерватории им. А.И.Воейкова.

Автореферат разослан

1990г.

Ученый секретарь специализированного совета доктор географических наук, профессор ^ .

Н.В.К0БШ1ЕВА

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. Повышении точности и качества наших знаний о законах развития атиосферных процессов способствует широкое внедрение новых технических средств, совершенствование методов исследований, применяемых в системе Госкомгидро-мета СССР. Однако, в конце 70 - начале 80-х годов наметилось противоречие между возможностями, которые предоставляет для климатологов и других потребителей метеоинфориации новое поколение вычислительной техники - электронно-вычислительные машины Единой серии (ЭВМ ЕС), и состоянием информационной базы по метеорологии. Информационная база формировалась, в основном, за счет результатов первичной обработки данных наблюдений на ЭВМ. Период после перевода сети на 8-срочные наблюдения условно можно разделить на три этапа, соответствующих трем поколениям автоматизированных систем первичной обработки (1966-1976гг., Т977-1984гг.. с 1985 года по настоящее время). Из-за различия на этапах типов носителей данных и форматов хранения отсутствовала техническая возможность одновременной работы с накопленной информацией за весь период восьмисрочных наблюдений.

Данные наблюдений по 1976 год находились на перфокартах, и для облегчения доступа к.хранимой на них информации была начата перезапись перфокартотеки на магнитные ленты (МЛ) ЭВМ ЕС. Относительно доступности данных за 1977-1984 годы, размещенных на МЛ ЭВМ "Минск-32", вопрос оставался открытым из-за проводимого технического переоснащения отрасли. Общий объем хранимой на них информации достиг 20 млрд. десятичных знаков и в два раза превысил объем данных за 1881-1961 годы, хранимых на технических носителях. Информация за 1985 и последующие годы после обработки на ЭВМ заносилась на МЛ ЭВМ ЕС. При этом за первый этап данные были в климатическом виде, а за второй и третий - в квазисиноптическом. С каждым последующим этапом расширялся и состав хранимых метеовеличин. Поэтому простая перезапись данных с одного носителя на другой еще не давала возможности совместной обработки данных даже за период проведения восьмисрочных наблюдений.

■ Таким образом, наличие больших объемов накопленных дан-

ных, с одной стороны, и ограниченное (практически отсутствующее) их одновременное использование, с другой стороны, выдвинули проблему доступа к ним на первый план. Все это в конечном счете влияло на эффективность работы с данными и, соответственно, на качество проводимых климатических обобщений и ряда других работ, связанных с обслуживанием народнохозяйственных организаций.

Определение очередности (порядка) создания единой базы данных за весь период наблюдений, ее структуры, мер по сокращению разрыва между современными средствами обработки данных и доступностью уже накопленных стало актуальной задачей. При ее успешном решении возможен выход на новый уровень исследований и развития климатологической обработки данных наблюдений. Единый подход к решению задач такого класса связан с принятием в Госкомгидромете СССР концепции режимно - справочных банков данных (РСБД) с единым языком описания гидрометеорологических данных (ЯОД). Информационная база, создавамая на третьем этапе, а также получаемая в результате переписи пер-фокартотеки за 1966-1976 годы, соответствует требованиям РСБД. Информация за 1977-1984 годы оставалась недоступной для обработки средствами РСБД.

Цель диссертационной работы заключается в создании методов и алгоритмов формирования информационной базы метеорологических данных за 1977-1984 годы в стандартных форматах Гос-комгидромета (ЯОД) и обеспечении возможности автоматизированного доступа к формируемым данным.

Для достижения поставленной цели необходимо решить следующие основные задачи:

1. Исследовать особенности имеющихся архивов 8-срочной метеорологической информации и алгоритмы их получения. Разработать классификатор информационных баз.

2. Разработать методы и алгоритмы оптимизации и рационализации технологий создания и пополнения информационной базы и инвертирования архивов из квазисиноптического вида в климатический.

3. Провести испытание разработанных методов на примере создания т-ехнологии получения информационной базы метеостанций международного обмена за 1976-1984 годы и исследовать

возможность прииеиения этой технологии для преобразования данных со веек метеостанций СССР.

4. Выполнить анализ объемно-временных характеристик поступающих запросов на иетеоинфорыацию и определить на этой основе состав и типовую структуру информационной.базы, ориентированной на работу по запросам.

5. Разработать методику оценки трудоемкости выполнен«., запроса в базе данных произвольной структуры.

Научная новизна работы состоит в следующей: разработаны алгоритмы и технология преобразования архивов, созданных на ЭВМ "Минск-32", в архивы стандартного формата для системы Госкомгидромета СССР;

получены аналитические зависимости общего времени переупорядочения (инвертирования) архивов данных от характеристик ЭВМ;

разработана методика определения состава проектируемой базы данных, ориентированной на работу по запросам;

разработана методика определения структуры проектируемой базы данных;

разработана модель выполнения запроса в информационной базе, на основе которой создана методика оценки трудоемкости выполнения запросов в базе данных произвольной структуры;

получены аналитические выражения трудоемкости выполнения запросов в зависимости от структуры архива, объема запрашиваемых данных.

При разработке методов создания информационных баз получены следующие новые практические результаты:

созданы архивы суточного и срочного разрешения за 19771984 годы по всем станциям СССР, включая данные советских станций Антарктиды;

дополнены временные ряды существовавших архивов суточного и срочного разрешения данными наблюдений за 1977-IЭв^ годы;

разработаны средства формирования архивов и доступа к созданный архивам;

унифицирована система получения на ЕС ЭВМ информации метеостанций, прошедших ранее обработку на ЭВМ "Минск-32".

Практическая ценность работы состоит в том, что, развивая

теоретические аспекты работы с большими пассивами данных и преломляя их в практическую плоскость, открыт автоматизированный доступ к накопленным данным. В частности, на основе разработанных методов создана информационная база за 1977-1984 годы по всем метеостанциям Советского Союза. Полученные в работе алгоритмы минимизации затрат на инвертирование архивов из квазисиноптического вида в климатический использованы в технологии преобразования архивов данных, которая внедрена и эксплуатируется в Вычислительном центре ВНИИГМИ-МЦД; полученные данные использованы при подготовке нового справочника по климату СССР. Результаты теоретических исследований по создании информационной базы метеостанций использованы при формировании информационной базы метеопостов.

Апробация работы. Основные результаты и положения диссертационной работы докладывались и обсуждались:

на научных семинарах Всесоюзного НИИ гидрометеорологической информации - Мирового центра данных (ВНИИГМИ-МЦД) в 1983-1989 гг. и Главной геофизической обсерватории им. А.И.Воейкова (ГГО) в 1989 году;

на заседаниях Ученого Совета ВНИИГМИ-МЦД и его секций (1983-1989гг.);

на Всесоюзном научном совещании "Состояние и перспективы развития прикладной климатологии" (ГГО им. Воейкова, 1988г.).

Объем и структура диссертации. Работа состоит из введения, четырех глав, заключения, списка литературы, 6 приложений и акта о внедрении. Общий объем работы 188 страниц машинописного текста, в том числе II страниц таблиц и иллюстраций, 16 страниц библиографии, включающей 128 наименований советских и зарубежных авторов, и 34 страницы приложений.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении рассмотрена актуальность работы, сформулирована цель и задачи исследования. Излагается краткое содержание работы по главам и приводятся новые научные результаты, полученные автором в процессе исследований.

В первой главе дан анализ состояния проблемы, приведена

краткая характеристика общей информационной базы данных по приземной метеорологии.

Результаты проводимых ежедневных метеонаблюдений на станциях СССР заносятся в таблицы месячной отчетности, а также на перфоленты, которые затем обрабатываются в Вычислительных центрах. Результаты обработки включаются в Государственный фонд данных о состоянии природной среды Госкомгидромета СССР (Госфонд), а также публикуются в виде режимно - справочных изданий (метеорологические ежемесячники, ежегодники и т.д.).

Информация в Госфонде хранится на листовом материале (таблицы, справочники, различные печатные издания и т.д.) объемом более 100 миллиардов десятичных знаков, перфокартах -более 500 миллионов штук, магнитных лентах различных типов ЭВМ. Ежегодное пополнение только основными видами данных, полученными из систем первичной обработки и размещенных на MJI ЭВМ ЕС, составляет: 2600 млн. байт метеорологической информации станций, 400 млн. байт - постов, 500 млн. байт гидрологической информации по рекам и каналам. Суммарное пополнение составляет около 4 млрд. байт. Значительное пополнение фонда наблюдается и по другим видан информации.

Таким образом, фонд характеризуется большим объемом информации, не претерпевающим серьезных изменений в процессе эксплуатации, кроме пополнения. Особое внимание уделено структуре данных. Делается вывод о том, что структура данных-простая и представляет серии однородных наблюдений или измерений, повторяющихся во .времени и пространстве. В информационной базе находится значительный объем данных, используе-' мых редко или вообще не используемых при существующих в настоящее время методах обработки.

Выполненный анализ ранее разработанных и функционирующих банков и баз данных, существующих архивов, зарубежного опыта в данной области показывает, что определяющей характеристикой баз данных становится время доступа к ним, которое зависит от типа используемого носителя, состава и структуры хранимой информации .

Появление новых средств вычислительной техники в начале 80-х годов создало предпосылки и условия для реализации сис-

темы обслуживания на ЭВМ ЕС. Магнитная лента, используемая в качестве основного носителя, дает возможность увеличить скорость ввода информации в ЭВМ в 60-120 раз по сравнении с пер-фокарточным вводом и при этом требует места для хранения информации одного и того же объема почти в 100 раз меньше, чем при ее размещении на перфокартах. Программное обеспечение ЭВМ типа ЕС с расширенным комплектом внешних устройств и стандартной операционной системой использует возможности, предоставляемые системой (утилиты, стандартные методы работы с магнитными лентами и дисками, обработка данных, пакеты прикладных программ и др.), разработанную во ВНИИГМИ-МЦД систему управления данными автоматизированной информационной системы обработки режимной информации (СУД АИСОРИ) с языком описания гидрометеорологических данных, пакеты программ статистической обработки (БИМ, SAS и др.), а также ряд специально разработанных программ. Принципиально новые возможности при обработке информации дает применение современных систем управления банками данных (СУБД).

Таким образом существенное изменение технических средств и растущие потребности на метеорологическую информацию требуют серьезной перестройки сложившейся системы обслуживания данными о состоянии природной среды. В системе Госкоигидроме-та СССР только в 1984 года начат переход на архивацию режимной информации на МЛ ЕС ЭВМ. К 1985 году накопившийся массив данных за истекшие 20 лет не был обобщен в виде справочных изданий. Новый справочник по климату начал выходить с 1987 года и содержит данные только no 1980 год включительно.

Общее состояние предполагаемой к использованию информации выдвигает на передний план проблемы организации доступа к ней с помощью средств вычислительной техники. А это возможно только на основе использования современных концепций в области обработки информации с учетом специфики метеорологических и климатических данных.

Вторая глава посвящена научно-методическим вопросам организации информационной базы.

Построение информационной базы в диссертации рассмотрено с помощью достаточно формализованного способа описания метеорологической и климатической информации. Совокупность резуль-

татов регулярных наблюдений над некоторой метеорологической величиной описана в виде массива типа Х»,нйт. Здесь индексы обозначают: S - номер станции, 3 - номер года, М - номер месяца, d -номер дня внутри месяца, t - номер срока. Такая структура записи означает, что по любой из S станций имеются данные за 3 лет, упорядоченные внутри каждого года по возрастанию номера месяца, т.е временные ряды или архив климатического типа. Тогда для кваэисиноптического типа можно записать Xfisd*, что означает наличие данных за любой из И месяцев по S станциям, упорядоченных внутри каждой станции по возрастанию номера дня этого месяца. Такое описание полностью отражает как физическую сущность представленной в архиве метеоинформации, так и ее структуру, поэтому последовательность индексов существенна не только при описании архива, но и при дальнейшей обработке.

В работе предложено собственно информационную базу (множество ИБ) банка данных по приземной метеорологии и климату разбить на классы. В качестве основного классообразущего признака выбрана активность обращения к хранимой информации. Множество ИБ подразделяется на ряд подмножеств, которые частично пересекаются, но в сумме не превышают объем множества ИБ. Введены понятия пассивной информационной базы (подмножество ПС), активной (подмножество АБМ), суперактивной (подмножество СА), оперативной (подмножество ОК). Например, подмножество АБМ - часть информационной базы (ИБ) банка данных "Приземная метеорология", входящего в сеть РСБД Госкомгидро-мета. Это подмножество создается с целью сокращения затрат времени на получение требуемых данных при проведении расчетов, а также при подготовке ответов на наиболее часто встречающиеся запросы.

С целью правильного выделения подмножества, которое адекватно поступающим запросам, в диссертационной работе проведен анализ таких запросов. При этом учитывалось:данные каких станций и в каком объеме привлекались к расчетам, за какие периоды требуется информация, какой средний объем запрашиваемой информации, какая степень ее обобщения и т.п..

В итоге разработана и описана в работе модель выполнения запроса на примере двух основных информационных баз - АБМ и

ИБ - с обоснованней структуры предлагаемой АБМ При этом сделаны следующие основные допущения:

ИБ содержит все сведения об измеряемых метеовеличинах и ежемесячно пополняется текущей информацией, поступающей от оперативно-производственных сетевых организаций. Информация, включаемая в ИБ, удовлетворяет требованиям ЯОД;

АБМ содержит лишь часть ИБ и пополняется значительно реже (ежегодно или даже I раз в 3-5 лет). АБМ может содержать результаты обобщений и расчетов по данным, содержащимся в ИБ, которые также соответствуют требованиям ЯОД;

запросы на метеоинформацию выполняются как с помощью АБМ, так и с помощью ИБ;

ряд запросов выполняются только в ИБ, т.к. АБМ ориентирована на наиболее часто встречающиеся запросы и содержит лишь часть ИБ.

Выбрав трудоемкость выполнения запроса в качестве основного критерия оптимальности выбора требуемой информационной базы, в работе приведен ее анализ. Трудоемкость выполнения запроса зависит от вида используемой базы и состоит из затрат ЭВМ и ручного труда обслуживающего персонала. Объем требуемых данных определяется по формуле:

V = Db-G'H-N-d, (I)

где Db- длина записи информационной базы, в которой выполняется запрос, N - количество требуемых станций, G,M,d - количество лет, месяцев и дней запрашиваемого периода. В практике работы широко используются архивы климатические и синоптические. Основное структурное различие между ними в порядке размещения данных на магнитной ленте. При отборе требуемой информации потребитель вынужден просматривать все встречающиеся записи, т.к. МЛ - носитель последовательного доступа. При выборке информации по запросу трудоемкость прямопропорцио-нально связана с количеством обрабатываемых лент и их длиной, причем количество может существенно, отличаться от того, какой архив - синоптический или климатический.

В диссертационной работе проведено исследование зависимости необходимых трудозатрат от структуры архива и адекват-

ности последней запросу. Приведены аналитические выражения для оценки времени на выполнение запроса в архивах синоптического t,0 и климатического ta„ типов.

Время выполнения запроса зависит не только от структуры архива, но и от его состава (перечня нетеовеличин, данные о которых включены в АБМ). Если АБМ содержит не все метеоале-ыенты, то ряд запросов не может быть выполнен с помощью АБМ и необходимо обращение к ИБ. Тогда среднее время выполнения запроса t3 можно рассчитать по формуле

t3 = Р А Б' ^ а к ♦ <I-PAB)t30 , (2)

где Рав - вероятность выполнения запроса в АБМ.

Выполнив ряд преобразований, получим:

Ру _____G_a:N_,__________________(з)

z„. "Dne-NA-G, - ЪМ

где индекс А относится к характеристикам используемого архива, 3 - к характеристикам запроса.

Эта оценка может служить критерием при включении того или иного элемента в АБМ. Если для произвольной 1-ой метеовеличины, имеющей вероятность запроса pt и длину Zt :

Pi Рн-

> --- , (4)

Hi z„.

то она должна войти в АБМ, в противном случае - нет.

В работе проанализировано более тысячи запросов, поступивших как в центры обработки, так и центры хранения. В результате ряда ограничений для рассмотрения оставлено 950 запросов, которые содержали требования на 1921 метеовеличину. Проведенные исследования показали, что в АБМ должен входить комплекс иетеовеличин, удовлетворяющих условию (4), а не отдельные метеовеличины. Для определения его состава, а также структуры АБМ согласно выбранной методике, было получено несколько количественных оценок. Например, для удовлетворения "среднего" запроса требовался комплекс из двух метеовеличин, 380 или 40% запросов содержали требования на один элемент, причем в 35% случаев этим элементом являлась температура воздуха, в 20% - осадки, в 19% - скорость ветра. Комплексные запросы в работе расчленялись, и определялась частота обраще-

ний к каждой из указанных метеовеличин.

Однако частота обращений не может служить единственной оценкой для включения метеовеличин в комплекс. Объемы памяти, занимаемые каждым элементом, существенно отличаются, поэтому правильнее определять частоту обращения к иетеовеличине в пересчете на один байт хранимой информации.

Еще одной важной характеристикой запроса является степень обобщения информации, необходимая для его выполнения. Анализ поступивших запросов показал, что почти 80% запросов содержат требования на различные статистики. На основе Формализованного описания запросов в диссертационной работе определен порядок проведения расчетов с учетом нелинейности некоторых характеристик, а также наличия хранимых метеовеличин. При обобщении полученных результатов показано, что в 49% запросов необходимо выполнить статистические операции по данным срочного разрешения, при этом в 30-40% случаев требуется еще выполнение минимум одной операции, чаще по (1 или М. 30% от общего числа запросов требуют выполнения статистических операций по (1. Среди проанализированных запросов всего 10-15% требовали проведения обработки по (1 при длине ряда более 15 лет.

Результаты проведенного анализа с точки зрения количества станций, необходимых для удовлетворения запроса, показывают^ что в среднем необходима информация с 25 станций. 87% запросов может быть выполнено с привлечением данных до 50 метеостанций. Проведенный анализ также показал, что для большинства из рассматриваемых запросов на метеорологическую информацию (72%) достаточно данных за период менее 15 лет, лишь 5% запросов требуют данные более чем за 30 лет. В среднем для удовлетворения запроса требуются данные за 14 лет.

Используя приведенные выше значения, сравним объемы информации, которые необходимо обработать для реализации среднего запроса в архивах климатического и квазисиноптического типов. В результате получен вывод: в архиве климатического типа, даже без учета затрат на стандартную климатологическую обработку, общоч количество вовлекаемой в процесс выборки информации почти в два раза меньше, чем в синоптическом. Если рассмотреть полный архив по территории СССР, где Ид = 3500

станций, то разница составит 18-20 раз.

С учетом полученных результатов сформирован и представлен в виде таблицы перечень метеовеличин для включения в информационную базу.

Перечень метеовеличин для включения в ЛБМ

Р1

Метеовеличины : — • 10

г

Температура воздуха 54

Скорость Ветра 58

Осадки 25

Направление ветра 15

Влажность воздуха 10

Облачность 7

Температура почвы 6

Высота снежного покрова 5

Видимость 5

Атмосферное давление 4

+

- содержит несколько характеристик.

Таким образом, проведенный анализ показал, что в состав предлагаемой информационной базы должны войти не более 10 метеовеличин из рассматриваемых и хранимых в составе ИБ. В таком варианте длина информационной записи уменьшится почти в 2 раза, а поэтому уменьшится и объем всего архива.

В главе 3 на основе выводов,полученных во второй главе, рассматриваются методы и алгоритмы построения информационной базы банка данных "Приземная метеорология и климат". С целью обеспечения доступа к данный за 1977-84 Годы для лшбого пользователя предложено выделить следующие этапы■

получение МЛ ЕС ЭВМ в формате ЯОД с данными, идентичными данным на МЛ ЭВМ "Минек-32";

выборка необходимых данных в соответствии с полученными выше требованиями;

формирование климатических рядов по каждой станции за имеющийся период наблюдений.

Для третьего этапа потребовалось провести работу по определению характеристик технологии переупорядочения данных, размещенных на большом числе ИЛ. С этой целью в диссертации выведено аналитическое выражение для общего времени выполнения всей работы (Т):

2-N-R-JMi, 2-R N-t,

Т = И-( tv ♦ —-..........♦ N U M — ♦ — ) ♦

(V + p-mt)-o u fi

2R N-t„ M

* 2J3-M( — ♦ — + t, Jlot« - ♦ u p m4

M

♦ N H C(tinp>+tiKOH>) ♦ (tinP>+tiKO">)Î091, - )j (5)

, • m i

где R и U - длина МЛ и скорость ее просмотра; V - объем памяти пряного доступа; (П^.Ш - количество совместно используемых MJI на первом и последующих этапах; t(ПР\t<KD" \ t„,t, - время работы процессора, каналов и других устройств используемой ЭВМ.

Общее время работы Т, как функция количества одновременно обрабатываемых МЛ на разных этапах, имеет минимум. В диссертационной работе приведены графики зависимости Т от IBi при нескольких заданных значениях буфера V и количества m на втором и последующих этапах, с их помощью получены параметры технологии ffli и 1Т\, минимизирующие выражение (5). Причем в условиях реальной конфигурации ЭВМ и доступных ресурсов показано, что переупорядочение данных на большом количестве МЛ целесообразно проводить в несколько этапов, последовательно объединяя данные в группы с требуемым порядком. В зависимости от особенностей логического преобразования и доступных вычислительных ресурсов (количество лентопротяжных механизмов (ЛПМ), память на магнитных дисках) на первом этапе необходимо осуществлять упорядочение данных внутри групп определенного объема, оптимальный выбор которых может дать общее снижение затрат времени на выполнение технологии до 30-^0%.

Полученные результаты также показали, что при разработке

и подготовке технологии к внедрению необходимо на первой этапе получить достаточную память под буфер, не стремясь увеличивать число совместно используемых магнитных лент больше 2-3. На втором и последующих этапах, наоборот, необходимо использовать максимально возможное количество МЛ. Таким образом, возможно и необходимо используемый дефицитный ресурс (память пряного доступа на магнитных дисках и ЛПМ) разнести на разные этапы.

Проведенная теоретическая проработка указала ^а необходимость автоматизации в управлении и принятии решений при сбоях, а также введения и использования специальных контрольных точек. Структурный подход, примененный при разработке технологии и программного комплекса, обеспечил возможность корректировки и настройки в процессе опытной эксплуатации и работы, позволил создать полноценный архив, а также повысить уровень сервиса обслуживающего персонала.

Четвертая глава посвящена построению информационной базы по разработанной методике.

Описанный выше подход реализован в технологии получения БД. На первом этапе проводился отбор необходимых метеовеличин и формирование упорядоченных по заранее определенному закону МЛ с информацией за квартал, на втором и последующих этапах проводилось слияние информации по каждой станции с получением на выходе файлов с информацией по каждой станции за весь период обработки. Полученная база данных была использована для расчета таблиц нового "Климатического справочника СССР". За счет применения элементов автоматизированного управления (справочники, обработка "сбойных" ситуаций и т.д.) удалось сократить затраты ручного труда по сопровождению технологии и ускорить получение требуемого результата - МЛ ЕС с метеорологической информацией 8-срочных наблюдений ( 223 станции международного обмена за один месяц).

Для повышения уровня обслуживания пользователей разработана и представлена в диссертации автоматизированная система по составу оперативно-производственных сетевых организаций Госкомгидромета СССР. С помощью введенного в ЭВМ классификатора видов наблюдений и работ в наземной подсистеме получения данных можно подобрать по требуемым условиям (местоположение,

период и программа наблюдений, тип, комплекс наблюдений, координаты и т.д.) необходимые станции и посты. Сформулировано требование о дополнении существующей базы данными о наличии и месторасположении всей накопленной по этой станции информации. Система реализована на базе стандартной системы управления банком данных SQL/DS в доступном для пользователя-непрограммиста виде. Разработано более 30 процедур, позволяющих в диалоговом режиме использовать имеющуюся информацию. Для пользователя-программиста с помощью стандартного языка SQL несложно составить запрос на требуемую информацию.

Во второй части главы намечены пути дальнейшего использования полученной информации при переходе на новые технические средства: персональные компьютеры, лазерные оптические диски типа WORM и ленточные носители нового поколения - картриджи. Показано, что выбранный формат и структура позволяют пользователю работать с информацией на персональной ЭВМ, включенной в сеть с ЭВМ типа ЕС.

В заключении приводятся основные результаты работы, полученные в процессе исследования:

1. На основании анализа поступивших запросов на метеоинформацию сформулированы требования к структуре и составу информационной базы и разработана методика определения структуры проектируемой базы данных.

2. Выделены классы информационных баз (ИБ> в зависимости от предполагаемой активности обращения к ним. Разработан алгоритм определения состава ИБ, ориентироьанной на работу по запросам. На основании анализа более тысячи запросов получены рекомендации по объему и составу требуемой ИБ, а также вывод о том, что в базу должен входить комплекс метеовеличин, а не отдельные иетеовеличины.

3. С точки зрения минимизации времени обработки на ЭВМ с учетом имеющихся ресурсов выведены формулы для определения общего времени переупорядочения в зависимости от числа этапов, количества имеющихся лентопротяжных механизмов, объема доступной памяти прямого доступа, ряда других факторов. Определены характеристики и разработана технология переупорядочения данных, размещенных на большом количестве магнитных лент, с учетом полученного вывода о необходимости формирования ий-

формационной базы в климатической виде.

4. Разработаны алгоритмы и технология преобразования архивов, созданных на ЭВМ "Минск-32", в формат стандартного для системы Госкоыгидромета языка описания гидрометданных (ЯОД). По данной технологии получен и включен в состав банка данных "Приземная метеорология и климат" архив данных наблюдений на метеостанциях ТММ1 за 1977-1984 годы по всей территории СССР. Создание такой технологии позволило в 3-4 раза сократить время обработки МЛ ЭВМ "Минск-32" на ЕС ЭВМ, обеспечить полную перезапись данных за счет реализации механизма пропуска "сбойных" станций с последующей дозаписью.

5. Разработана методика оценки трудоемкости выполнения запроса в базе данных произвольной структуры.

6. Используя полученные в рамках диссертационной работы методы создания ИБ, на ЭВМ ЕС разработаны и внедрены технологии получения архивов данных наблюдений за 1977-84 годы. С ПОМОЩЬЮ этих технологий сформировано два архива по станциям международного обмена, суточного и срочного разрешения, за 1977-1980 годы, которые затем были объединены с имевшимися архивами за 1966-1976 годы и использованы для расчета таблиц Справочника по климату СССР. Созданы архивы суточного и срочного разрешения по всем станциям СССР, включая данные советских станций Антарктиды, эа 1977-1983,84 годы. Один файл содержит данные за один год по определенному перечню станций. На базе технологии перезаписи информации метеостанций, используя возможности, предусмотренные при разработке программного обеспечения, реализована технология перезаписи информации метеопостов. Это позволило сократить затраты на разработку программного обеспечения и обучение технического персонала .

7. Сокращены затраты машинного времени, труда диспетчеров и операторов ЭВМ при переформировании архива квазисиноптического вида в климатический за счет проведенной оптимизации и использования дефицитных ресурсов ЭВМ (магнитные диски, ленты) на разных этапах. Получены численные значения количества требуемых лентопротяжных механизмов и дисковой памяти в зависимости от имеющихся ресурсов ЭВМ. Применение обоснованных в диссертации и апробированных на практике технологичес-

ких решений позволило повысить качество проводимых климатологически х исследований и обслуживания потребителей, улучшить эксплуатационные характеристики систем обработки и обслуживания.

В приложениях представлены описания наиболее важных архивов данных на "старых" носителях за период с 1881 по 1984 годы, наиболее характерные запросы и потребители климатической и метеорологической информации, ЯОД-описание одного из созданных архивов.

Основные результаты диссертации опубликованы в следующих работах:

1. Гусаров С.Д., Сивачок С.Г., Степаненко С.Р., Шаймар-данов М.З. Выбор состава и структуры активной информационной базы банка метеорологических данных //Метеорология и гидрология. - 1983. - № 12.. - С. 103-10?.

2. Сивачок С.Г., Степаненко С.Р. Основные принципы формирования и структура архива данных наблюдений на метеостанциях СССР за 1977 - 1984 годы в формате ЯОД на магнитных лентах ЕС ЭВМ /ВНИИГМИ - МЦД. - Обнинск,1988. - 13с. - Деп. В ИЦ ВНИИГМИ - МЦД 10.02.89 № 878гм.

3. Сивачок С.Г., Степаненко С.Р. Технология создания и алгоритмы получения значений элементов архива восьмисрочных метеорологических наблюдений на станциях СССР за 1977-1984 годы на магнитных лентах ЕС ЭВМ / ВНИИГМИ - МЦД. - Обнинск,1988. - 30с,- Деп. в ИЦ ВНИИГМИ - МЦД 10.02.89 № 879гм.

4. Гусаров С.Д., Сивачок С.Г., Шаймарданов М.З. Оптимизация технологии переупорядочения многотомных массивов метеорологических данных //Тр. ВНИИГМИ - МЦД. - 1985,- Вып.127,-С.91-100.

5. Сивачок С.Г., Степаненко С.Р., Тихомирова Л.Г. Банк данных о характеристиках оперативно - производственных сетевых организаций Госкомгидромета СССР //Тр. ВНИИГМИ - МЦД. -Вып. 154 (в печати).