Бесплатный автореферат и диссертация по географии на тему
Методика и технология первичной обработки на ПЭВМ гидрометеорологической информации, поступающей в символьной и бинарной формах
ВАК РФ 11.00.09, Метеорология, климатология, агрометеорология
Автореферат диссертации по теме "Методика и технология первичной обработки на ПЭВМ гидрометеорологической информации, поступающей в символьной и бинарной формах"
ггод
1 ь ¡995
На правах рукописи
ЛУБОВ Сергей Викторович
МЕТОДИКА И ТЕХНОЛОГИЯ ПЕРВИЧНОЙ ОБРАБОТКИ НА ПЭВМ ГИДРОМЕТЕОРОЛОГИЧЕСКОЙ ИНФОРМАЦИИ. ПОСТУПАЮЩЕЙ В СИМВОЛЬНОЙ И БИНАРНОЙ ФОРМАХ
11.00. 09 - метеорология, климатология, агрометеорология
Автореферат
диссертации на соискание ученой степени кандидата физико-математических наук
МОСКВА - 1995
Работа выполнена в Научно-производственном объединении "ПЛАНЕТА"
кандидат технических наук, старший научный сотрудник В.Д. Жупанов
доктор физико-математических наук, профессор Н.Ф. Вельтищев,
доктор физико-математических наук' Г.Ф. Тулинов
Ведущая организация: Всероссийский научно-исследовательский институт гидрометеорологических данных-Мировой центр данных
Защита состоится "30." 1995 г. в часов на
заседании Дцссертаишинопо совета К 024.05.02 Гидрометеорологического научно-исследовательского центра Российской Федерации по адресу: 123242, ■ г.Москва. Б.Предтеченский пер. д.9-13.
С диссертацией можно ознакомиться в библиотеке Гидрометцентра России.
Автореферат разослан " ^" г.
Научный руководитель:
Официальные оппоненты:
Ученый секретарь Диссертационного совета.
кандидат географических наук (¡¡-(.С^у А. И. Страшная
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы.
Персональные ЭВМ и рабочие станции, основанные на мощных микропроцессорах серии Intel, стали основой информационных систем обработки данных. Широкое применение ПЭВМ, их доступность, развитое системное и прикладное математическое обеспечение явились причиной того, что системам обработки данных на персональных ЭВМ уделяется в последнее время много внимания.
Реализация на ПЭВМ первичной обработки оперативных данных наземных и спутниковых измерений имеет ряд существенных особенностей, основными из которых являются: значительное разнообразие поступающей информации (данные гидрометеорологических наблюдений в кодах FM. данные дистанционного зондирования со спутников в растровой форме, результаты численных анализов и прогнозов в кодах GRIB, BUFR); необходимость совмещения во времени операций приема, накопления и обработки данных в режиме реального времени; случайный характер поступления различных типов данных: наличие в текстах поступающих сообщений значительного числа синтаксических ошибок, что вызывает необходимость визуального контроля и интерактивной корректировки ошибок. '
Принципиальным для такого рода систем является возможность приема высокоскоростных транспортных потоков, как правило в ОС UNIX . Система обработки данных на основе ПЭВМ в этом случае строится на базе локальной сети ПЭВМ или для этой цели применяется супер-ПЭВМ с многопользовательской операционной системой. Очевидно, что применение многопользовательской системы дает существенные преимущества по сравнению с локальной сетью, как по эффективности, так и по затратам на создание и эксплуатацию системы.
Цель работы и запячи исследования.
Целью работы является создание методики первичной обработки гидрометеорологической информации, поступающей в различных формах ( символьной и бинарной ) и с различной интенсивностью (от 2400 бит/с - данные наземных наблюдений, до 2.56 Мбит/с -цифровые данные метеорологических ИСЗ ). При выполнении работы поставлены и решены следующие задачи:
1. Построение процедурного языка описания основных кодовых форм FM WM0 и создание на его основе программного обеспечения декодирования текстов метеорологических сообщений, поступающих по линиям связи.
2. Разработка методики и Си-реализации первичной обработки бинарных кодовых форм BUFR и GRIB.
3. Создание математического обеспечения специализированной базы оперативных данных, обеспечивающей накопление информации, доступ к данным и текущий мониторинг их поступления.
• 4. Разработка аппаратных средств и системного математического обеспечения для ввода и разбора транспортных потоков большой интенсивности (цифровой информации метеорологических ИСЗ).
5. Организация информационного обеспечения пользователей на базе сетевого интерфейса TCP/IP.
Научная новизна работы заключается в слеующем:
- разработана методика, алгоритм и программная реализация процедурного языка описания и декодирования символьных текстов метеорологических сообщений; показана достаточность предложенных языковых средств для надежной интерпретации основных кодовых форм FM ВМО;
- предложена Си-реализация первичной обработки бинарных информационных потоков, включая код GRIB и коды, используемые при передаче цифровых данных метеорологических ИСЗ;
- на базе ПЭВМ и мультипользовательской операционной системы реализована технология, обеспечивающая в масштабе реального времени прием, обработку и накопление данных;
Практическая значимость работы:
- реализована технология первичной обработки гидрометеорологической информации, поступающей по каналам ГСТ, формирования в режиме реального времени специализированной базы данных:
- разработаны, прошли опытную эксплуатацию аппаратные средства и специализированное системное математическое обеспечение "прозрачного" ввода информации в ПЭВМ для метеорологических ИСЗ METEOSAT, N0AA; предложена и апробирована эффективная технология ввода и первичной обработки на ПЭВМ информационных потоков интенсивностью до 10 Мбит/сек:
- разработаны и апробированы программируемые контроллеры цифрового ввода и специализированное системное математическое обеспечение для ввода общеобъектовой, гелиогеофизической и телевизионной информации первого отечественного метеорологического ИСЗ ГОМС;
- создана распределенная вычислительная сеть, позволяющая доводить информацию до потребителей, включая Гидрометцентр Ро-сии и Институт прикладной геофизики;
- развито системное и доработано прикладное математическое обеспечение первичной обработки метеорологической информации в среде операционных систем MS-DOS и UNIX.
Созданная технология функционирует в рамках единого микропроцессорного комплекса обработки научной и объектовой информации НПО "ПЛАНЕТА".
На защиту выносится:
Методика, математическое обеспечение и ПЭВМ-реализация в среде мультипрограммной операционной системы и пользовательского интерфейса TCP/IP технологии первичной обработку гидрометеорологической информации, поступающей в символьной и бинарной формах.
Апробация работы. Основные положения и результаты диссертационной работы докладывались и обсуждались на Ученом совете, научных семинарах и конференциях Гидрометцентра России (Москва. 1989-1983 гг.). Всесоюзном семинаре "Системы экологического контроля вод" (Севастополь, 1991 г.). международном научном семинаре "Космический мониторинг" (Украина, Киев, 1993 г.), международном научно-техническом семинаре "Экологический мониторинг" (С-Петербург, 1993г.). Научно-техническом совете НПО "ПЛАНЕТА" при обсуждении результатов НИР (Москва. 1994-1995 гг.)
Публикации. Основные результаты диссертационной работы опубликованы в 10 печатных работах.
Структура и объем диссертации. Диссертация состоит из введения, четырех глав и заключения. Работа изложена на /¿¿страницах, включая 20рисунков. список литературы содержит Ц наименований, из них {Zna английском языке.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность темы, сформулированы цели и задачи исследования. Кратко излагается содержание работы по главам.
В первой главе изложена постановка задачи построения системы обработки данных наземных наблюдений на базе персональных ЭВМ. Дано общее описание системы; рассматриваются вопросы декодирования гидрометеорологических телеграмм, языка интерпретатора кодовых форм, организации оперативного хранения макетов декодированных телеграмм, обработки данных, поступающих в бинарной форме GRIB.
Вопросу первичной обработки и ее центральной части - процессу декодирования посвящено достаточно много работ. Предложенное нами решение задачи автоматического декодирования метеорологических сообщений развивает идею таблично-управляемого интерпретатора по следующим направлениям:
1) минимизация числа операторов языка декодирования:
- четыре оператора описания TAB. SOT. EÛT. EQU.
- один оператор управления IDN,
- один оператор преобразования ELM:
2) введение понятия уровня идентификации, отражающее логическое построение метеорологического сообщения: раздел, зона. группа, элемент;
3) переход от жестко закрепленного формата макета телеграммы к макету переменной структуры со страничной организацией;
4) создание транслятора для языка описания кодовых форм,
обеспечивающего автоматизированное построение управляющей таб- . лицы декодирования;
5) реализация табличного управления программой декодирования, совмещение функций декодирования с формированием и ведением файлов макетов метеорологических телеграмм:
6) разработка методологии и программного обеспечения локализации синтаксических ошибок и видеотерминальных средств их исправления.
В процессе декодирования синтаксические правила"идентификации и текстовая форма представления оперативных гидрометеорологических данных(кодовые формы) заменяются позиционным (табличным порядком) следования и машинно-ориентированным (2-байтовые положительные числа) способом записи информации в ЭВМ.
Текстовая таблица интерпретации представляет собой набор операторов языка интерпретации, которые позволяют описать кодовую форму и правила кодированных сообщений и распределить полученную информацию, в макете. В интерпретаторе используется бинарная таблица. Приведение к такому виду осуществляется в процессе компиляции текстовой интерпретирующей таблицы(рис.1). На этом этапе происходит контроль правильности составления таблицы и символьное, представление заменяется числовым.
Соэмещение функций интерпретации и контроля синтаксиса предполагает полное описание кодовой формы. Элементы, неподлежащие включению в макет, идентифицируются как пропускаемые, поскольку возмокен произвольный порядок следования групп (зон) в телеграмме.
- s -
ПРЕДСТАВЛЕНИЕ
до компиляции после компиляции
Оператор описания кодовой формы TAB type. Hievet, Npage. Save. Wordlength Otab, 1, TYPE. HL, NP. WL
Оператор идентификации IDN level, Etalon [.cicle] [.Region] Oldn, 1. level, n, Etalon. Region
Оператор обработки элемента ELM а, ъ [.cl Oelm. l,a, b, с
Оператор начала телеграммы SOT Osot, 1
Оператор окончания телеграммы EOT Ы, Ъ2. ... Ьп Oeot.. l.bj. b2. ... b„
Оператор эквивалентности кодовых форм EQU с/, с/г
Прим. 1 - длина поля оператора в байтах
Рис. 1 Список основных команд декодирования кодовых форм ГМ. передаваемых в символьном виде
Предложенный подход позволяет оперативно реагировать на изменения в кодовых формах. Дополнительные действия при появлении новых кодовых форм сводятся к редактированию текста соответствующей таблицы итерпретации.
Обработанные данные в виде значений в узлах регулярной сетки, представленной в бинарной форме, поступают по коду FM 92-VII GRIB. Такое представление данных обеспечивает минимальный объем при хранении и передаче, однако не годится, для визуального опознавания без компьютерной интерпретации. Распознавание и раскодирование информации возможно осуществить расширив функциональные возможности языка интерпретатора телеграмм в части работы с битовыми потоками.
Практика работы с бинарными кодами и, в частности, знакомство с громоздким программным обеспечением существующих программ декодирования (например, из НМЦ США) показало, что при некоторых ограничениях (обработка данных небольшого, до 5. числа центров) более эффективно использование структурных возможностей алгоритмических языков (рис. 2 ). В этом случае база данных бинарной информации состоит из двух файлов: файла данных (сообщений) и файла описания. Файл сообщений содержит информацию в коде GRIB, выделенную из общего потока поступающей информации. .Файл описания представляет раскодированную описательную часть, которая содержится в разделе 1 кода, с указанием адреса записи каждого сообщения.
Раскодированные данные в узла* регулярной сетки передаются пользователям в согласованном формате. В передаваемых данных содержится раскодированная информация раздела определения
- H -
/.------
/* /*
struct ( unchar unchar unchar unchar unchar unchar unchar unchar unchar unchar unchar unchar unchar unchar unchar unchar unchar
PRODUCT DEFINITION SECTION ( PDS )
ProductSec /« Octet No
PDS Content
length[3]; ver tab2;
ident_centr; /»
modalident; grid_No; flag-; parametr_ind; level ind;
hp_levels[2];/*
year;
month;
day;
hour;
miíñ; .
t¿me;
Pi;
P2;
/* /• /* /• /* /* /• /•
I-3
4
5
6 7 в
9
10
II-12
13
14
15
16
17
18
19
20
Length in octets of PDS Parameter Table Version number Identification of center(TO) Generating process ID number Grid Identification Flag specifying presence GDS, BHS Indicator of parameter & 'units
Indicator pf type of level or layer*/
unchar tim«_lnd; /» 21 unchar
mean_quantity(2]; /
Height, pressure, etc. of level
Year of century
Month of year
Day of month
Hour of day
Minute of hour
Forecast tine unit(T4)
Period of time( 0 for analysis)
Time interval between successive
initialized analyses, undergoing
averaging or accumulation
Time range indicator(TS)
unchar absent_quan; /»24
unchar century; /»
unchar reserved; /» unchar coeff_D[2};' /*
22-23:Number included in average, when octet 21(TS) indicates an average or accumulation; otherwise set to zero Number Missing from averages or accumulations .
25 : Century of Initial(Reference) time
26 : Res'ervad - set to zerd
27-28: The Decimal scale factor D.
A negative value is indicated by setting the high order bit in octet 27 to 1
) Product,
*Pp;
Рис.2 Структура описания"1 раздела кода CRIB { "Си" j
продукции и. собственно, данные в естественном представлении (число с плавающей точкой).
Предложенная реализация оперативного накопления наземной гидрометеорологической информации базируется на разработанной специализированной базе данных для хранения макетов и средствах контроля поступления данных, созданных с использованием стандартной СУБД.
Высокая эффективность схемы выборки информации из специализированной базы основана на методе прямого доступа к файлам данных. Благодаря универсальности языка манипулирования данными вполне объяснимо применение в работе промышленных пакетов СУБД для формирования табличных материалов, контроля поступления информации, периодических выборок данных и других работ с невысокими требованиями ко времени реакции системы. Примером построения баз данных такого класса может служить разработанная в данной работе система обработки агрометеорологической, гидрологической и объектовой (с борта КА "ЭЛЕКТРО") информации.
Во второй главе рассматриваются аппаратные средства и системное математическое обеспечение для ввода и разбора транспортных потоков большой интенсивности. Рассмотрены различные подходы и предложено решение для основных операционных систем ( DOS, UNIX )
В качестве устройств ввода предложены универсальные контроллеры цифрового ввода (КЦВ). которые строятся на базе программируемых пользователем вентильных матриц (ППВМ) фирмы XI-llrix. Такой подход предоставляет системному интегратору возможность достаточно бистро создавать работоспособный образец заду-
манной,схемы. Это достигается тем, что структура элементов схемы и связи между ними хранятся во внутреннем оперативном запоминающем устройстве статического типа и могут быть легко изменены повторной загрузкой, В программу начальной обработки, обычно это предпроцессор системы первичной обработки, загружаемую в ОЗУ ППВМ. закладываются функции структуризации бинарного входного потока (бит-синхронизатор - выравнивание цифрового потока на границу слова и синхронизатора кадра - поиск псевдослучайных последовательностей (ПСП)). Дальнейшая передача информации в ПЭВМ производится кратно кадрам, что существенно упрощает реализации программного обеспечения предварительной обработки данных.
Для работы с данными в режиме реального времени на уровне ядра операционной системы готовится совокупность программ -драйвер устройства.
Драйвер устройству ввода информации в ПЭВМ состоит из секций открытия [dma7_open()), чтения информации[dma7_read()] и закрытия [dma7_close01. а также Функции копирования, использующейся в секции чтения.
В секции открытия вычисляется физический адрес блока оперативной памяти, зарезервированного для обмена, задается режим взаимодействия устройства ввода с памятью и выполняется активация канала ПДП. Для этого в ОС UNIX существует несколько Функций:
- функция захвата канала ПДП
dma_alloc( channel, mode,)»
s.
где chaunel - номер канала ПДП (при вводе информации ИСЗ обычно используются каналы 5-7),
mode - режим работы, задающий ожидание освобождения
канала или немедленное возвращение управления в вызывающую программу, если запрашиваемый канал уже захвачен другим драйвером,
- функция задания параметров для работы с ПДП. маскирует линию запроса ПДП на контроллере, устанавливает адреса и счетчики параметров, устанавливает режим чтения/записи
dma_param( channel, mode, addr, cnt ),
где channel - номер канала ПДП.
mode - DMA_Wrmode. для режима записи (из памяти
в устройство) DMA_Rdmode. для режима записи (из устройства в память).
addr - физический адрес памяти для чтения/записи.
cnt - число байт-1 для пересылки.
Результатом работы данной функции является инициализация канала ПДП.
Интересным представляется определение физического адреса в памяти, т.к. эти процедуры для ОС UNIX практически не документируются. Физический адрес в памяти вычисляется следующим образом:
addr_ph - ( kvtopfn( addr_log )« 12 + poff( addr_log ).
где addr_ph - физический адрес оперативной памяти(ОП). kvtopfn - системная функция пересчета логического (виртуального) адреса в номер физической страницы ОП. addr_log - логический адрес ОП.
poff - функция определения смещения в странице ОП.
- функция разрешения работы,
dma_enable( channel ),
где channel - номер канала ПДП.
В результате работы - получение разрешения на передачу информации.
Функция копирования запускается регулярно и предназначена для передачи информации из буфера ПДП в промежуточный буфер памяти, расположенный в ядре. Наличие промежуточного буфера позволяет исключить потери данных: в него через определенные промежутки времени ( достаточно малые, чтобы исключить потери) производится передача данных из буфера ПДП.
Секция чтения dma7_read() включает в себя передачу данных между ядром (промежуточным буфером) и буфером пользователя. Основой является обращение к уже упомянутой функции:
copyoutt ptr_to_drlver_buffer, pt.r_to_user_.buffer, n ) ,
где n - число байт для персылки.
ptr_to_drlver_buffér - указатель на буфер драйвера.
ptr_to_user_buffer - указатель на буфер пользователя.
Секция закрытия dma7„elose() производит деактивацию канала ПДП путем обращения к системой функции dmajrelse(channel).
Разработанные контроллеры цифрового ввода и системное математическое обеспечение активно используются в комплексах приема и обработки ОНёратишэЯ информации метеорологических ВСЭ,
Третью главу составляют материалы по практической реализации технологии первичной обработки цифровой информации первого отечественного геостационарного ИСЗ. Рассматриваются вопросы Функционирования экспериментального микропроцессорного комлекса приема и обработки данных КА ЭЛЕКТРО (ГОМС) и организация информационного обеспечения пользователей на базе сетевого интерфейса TCP/IP.
Комплекс построен на основе высоконадежных компьютеров с процессорами Intel (486DX2-66, Pentium-90) фирмы Hewlett Packard. работающих под управлением операционной системы SCO UNIX 3.2.4 и предназначен для приема и обработки телевизионной, ге-лиогеофизической и общеобъектовой информации, поступающей со скоростью 2,56 Мбит/сек.
Значительный объем информации, ежесуточно принимаемой с КА ЭЛЕКТРО, как и объем обработанных данных, не позволяет обеспечивать хранение данных в полном объеме без специальных устройств архивации (BACKUP Systems). Предусмотрено оперативное хранение информации на 4 njm ленточных DAT-накопителях большой
емкости (HP Jetstore 50001). На этой базе.формируется оперативный циклический архив данных измерений ИСЗ. Копирование файлов моноспектральных данных оформляется в виде расписаний, включающих время копирования и параметры цикличности. Записи в расписании формируются по принципу:
mm hh dd MM wd gom3lr_cpy. sh где mm, hh, dd, MM. wd, - соответственно минуты, часы, день, месяц и день недели, gomslr.cpy.sh - имя исполняемого модуля копирования.
Расписание включается в общее расписание операционной системы, которая осуществляет абтономный запуск программ.
Для обеспечения быстрого поиска необходимой информации в базе данных по именам файлов вводится единый стандарт имен. Хранимая в файле информация идентифицируется заданием его имени в виде
MMddhhmm.SR[l-3], где MM. dd, hh. mm - месяц, день, часы и минуты проведения измерений. 1-3 - канал. Например, файл 02201230.SRI содержит Фрагмент ИК-изображения ИСЗ ГОМС за 20 февраля 12:30 ИСК.
Разделение информации по типам, форматное преобразование данных, формирование моноспектральных изображений подстилающей поверхности и ведение баз данных на сервере вычислительной сети осуществляется автоматически, одновременно с приемом информации.
При видеотерминальной обработке изображений используются как специально разработанные, так и стандартные графические пакеты в среде WINDOWS 3.1.
Информационное обеспечение пользователей осуществляется на
базе сетевого интерфейса ETHERNET. Результаты предварительной обработки через сетевые терминалы (протоколы TCP/IP, SLIP) передаются для последующей обработки в Гидрометцентр России и Институт прикладной геофизики. Пример ИК-изображения. полученного с ИЗС ГОМС приведен на рис.3.
В заключении сформулированы основные результаты диссертационной работы:
- Реализована технология первичной обработки гидрометеорологической информации, поступающей по каналам ГСТ. Функционирует в режиме реального времени специализированная база данных, обеспечивающая как оперативные ( обработка декадной агрометеорологической информации ). так и научно-исследовательские ( ежедневная передача декодированных данных GRIB ) задачи Гидрометцентра России.
- Разработаны, прошли опытную эксплуатацию аппаратные средства и специализированное системное математическое обеспечение "прозрачного" ввода информации в ПЭВМ для метеорологических ИСЗ METEOSAT, N0AA.
- Развито системное и доработано прикладное математическое обеспечение первичной обработки метеорологической информации в"среде операционных систем MS-DOS и UNIX.
- Разработаны и апробированы программируемые контроллеры цифрового ввода и специализированное системное математическое обеспечение для ввода общеобъектовой, гелиогеофизической и телевизионной информации метеорологического ИСЗ ГОМС.
Оборудование и математическое обеспечение апробированы и успешно эксплуатировались в составе комплекса наземной обраОот-
СЮМБ 1Я РгашеРНе:03150933.8Я2
' " Г*- ""■•..
, у. ■ -
..........• ыжа
.....-м* " ' йрШ
• А . й'.
--«Л V ■
^ • ' УМ*- • ■ *
V . '•-г.* 'л'гХ'&З^А, 'щцзг -
^ - , .<]
Е-л-лг.г.-. -г-...,... .1- .«.».; .-.Мадй;;....,,
ЯРА Р1апе1а, Оер. 1.4.2
Рис. 3 ИК-изображение с КА "ЭЛЕКТРО" (15 марта 1995 г., 900 НСК)
КИ КА "ЭЛЕКТРО".
Созданная технология функционирует в рамках единого микропроцессорного комплекса обработки научной и объ:ектовой информации НПО "ПЛАНЕТА"
По теме диссертации опубликовано 10 работ, основные из которых следующие: '
1. Лубов C.B. Оперативная схема накопления агрометеорологических данных в среде операционных систем семейства UNIX. Науч.Тр./ Гидрометцентр СССР, 1992, вып.317
2. Жупанов В.Д.,Лубов C.B..Бурцева Т.Н. Система обработки оперативной агрометеорологической информации на ПЭВМ. Науч. Тр./ Росгидрометцентр. 1993, вып. 327
3. Жупанов В.Д., Лубов C.B. Программные средства декодирования оперативной гидрометеорологической информации. Науч. Тр./ Росгидрометцентр, 1993, вып.327
4. Жупанов В.Д., Лубов C.B. и др. Реализация на ПЭВМ методики первичной обработки цифровой информации МИСЗ, Науч.Тр./ НПО "ПЛАНЕТА", 1993. ВЫП.43
- Лубов, Сергей Викторович
- кандидата физико-математических наук
- Москва, 1995
- ВАК 11.00.09
- Методика первичной обработки цифровой информации высокого разрешения с метеорологических спутников земли
- Разработка методов анализа и текущего прогнозирования эволюции зон осадков по данным МРЛ
- Разработка концепции комплексной системы гидрометеорологического обеспечения безопасности мореплавания на Каспийском море
- Синоптические процессы и явления погоды, влияющие на деятельность наземного транспорта в Республике Башкортостан
- Методика восстановления полей метеорологических величин по спутниковой информации