Бесплатный автореферат и диссертация по наукам о земле на тему
Исследование статистических характеристик временных рядовзначений приземной температуры воздуха
ВАК РФ 25.00.30, Метеорология, климатология, агрометеорология

Автореферат диссертации по теме "Исследование статистических характеристик временных рядовзначений приземной температуры воздуха"

Министерство образования и науки Российской Федерации ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ ГИДРОМЕТЕОРОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ»

(РГТМУ)

На правах рукописи

Восканян Карина Левановна

ИССЛЕДОВАНИЕ СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК ВРЕМЕННЫХ РЯДОВЗНАЧЕНИЙ ПРИЗЕМНОЙ ТЕМПЕРАТУРЫ ВОЗДУХА

Специальность 25.00.30. - метеорология, климатология, агрометеорология

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

2 Я НОЯ 2013

РГГМЫ

Санкт-Петербург 2013

005541368

005541368

Министерство образования и науки Российской Федерации ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ ГИДРОМЕТЕОРОЛОГИЧЕСКИЙ

УНИВЕРСИТЕТ» (РГГМУ)

На правах рукописи

Восканян Карина Левановна

ИССЛЕДОВАНИЕ СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК ВРЕМЕННЫХ РЯДОВ ЗНАЧЕНИЙ ПРИЗЕМНОЙ ТЕМПЕРАТУРЫ ВОЗДУХА

Специальность 25.00.30. - метеорология, климатология, агрометеорология

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

снга &

РГГМЫ

Санкт-Петербург 2013

Работа выполнена в ФГБОУ ВПО «Российский Государственный гидрометеорологический университет».

Научный руководитель - доктор физ.-мат. наук, профессор

А.Д. Кузнецов

Научный консультант - кандидат физ.-мат. наук, доцент

О.С. Сероухова

Официальные оппоненты - доктор физ.-мат. наук

И.А.Потапова;

кандидат физ.-мат. наук, доцент Ю.А. Довгалюк

Ведущая организация - Международный центр по окру-

жающей среде и дистанционному зондированию имени Нансена

Защита состоится » декабря 2013 г. в 1530 на заседании диссертационного совета Д212.197.01 при Российском Государственном гидрометеорологическом университете.

Адрес: 195196, г. Санкт-Петербург, Малоохтинский пр., 98.

С диссертацией можно ознакомиться в библиотеке Российского Государственного гидрометеорологического университета.

Автореферат разослан « ¿Г » ноября 2013 г.

Ученый секретарь диссертационного совета кандидат физ.-мат. наук

Л

Кашлева Л.В.

Общая характеристика работы

Актуальность и практическая значимость работы

Температура воздуха у поверхности земли является одной из важнейших метеорологических величин. Без знания фактического значения этой метеорологической величины, а также ее прогностического значения трудно себе представить жизнь и хозяйственную деятельность современного общества. В своей повседневной жизни мы интересуемся прогностическим ее значением вечером, планируя как свою одежду, так и свою работу, если она будет протекать на открытом воздухе. Утром мы выясняем фактическое значение этой температуры, тем самым уточняя ее прогностическое значение. В своей хозяйственной деятельности трудно себе представить тот случай, когда этот метеорологический параметр или его прогноз различной заблаговременности не учитывался бы в той или иной мере. Это коммунальные службы, авиация, дорожные службы, прогностические подразделения гидрометеослужбы, строительство, энергетика и многие другие виды хозяйственной деятельности.

Все выше сказанное определяет важность и актуальность исследования «поведения» этой метеорологической величины во времени и пространстве. Этим определяется актуальность и практическая значимость данной работы.

При исследовании приземной температуры атмосферного воздуха возможно как рассмотрение двухмерных полей этой метеорологической величины, так и временных рядов значений приземной температуры воздуха, измеренной в одном пункте. В данной работе рассматривались только временные ряды приземной температуры воздуха, измеренные с помощью современных автоматических метеорологических станций (AMC). Одной из особенностей данной работы является отказ от рассмотрения климатических характеристик приземной температуры воздуха, требующих наличия длинных временных рядов этой величины (при этом дискретность измерений может быть достаточно большой), а предлагается сосредоточиться на исследовании относительно небольших (по продолжительности общего времени измерения) временных рядов, но с малой дискретностью. Такая возможность появилась с внедрением в метеорологическую практику AMC, когда дискретность измерений может быть уменьшена вплоть до 10 с.

Цель работы состоит в получении и анализе статистических и других характеристик временных рядов значений приземной температуры воздуха, измеренных с помощью автоматических метеорологических станций, а также в исследовании возможностей применения аналитических методов к проведению текущего прогноза значений приземной температуры.

Основные задачи исследования:

- рассмотреть технические характеристики современных автоматических метеорологических станций общего и специального назначения;

- создать архив временных рядов приземной температуры воздуха, полученных с помощью AMC в Санкт-Петербурге и Ленинградской области;

- разработать и реализовать с помощью специально созданной для этой цели программы для ПЭВМ алгоритмы перевода текстовых значений данных с серверов, содержащих результаты измерений на AMC в Санкт-Петербурге и Во-ейково, в цифровую форму;

- разработать и реализовать с помощью специально созданной для этой цели программы для ПЭВМ алгоритмы контроля «качества» временных рядов и с их помощью исключить из архива данные, содержащие временные разрывы и выбросы;

- с использованием, как стандартных пакетов прикладных программ, так и специально созданных в процессе выполнения данной работы программ для ПЭВМ, произвести серию расчетов статистических характеристик временных рядов, соответствующих различным сезонам и пунктам измерения, и оценить доверительные интервалы для этих характеристик, а также произвести анализ полученных данных;

- разработать алгоритмы и подготовить соответствующую программу для ПЭВМ для расчета аддитивных составляющих временных рядов;

- на основе созданной программы и имеющегося архива данных исследовать поведение характеристик периодических составляющих временных рядов приземной температуры воздуха;

- исследовать, используя созданные для этой цели программы для ПЭВМ, точность текущего прогнозирования приземной температуры воздуха на основе аналитических методов проведения замкнутых численных экспериментов и дать практические рекомендации по их применению.

Исходные материалы и методика исследования^

- временные ряды приземной температуры воздуха, измеренные AMC в Санкт-Петербурге и поселке Воейково Ленинградской области;

- методики исследования статистических характеристик базировались на известных методах и подходах к их расчету с использованием как известных пакетов «Statistical и «Excel», так и созданных в процессе выполнения данной работы специализированных программ для ПЭВМ;

- методика оценки точности текущего прогнозирования базировалась на проведении замкнутых численных экспериментов на ПЭВМ с использованием данных натурных измерений приземной температуры воздуха в Санкт-Петербурге и Ленинградской области.

Научная новизна работы заключается в следующем:

1. Скорректирована методика контроля «качества » временных рядов приземной температуры, адаптированная к работе с данными AMC РГТМУ и ИРАМ.

2. Разработана методика выделения аддитивных составляющих временных рядов с использованием специально созданной для этой цели программы для ПЭВМ.

3. Разработаны методики проведения замкнутых численных экспериментов для оценки точности текущего прогнозирования приземной температуры воздуха и для их реализации созданы соответствующие программы для ПЭВМ.

4. Определены статистические характеристики временных рядов приземной температуры воздуха и исследованы их вариации в зависимости от объема выборки, сезона и места проведения измерений.

5. Проведено сопоставление синхронных измерений приземной температуры воздуха в мегаполисе и за его пределами.

6. Для каждого сезона оценены параметры периодических составляющих временных рядов приземной температуры воздуха и исследована их изменчивость в зависимости от объема выборки и места проведения измерений.

7. Разработана методика использования аналитических методов прогнозирования приземной температуры воздуха, и определены оптимальные схемы его проведения на основе этих методов.

Положения, выносимые на защиту:

1. Методика выделения периодических составляющих временных рядов приземной температуры воздуха.

2. Методики использования аналитических методов для проведения текущего прогнозирования приземной температуры воздуха и результаты, полученные при определении оптимальной схемы такого прогнозирования.

Личный вклад. В процессе выполнения данной работы автором были

- созданы и обработаны архивы данных с AMC Санкт-Петербурга и Ленинградской области, необходимые для проведения исследования;

- освоены методики и на их основе проведены расчеты статистических характеристик временных рядов приземной температуры;

- разработаны алгоритмы и составлены программы для ПЭВМ, позволяющие реализовывать разработанные методики.

Апробация работы. Результаты исследований докладывались на научных семинарах кафедры экспериментальной физики атмосферы в 2012-2013 гг., на Итоговой сессии Ученого совета РГГМУ в 2012 г.

Основные результаты диссертации опубликованы в двух печатных работах и одном учебном пособии, в том числе две публикации - в издании, рекомендованном ВАК.

Структура и объем работы.

Работа состоит из введения, 4 глав, заключения, списка использованной литературы - 8У наименований. В ней содержится страниц текста, 35 таблиц, 88 рисунков.

Содержание диссертационной работы

Во введении дано обоснование актуальности темы диссертационной работы, изложены цель и задачи исследования, отражена научная новизна и практическая значимость работы, а также определены положения, выносимые на защиту.

В первой главе рассматриваются структура, технические характеристики и особенности функционирования автоматических метеорологических станций различного назначения. Последовательно рассмотрены автоматические станции общего назначения (на примере АИИС «Погода» и AMC «НОВО»), аэродромные метеорологические станции (на примере AMC «KPAMC») и дорожные метеорологические станции (на примере АИИС «МетеоТрасса»). Кроме того, в этой главе подробно описана методика получения информации о временных рядах приземной температуры воздуха.

Рассмотрена методика формирования модельных временных рядов с заданными статистическими характеристиками. Так, например, с помощью приведенного ниже соотношения можно сформировать временной ряд температуры воздуха, у которого имеется линейный временной тренд, имитирующий погодные изменения температуры (прогрев воздушной массы), периодическая составляющая с периодом 24 часа и случайная составляющая, имеющая нормальный закон распределения с нулевым средним и среднеквадратическим отклонением,

равным 0.50 С,

T(i) = 10 + О.Обг + 5 • sin(—) + ( 2 • ln( - • cos(2rc • md{i-1))) ■ 0.5, (1) 24 rnd{i)

где 1=1,2,...— порядковый номер члена временного ряда, rnd - оператор получения псевдослучайных чисел, имеющих равномерное распределение на промежутке [0,1].

Также в этой главе приводится необходимая для создания архива технология получения реальных метеорологических данных, измеренных с помощью AMC «Погода» в Санкт-Петербурге (РГГМУ) и в поселке Воейково Ленинградской области (ИРАМ). Эта информация позволяет любому желающему сформировать свой собственный архив получаемых с помощью AMC временных рядов таких метеорологических величин как температура, влажность, скорость и направление ветра. При этом дискретность получаемых данных может колебаться от 1 мин до 6 ч (дискретность исходных данных от AMC «Погода» составляет 10

с).

Вторая глава диссертационной работы посвящена математическим аспектам анализа временных рядов приземной температуры воздуха. Для расчета статистических характеристик временных рядов приземной температуры воздуха по приведенным ниже формулам в работе рассчитывались следующие величины: среднее арифметическое (X), дисперсия (£>) и связанное с ней среднеквад-ратическое отклонение (а), коэффициент вариации (С), асимметрия (Ав) и эксцесс (£х), коэффициент корреляции (г^):

j N ] N

d= Ar ZO; ~Х)-2г a = D, C=°-100%, (2)

x

Ni=\

1 N , As= -,H(Xi-xY, Ex = No3 i=i

1 N <

-x)

No4 ,=i

-3.

N

_ , X/Ii (xi ~ x)0; ~ У)

■ух

ф)ф)

(3)

где N - длина временного ряда (количество значений в нем).

Для иллюстрации расчета статистических характеристик из временного ряда приземной температуры воздуха за май 2012 г. (рис. 1) были выделены три фрагмента: полный фрагмент, содержащий 14 суток (1440 измерений) и два дополнительных фрагмента, содержащих соответственно 1 (96 измерений) и 7 суток (672 измерения).

Рисунок 1. Фрагмент временного ряда приземной температуры воздуха за

май 2012 года

Кроме того, была произведена оценка полученных статистических характеристик, найдены значения критерия Стьюдента (?кр) и значения критерия

2 2

Пирсона (Х[ , %2) по уровням значимости а = 0.05, а = 0.95 и числом степеней свободы N-1 (с помощью пакета «Excel»). Затем по приведенным ниже форму-

лам найдены доверительные интервалы на уровне значимости 95% для среднего значения (х) и дисперсии (£>) (результаты расчетов представлены в табл. 1).

Ах = /кр ° , х-Лх(х(х + Дх, 0-А01 <£><£>■ М)2 (4)

где о - стандартное отклонение временного ряда, АО] = , Д£>2 = .

XI 12

Таблица 1. Статистические характеристики приземной температуры воздуха

Кол-во X Ме Ех Аз С,% 'ч> Дх х-Дккх + Дх ДО] ДДг 0-ДЙ|<0<й'А02

14 дн. 1440 12.3 11.5 -0.03 0.64 41.8 1.96 1.37 10.93 <* < 13.68 0.97 1.10 25.6 <0< 29.1

7 дней 672 9.8 9.3 -0.61 0.31 33,5 1.96 0.81 8.96 < х <10.59 0.92 1.10 9.8 < О < 11.8

1 день 96 6.2 6.5 -0.81 -0.58 17,7 1.98 0.25 5.99 < * <6.49 0.81 1.31 0.99 <£>< 1.6

В данной работе коэффициенты корреляции были рассчитаны с помощью программы «Г.ййг?». Результаты расчета автокорреляции для значений приземной температуры воздуха трех временных рядов (1,7,14 дней) за май 2012 представлены в табл. 2. Здесь же приводятся коэффициенты корреляции для значений «Т,/>> (приземной температуры и относительной влажности воздуха) и для «Г, Р» (приземной температуры и атмосферного давления).

Таблица 2. Значения коэффициентов корреляции

Шаг (15 мин) Коэффициент автокорреляции Коэффициент межрядовой корреляции «Г, />> Коэффициент межрядовой корреляции «Т, Р»

1 день 7 дней 14 дней 1 день 7 дней 14 дней 1 день 7 дней 14 дней

1 0.96 0.99 1 -0.90 -0.61 -0.46 -0.37 0.31 0.08

2 0.92 0.98 0.99 -0.91 -0.61 -0.45 -0.36 0.30 0.08

3 0.89 0.97 0.99 -0.92 -0.60 -0.45 -0.37 0.30 0.07

4 0.86 0.96 0.98 -0.90 -0.59 -0.44 -0.36 0.30 0.06

5 0.81 0.95 0.98 -0.88 -0.58 -0.43 -0.36 0.29 0.05

6 0.77 0.93 0.97 -0.86 -0.57 -0.42 -0.36 0.29 0.05

7 0.73 0.91 0.96 -0.82 -0.55 -0.41 -0.36 0.29 0.04

8 0.69 0.89 0.95 -0.78 -0.54 -0.40 -0.35 0.29 0.03

9 0.64 0.87 0.94 -0.74 -0.52 -0.39 -0.34 0.29 0.03

10 0.61 0.84 0.93 -0.70 -0.50 -0.38 -0.34 0.28 0.02

Анализ полученных результатов автокорреляции говорит о том, что во всех трех рядах приземной температуры воздуха наблюдается достаточно сильная связь между соседними значениями.

На основе критерия Стьюдента была проведена оценка значимости полученных коэффициентов корреляции. Так, например, все коэффициенты автокор-

реляции для приземной температуры за 14 дней оказались значимыми, а коэффициенты корреляции между температурой и давлением - не значимыми.

Как уже отмечалось выше, минимальная дискретность временных рядов приземной температуры воздуха, получаемых от AMC, составляет 10 с. Такая дискретность представляется избыточной. Рис. 2 иллюстрирует влияние дискретности временного ряда на его графический вид. Анализ этих данных показывает, что дискретность в 15 и 30 мин позволяет сохранить основные особенности временной изменчивости температуры при существенном сокращении длины ряда по сравнению с рядом с дискретностью 5 мин (не говоря уже о ряде с дискретностью 10 с).

Рисунок 2. Графическое представление временного ряда приземной температуры с различной дискретностью: а) 5 мин, б) 15 мин, в) 30 мин, г) 60 мин

Для того чтобы найти оптимальное значение дискретности временных рядов приземной температуры мы остановились на качественном анализе гистограмм, построенных для одних и тех же временных рядов, но с разной дискретностью. Пример таких гистограмм представлен на рис. 3. Его рассмотрение показывает, что при дискретности более 15 мин нарушается вид функции распределения.

а) б) в) г)

Рисунок 3. Гистограммы распределения значений температуры воздуха за 30-31 июля 2011 г. при различной дискретности измерений: а) 1 мин; б) 5 мин;

в) 15 мин; с) 30 мин

Анализ рис. 3 позволил сделать вывод о том, что оптимальной величиной дискретности (А) является значение в 15 мин, поскольку в этом случае все еще остаются практически неизменными статистические характеристики и гистограмма распределения и существенно сокращается длина выборки. В дальнейшем при проведении исследования использовалась именно эта величина дискретности (А).

В разделе 2.3 рассмотрена проблема контроля данных гидрометеорологических наблюдений, которая является одной из главных задач при подготовке данных для дальнейшего их использования при анализе и прогнозе погоды и связанных с ней явлений. Такой контроль весьма актуален для автоматических метеорологических станций, поскольку, работая в автоматическом режиме, они передают огромное количество информации для дальнейшего распространения без участия оператора. Для решения данной задачи была составлена специальная программа для ПЭВМ, в задачу которой не входило заполнение пропусков во временных рядах, а только выявление временных пропусков и наличия грубых ошибок. Для нахождения во временных рядах пропусков, грубых ошибок и выделения участков с постоянным характером протекания процесса использовалась программа Т/гоЫ. Пример определения характера протекания процесса представлен на рис. 4.

1 26 51 76 101 126 151 176 201 226 251 Порадеет! номер ияюреиия: N-23

Рисунок 4. Графическое представление фрагмента временного ряда приземной температуры с дискретностью 15 мин (нижняя кривая) и функции 1р, характеризующей однородность протекаемого процесса (верхняя кривая)

В процессе анализа временных рядов возникает задача их сглаживания с использованием различных цифровых фильтров. Другой формой сглаживания экспериментальных данных является операция их осреднения с помощью интерполяционных полиномов. Кроме того, в процессе выполнения данной работы была составлена программа, реализующая процедуру осреднения по методу скользящего среднего. Примером одного из цифровых фильтров для линейного сглаживания по 5 точкам являются соотношения:

7Ьср=(ЗГ0 + 2Г,+Г2-Г5)/5; Г2ср=(4Го+37}+2Г2+Г3)/10;

7)ср = + + Тм + 7}+2)/5; / = 2,..., ЛГ-.2; (5)

= + 2^-2 + 3 Тм_х + 4ТЫ )/10;

Т^ср = (37^ + + Гдг_2 - Гд,_4)/10.

На рис. 5 представлены результаты сглаживания временного ряда. Его анализ показывает, что расширение окна сглаживания от 3 до 7 значений практически не меняет вид сглаженного ряда по сравнению с исходным на участках плавного изменения температуры, и наоборот, в местах резких изменений увеличение ширины окна представляется предпочтительным.

ГГ ПП

-143 лп П

п

ь- г/'

:;: г _

г.п»чпа г У —♦—исходный

-15.3 ■ 3 точки

гууг 5 точек

-15.5 Лг 7 точек

21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 3/ М ЗУ 41) 41 42 43 44 45 4в Порядковый номер измерения

Рисунок 5. Исходный временной ряд приземной температуры и сглаженные по 3, 5 и 7 точкам ряды

Последний раздел второй главы посвящен рассмотрению разработанной при выполнении данной работы методики выделения временного тренда и периодических составляющих. Как известно, при наличии временного тренда и (или) периодических составляющих временной ряд не является стационарным. Однако если осуществить выделение трех его составляющих: временного тренда (Я), периодических составляющих (Р) и шума (IV), то временной ряд только с шумовой составляющей может быть уже близок к стационарному. Для выделения шумовой составляющей представим временной ряд в следующем виде:

Ti=Ri +Pt+Wi-

tt)

где i - порядковый номер члена временного ряда; R - временной тренд; Р -периодическая составляющая; W— шумовая составляющая.

Представление временных рядов в форме трех составляющих порождает решение двух задач: построение модельных временных рядов и выделение этих трех составляющих в уже существующих временных рядах, измеренных с помощью AMC. Методика построения модельных временных рядов с заданными свойствами уже была описана ранее. Здесь остановимся на выделении указанных составляющих в реальных временных рядах, т.е. в определении как вида функций, аппроксимирующих временную зависимость трех составляющих, так и числовых параметров этих функций.

Для аппроксимации временного тренда наиболее простым и чаще всего используемым подходом является его полиномиальное представление, когда соответствующая составляющая временного ряда - функция Fr(t), является полиномом, степень которого (к) задается эмпирически:

Входящие в соотношение (7) коэффициенты аппроксимационного полинома степени к,Ь¡, могут быть найдены, например, методом наименьших квадратов. Для реальных временных рядов приземной температуры воздуха, как это следует из анализа представленных в качестве типичного примера кривых (рис. 6), с увеличением степени аппроксимационного полинома применение полиномов степени выше первой начинает описывать не только сам тренд, но и периодические составляющие.

FR{ji)=b() + bl-Ti+... + bri-4

(7)

= 0.0067Х - 3.7271 = -0.0001хг + 0.0332Х - 4.6668

35

60

85 110 135 160 185

порядковый номер измерения, i

210

Рисунок 6. Результаты аппроксимации временного тренда полиномами первой, второй и третьей степеней для фрагмента временного ряда приземной температуры, измеренной с дискретностью 15 мин

Стандартным методом выделения периодических составляющих временного ряда является разложение его в ряд Фурье (анализ Фурье). Для этого могут быть использованы различные статистические пакеты, например, пакет Йа/мйса. Однако в том случае, когда процесс выделения периодических составляющих является промежуточным этапом вычислений при решении других задач, удобнее воспользоваться упрощенным алгоритмом, который было бы легко реализовать в процессе написания основной программы. При этом следует учесть и простоту реализации прямого и обратного «переходов»: исключения периодических составляющих из временного ряда и, в случае необходимости, добавления этих же периодических составляющих. С учетом этих требований вместо полного преобразования Фурье был реализован следующий упрощенный алгоритм:

1. Задавалось общее количество периодических составляющих: М.

2. Каждая т-я периодическая составляющая задавалась следующим соотношением:

где т - порядковый номер периодической составляющей (т = 1, 2, ..., М); г -порядковый номер члена временного ряда (г = 1, 2,..., N).

Тогда для каждого момента времени (т) можно записать следующее соотношение для периодической составляющей временного ряда:

где суммирование идет по всем значениям т: т = 1, 2, ..., М.

3. Коэффициенты, входящие в выражение (8), последовательно для каждой периодической составляющей с номером т находились методом прямого перебора их значений. При реализации такого перебора для каждого коэффициента К„„ Д„ и Р„, задается множество значений, лежащих в заданном диапазоне (между заданными максимальным и минимальным значениями). Затем из большого числа генерируемых коэффициентов для каждой периодической составляющей выбирались те их них, которые минимизировали значение суммарной невязки 5:

(8)

(9)

5 = Е 2п'1+рц

(10)

где значения линейного временного тренда рассчитываются по формуле (7).

Таким образом, из всего многообразия рассмотренных коэффициентов для первой периодической составляющей на основе минимизации величины после

перебора всех значений коэффициентов определялись три значения: АГ1°ПТ, А™1, После этого из ряда исключалась первая периодическая составляющая:

T\j = Tj ~ К°пт sin

2 n

1 + Fi0nT

Di

(И)

Полученный таким образом новый ряд температуры Тц использовался для расчета величины 5 по формуле (10) (ряд Г,- заменялся на ряд Т\ ,). Для ряда определялись коэффициенты К2ош, Л01™, р2°ш для второй периодической составляющей и т.д.

Для тестирования данного алгоритма использовались как модельные, так и реальные данные. Рис. 7 иллюстрирует изменение конфигурации модельного (а) и реального (б) временных рядов приземной температуры воздуха в процессе исключения линейного тренда и трех периодических составляющих.

а)

б)

75 149 223 297 371 445 519 593 £

3 1037 1111 1185 1259 133

Рисунок 7. Фрагмент модельного (а) и реального (б) временного ряда - верхние кривые и временные ряды после исключения линейного тренда первой, второй и третьей периодических составляющих

В третьей главе анализируются полученные статистические характеристики временных рядов приземной температуры воздуха, измеренных с помощью AMC в Санкт-Петербурге (РГГМУ) и в поселке Воейково Ленинградской области (ИРАМ). Здесь проведено сопоставление основных статистических характеристик временных рядов приземной температуры воздуха, полученных в различные сезоны и в различных пунктах измерения, и выполнена оценка функций их распределения.

На рис. 8 приведены фрагменты временных рядов приземной температуры воздуха за 4 месяца - а) в 2011 и б) в 2012 гг., измеренной AMC, установленной в РГГМУ. Каждый фрагмент содержит измерения за 14 суток, дискретность измерений - 15 мин.

Рисунок 8. Временные ряды приземной температуры воздуха, измеренной AMC РГГМУ, за 4 месяца 2011 г. (а) и 2012 г. (б)

Из анализа этих рисунков можно сделать следующие выводы:

1. Как характер временного хода приземной температуры воздуха, так и среднемесячные значения этого параметра заметно изменяются для разных лет.

2. Качественный анализ показывает, что во всех временных рядах прослеживается наличие суточной периодической составляющей. Однако в разные временные интервалы «поведение» этой составляющей проявляется по-разному.

На рис. 9 (а) приведены временные ряды для сентября месяца 2011 и 2012 гг. по данным AMC РГГМУ. Для построения графика на рис. 9 (б) предварительно были рассчитаны значения разности температур за сентябрь 2011 и 2012 гг. Вычисленное для этого фрагмента среднее значение AT равно 0.3 "С. Аналогичные расчеты были выполнены и для других периодов.

а) б)

Рисунок 9. Сопоставление временных рядов приземной температуры воздуха за сентябрь месяц 2011 и 2012 гг. (а) и значений AT\ (б) за тот же период

Анализ поведения кривых на рис. 9 позволяет сделать вывод о том, какой период (2011 г или 2012 г) был в Санкт-Петербурге теплее или холоднее.

На рис. 10 приведены временные ряды приземной температуры воздуха за май, июнь и август 2012 г., полученные с помощью AMC в Ленинградской области поселок Воейково (ИРАМ).

Воейково 2012

Рисунок 10. Временные ряды приземной температуры воздуха за 3 месяца 2012 года, измеренные AMC в Воейково (ИРАМ)

Анализ графика показал, что по аналогии с временными рядами за летний период 2011 - 2012 гг. (рис. 8), и здесь четко прослеживается суточный ход температуры воздуха. Средняя температура воздуха составила за май 2012 г. -11.8° С за июнь - 15.3° С, за август - 15.5° С.

Как известно, мегаполисы, к которым, в частности, относится и Санкт-Петербург, являются «островами тепла». Для этого рассмотрим графики, представленные на рис. 11.

Рис. 11 (а) позволяет рассмотреть как сам характер изменения приземной температуры воздуха в двух пунктах, разделенных всего 20 км (прослеживается ярко выраженный суточный ход приземной температуры), так и тот факт, что в Ленинградской области ночи в среднем более холодные в этом месяце, чем в мегаполисе. Анализ же рис. 11 (б) позволяет более наглядно проследить различие температур за весь выбранный временной интервал. Проведенная оценка показала, что среднее значение разности температур составляет 0.9° С (в мегаполисе теплее в среднем почти на 1 ° С). В тоже время, характер самих временных изменений значений температур в этих двух рассмотренных рядах весьма близок -коэффициент корреляции (г) равен 0.97.

Рисунок 11. Фрагмент временных рядов приземной температуры воздуха за август 2012 г, измеренной AMC в Санкт-Петербурге РГГМУ и Ленинградской области, Воейково ИРАМ (а), и разность температур (AT) между ними (б)

Для мая и июня месяцев 2012 г были произведены аналогичные исследования. Среднее значение AT для мая составляет 0.5"С, а коэффициент корреляции (г) равен 0.97. Соответственно для июня среднее значение разности составляет 0.6°С, а коэффициент корреляции временных рядов (Санкт-Петербург -Воейково) равен 0.95. Здесь характер различий в точности повторяет те, что были продемонстрированы для августа 2012 г.

Таким образом, можно сделать вывод о том, что в среднем температура воздуха в мегаполисе оказывается на несколько десятых градуса выше, чем в пригородах. Однако важно подчеркнуть, что только в среднем. Анализ данных за май и июнь показал, что в отдельных случаях приземная температура воздуха в мегаполисе может на 2-3 ° С быть ниже, чем в пригороде.

Расчеты статистических характеристик временных рядов за указанные выше временные периоды для Санкт-Петербурга по данным AMC РГГМУ проводились как по полным фрагментам временных рядов, содержавшим измерения за 14 суток, так и по двум отрезкам этих же временных рядов: за первые и последующие 7 суток.

Для анализа сезонной изменчивости таких статистических характеристик как среднее значение и среднеквадратическое отклонение (СКО) обратимся к рассмотрению кривых, представленных на рис. 12.

Представленные кривые (рис 12 а) показывают, что май 2011 года был холоднее аналогичного периода 2012 г, июль и сентябрь были соответственно теплее, а декабрь - снова холоднее. Анализ рис. 12 (б), показывает, что величина СКО за все четыре месяца 2011 года была практически на 1°С меньше, чем в 2012 г., а значит приземная температура воздуха в 2011 г. изменялась не в таких больших пределах, как в 2012 г - была менее изменчива.

Рисунок 12. Значения средней температуры воздуха (а) и среднеквадратичного отклонения температуры воздуха от ее среднего значения (б) в Санкт-Петербурге в 2011 и 2012 гг.

Проанализируем теперь поведение средних значений приземной температуры воздуха, вычисленное по трем фрагментам одного и того же временного ряда. Анализ данных показывает, что доверительные интервалы для этой стати-

стической характеристики в большинстве рассмотренных случаев не перекрываются, что позволяет сделать вывод о не стационарности временных рядов приземной температуры воздуха по этому параметру. Наглядно это демонстрируют данные, приведенные на рис. 13 (а).

Для такой статистической характеристики как среднеквадратическое отклонение ситуация обратная - доверительные интервалы, вычисленные по первым 7 и последующим 7 суткам обычно перекрываются. Подобное поведение этой статистической характеристики иллюстрирует рис. 13 (б)

Рисунок 13. Средние значения (а) и среднеквадратичные отклонения (б) температуры с 95% доверительными интервалами в Санкт-Петербурге за сентябрь 2012 г, вычисленные по фрагментам временного ряда, содержащим

14,7(1), и 7 суток (2)

Аналогичные расчеты были выполнены и для временных рядов приземной температуры воздуха, полученной AMC Воейково (ИРАМ). Приведенные данные показывают, что рассчитанные при 95% уровне значимости доверительные интервалы для средних значений температуры не перекрываются, а для средне-квадратических отклонений - наоборот, перекрываются.

Обратимся теперь к анализу гистограмм, характеризующих эмпирические функции распределения приземной температуры воздуха в Санкт-Петербурге и Воейково (рис. 14). Вид гистограмм существенно различается. Причины такого «поведения» гистограмм распределения приземной температуры воздуха, измеренных в мегаполисе и за его пределами, требуют своего специального исследования. При этом характер «поведения» временных рядов весьма близок, что хорошо видно на рис. 14 (в). Как уже отмечалось выше, для этих данных коэффициент корреляции равен 0.97.

а) б)

Рисунок 14. Гистограммы распределения за май 2012 г. за период 14 дней в Санкт-Петербурге (а) и Воейково (б) и ряды синхронных измерений приземной температуры воздуха в Санкт-Петербурге и Воейково (в)

Далее по методике, рассмотренной во второй главе, из временных рядов исключался линейный временной тренд и периодические составляющие. Иллюстрация результата проделанной работы представлена на рис. 15. В процессе такой трансформации менялись статистические характеристики получаемых временных рядов, определялись амплитуда, период и фазовый сдвиг для трех периодических составляющих.

Рисунок 15. Исходный фрагмент временного ряда приземной температуры воздуха, измеренной за 14 дней мая 2012 года в Санкт-Петербурге, и его трансформация в процессе исключения временного тренда и трех периодических составляющих

Среднее значение после исключения линейного тренда всех последующих рядов становится близким к нулю. Изменение величины среднеквадратичного отклонения для 4 месяцев 2012 г (AMC РГГМУ) показано на рис. 16. Во всех четырех случаях, относящихся к различным сезонам, заметно уменьшение измен-

чивости приземной температуры после исключения линейного тренда и периодических составляющих. При этом величина такого уменьшения различна (максимальна весной (май) и минимальна зимой (декабрь)). Аналогичным образом изменяется величина среднеквадратического отклонения и для данных за четыре сезона в Санкт-Петербурге в 2011 г.

Исходный ряд Исключен Без первой Без второй Без третьей

линейный тренд периодики периодики периодики

Рисунок 16. Изменение величины среднеквадратичного отклонения в процессе исключения линейного тренда и трех периодических составляющих для мая, августа, сентября и декабря 2012 г (14 суток)

Анализ устойчивости тенденции изменения величины среднеквадратического отклонения при переходе от использования фрагмента временного ряда, содержащего 14 суток, к фрагментам, содержащим первые 7(1) и последующие 7(2) суток, показал:

- наличие тенденции к уменьшению величины среднеквадратического отклонения по мере исключения тренда и каждой периодической составляющей;

- отчетливо проявляется различие статистических характеристик двух отрезков одного и того же ряда. Исключение составили лишь данные для сентября, когда отличия величины среднеквадратического отклонения для всех трех фрагментов мало.

Рассмотрим теперь «поведение» гистограмм, характеризующих распределение приземной температуры воздуха в исходном временном ряду и во временных рядах после соответствующей трансформации исходного временного ряда (рис. 17). На этом рисунке приведены: под индексом (а) - гистограмма для исходного ряда, под индексом (б) - гистограмма для ряда после исключения линейного тренда, под индексом (в) — гистограмма для ряда после исключения линейного тренда и первой периодической составляющей, под индексом (г) - гистограмма для ряда после исключения линейного тренда и трех периодических составляющих.

8> л-ь .л & # $ # £ л # # „г ль # Ф л<? ¿> #

ШппПп--пП

• „^ ^ ^ „^ ^ А Л Л £ Л А

а)

б)

[1п„ПппП

П „ П П п П

? <? / ^ & $ $ Л <>

В)

Г)

Рисунок 17. Гистограммы распределения временных рядов в процессе исключения тренда и периодических составляющих;

Санкт-Петербург, 14 дней сентябрь 2012 г.

Анализируя представленные гистограммы, можно отметить, что исключение линейного временного тренда, хотя несколько изменяет характер распределения, но в незначительной степени. Если же сравнивать гистограммы под индексом (а) с гистограммами под индексом (г), то здесь изменение характера распределения более заметно - оно становится более равномерным.

Теперь проанализируем значения периодов, которые в процессе проведения численных экспериментов рассчитала программа «Трег» (рис. 18).

1 1 1 3 Г

1- .—, 1 1Й Период, час -■--я Период.«« 0 (1

май июль сентябрь декабрь

Рисунок 18. Значения амплитуды (° С) и величины периода (ч) для трех периодических составляющих для 2012 г: (а) - 14, (б) - первые 7 , (в) - вторые 7 суток

Здесь на каждом рисунке по горизонтальной оси последовательно приведены амплитуды трех периодических составляющих (шкала значений амплитуд указана на оси ординат, ° С), а на каждой колонке в цифровой форме указан соответствующий период (часы). Под индексами (а), (б) и (в) приведены значения амплитуд и периодов, рассчитанные по отрезкам временных рядов, содержащих соответственно 14, 7(1) и 7(2) суток. Эти данные позволяют рассмотреть «устойчивость» определения амплитуд и периодов к изменению объемов используемой выборки. Анализируя полученные данные по результатам использования временных рядов, как для Санкт-Петербурга, так и Воейково можно сделать следующие выводы:

1. Практически всегда для первой периодической составляющей первый период либо равняется 24 ч, либо близок к этой величине (суточный ход).

2. Амплитуда первой периодической составляющей в подавляющем числе рассмотренных случаев так же оказывается максимальной. Однако бывают и исключения.

3. Доминирующее значение периода третьей составляющей обычно оказывается близким к 72 ч, а период второй составляющей занимает промежуточное значение между первым и третьим периодами.

4. Сравнение данных, полученных по трем фрагментам одного и того же ряда показывает значительные различия как по амплитудам периодических составляющих, так и по выявленным периодам.

В четвертой главе рассматривается задача текущего прогнозирования приземной температуры воздуха на основе обработки аналитическими методами

временных рядов приземной температуры воздуха, полученных с помощью AMC РГГМУ.

В первом разделе этой главы описывается технология проведения замкнутых численных экспериментов по оценке эффективности (средней точности) текущего прогнозирования с использованием следующих методов: инерционный прогноз; линейная экстраполяция; полиномиальная экстраполяция; сплайн экстраполяция.

Три последующих раздела позволяют оценить среднюю точность текущего прогнозирования при использовании указанных выше методов при заблаговременное™ до 2 ч. При этом все методические прогнозы сравнивались с данными текущего прогноза.

Линейная экстраполяция - это простейший способ прогнозирования. Для проведения численных экспериментов по этому алгоритму была составлена программа «Dprog».

Численные эксперименты проводились по двум схемам: без исключения тренда и периодических составляющих и с их исключением. Варьировались сезоны и длины фрагментов временных рядов.

Рис. 19 (а) иллюстрируют изменение величины среднеквадратической погрешности прогноза в зависимости от его заблаговременности при использовании непосредственно данных измерений. В этом случае более успешным является использование методического прогноза при малой заблаговременности, и наличие, хотя и небольшого, но все же преимущества инерционного прогноза, начиная с заблаговременности прогноза в 1.5 ч.

Кривые на рис. 19 (б) позволяют проанализировать изменение величины среднеквадратической погрешности прогноза при использовании данных измерений, из которых были исключены линейный временной тренд и три периодические составляющие. В этом случае более успешным всегда является использование инерционного прогноза.

Величина среднеквадратической погрешности прогноза является далеко не единственной статистической характеристикой, которую необходимо принимать во внимание при оценке успешности того или иного прогноза. Поэтому кроме этой величины было в форме гистограмм исследовано распределение ошибок прогнозов.

0.6

0.5

з°-4

f 0.3

о

О 0.2

0.1 0

Рисунок 19. Зависимость среднеквадратических отклонений прогностических значений приземной температуры воздуха от измеренных по данным AMC.

Пунктирная линия - для инерционного и сплошная линия - для линейного прогнозов в зависимости от заблаговременности (а) и тех же данных, но после исключения временного тренда и периодических составляющих (б)

Подводя итог выполненному анализу результатов численных экспериментов, можно сделать вывод о том, что при заблаговременности до 2 ч наилучшие результаты дает использование инерционного прогноза (вторая схема).

Для проведения численных экспериментов с использованием полиномиальной экстраполяции была составлена программа «Тарг». С использованием этой программы проводились численные эксперименты, в которых варьировались как параметры временных рядов (сезон, продолжительность и т.д.), так и схемы расчета коэффициентов аппроксимационного полинома (степень полинома п и количество измерений приземной температуры в обучающей выборке И).

В данном параграфе использовались полиномы разных степеней, в том числе и полиномы первой степени. Однако в отличие от предыдущего параграфа здесь коэффициенты полинома первой степени рассчитываются не по двум значениям приземной температуры (А = 2, интерполяция), а по большему числу значений (h >2, аппроксимация). Результаты численных экспериментов рассмотрены по методике, когда перед расчетом коэффициентов аппроксимационного полинома из обучающей выборки удалялись временной тренд и периодические составляющие.

Анализ результатов численных экспериментов показал, что для получения удовлетворительных результатов в этом случае необходимо сгладить имеющуюся в обучающем отрезке ряда шумовую составляющую за счет использования большого числа узлов h при расчете коэффициентов аппроксимационных полиномов.

Резкое увеличение величины среднеквадратического отклонения для полинома второй степени при h = 3 можно объяснить тем, что в этом случае ап-проксимационная кривая строится строго по трем предшествующим прогнозу значениям ряда, в котором может доминировать шумовая составляющая. Поэтому «строгое» проведение аппроксимационной кривой через эти узлы может «уводить» прогностическую кривую очень далеко от истинных значений приземной температуры. Вследствие этого среднеквадратические отклонения прогнозируемых и измеренных значений быстро возрастают. При заблаговременности прогноза всего в 15 мин среднеквадратические отклонения составляет 0,31°С, а при заблаговременности в 120 мин - 7,45°С. Если же для расчета коэффициентов аппроксимационного полинома использовать значительно большее количество узлов, например 12, то при заблаговременности в 120 мин сред-неквадратическое отклонение прогнозируемых и измеренных значений составляет уже только 0,39 ° С.

Вторым важным выводом является констатация того факта, что при использовании данной методики повышение степени аппроксимационного полинома не только не повышает точность текущего прогнозирования, а наоборот, ухудшает его. Наилучшие результаты дает линейная аппроксимация.

Теперь остановимся на рассмотрении полученных в ходе проведения численных экспериментов результатов, когда обучающая выборка не подвергалась предварительной обработке, т.е. когда из обучающей выборки перед расчетом коэффициентов аппроксимационного полинома не удалялись временной тренд и периодические составляющие. Анализ этих данных показывает, что по сравнению с предыдущей методикой в этом случае ухудшается точность прогноза. Второй вывод заключается в том, что изменение числа узлов, по которым методом наименьших квадратов вычисляются коэффициенты аппроксимационного полинома, мало влияет на точность прогноза, хотя в данном конкретном случае несколько более предпочтительным является использование 5 узлов.

Таким образом, подводя итог этого этапа исследования можно сделать вывод о том, что для проведения текущего прогнозирования приземной температуры воздуха можно использовать метод полиномиальной аппроксимации, но при выполнении следующих условий:

- осуществление предварительной обработки обучающего отрезка временного ряда путем удаления временного тренда и периодических составляющих;

- степень полинома должна быть равной 1

- величина параметра к должна быть достаточно большой: /г = 10 -14.

Перейдем теперь к рассмотрению результатов численных экспериментов,

полученных при использовании сплайн экстраполяции. В этом случае сочетаются достоинства аппроксимации (можно учитывать большое число узлов) и при этом исключаются осцилляционные эффекты, присущие классическим интерполяционным полиномам больших степеней. Исследуя возможности применения сплайн экстраполяции для текущего прогнозирования приземной температуры воздуха, было решено ограничиться рассмотрением кубических сплайнов, используя алгоритм расчетов, приведенный в работе.

Для проведения численных экспериментов по этому алгоритму была составлена программа «7л'р/» .

Численные эксперименты проводились при варьировании числа узлов в обучающей выборке /г в диапазоне значений 4-12. Кроме того, при проведении численных экспериментов исследовалось влияние сглаживания данных в обучающей выборке. Характер сглаживания обучающей выборки кодировался параметром

5 = 0: нет сглаживания,

5 = 3: сглаживание проводилось по трем точкам;

5 = 5: сглаживание проводилось по пяти точкам (соотношения (5));

5 = 7: сглаживание проводилось по семи точкам.

Кривые на рис. 20 иллюстрируют изменение СКО текущего прогноза в зависимости от заблаговременности прогноза и схемы эксперимента. Анализ поведения этих кривых показывает, что во всех случаях погрешность прогноза увеличивается с ростом заблаговременности. Это общая тенденция, она проявляется практически во всех случаях. Однако, что очень существенно, характер роста ошибок зависит от использованной схемы расчета параметров сплайна. Причем эти отличия могут превосходить 100%.

Оптимальной схемой расчета параметров сплайна оказалось использование 16 узлов в обучающей выборке (А = 16) и проведение предварительного сглаживания обучающего ряда по 5 точкам (5=5).

Рисунок 20. Зависимость среднеквадратических отклонений прогностических значений приземной температуры воздуха от измеренных в зависимости от заблаговременности прогнозов для сплайн экстраполяции

Из анализа расположения кривых на рис. 20 следует наличие двух резко различающихся групп кривых: верхние и нижние. Схемы эксперимента из первой группы абсолютно не подходят для проведения текущего прогнозирования приземной температуры воздуха. Схемы эксперимента из второй группы дают неплохие и близкие результаты. Такое разделение на две группы связано с проведением или не проведением предварительного сглаживания данных измерений.

Как показывает анализ результатов проведенных численных экспериментов с использованием аналитических методов, наилучшие результаты дает использование сплайн экстраполяции, когда перед его использованием предварительно из обучающего отрезка временного ряда исключается линейный тренд и периодические составляющие, а непосредственно сплайн экстраполяция производится при /г=12 и 5=5.

Основные результаты работы

1. Представлен обзор современных автоматических метеорологических станций общего и специального назначения.

2. Разработана методика моделирования временных рядов приземной температуры воздуха с заданными статистическими свойствами.

3. Сформированы архивы временных рядов приземной температуры воздуха по данным AMC РГГМУ и ИРАМ.

4. Представлен обзор математических методов расчета статистических характеристик временных рядов и методов оценки доверительных интервалов этих характеристик с заданным уровнем значимости.

5. Разработана математическая модель выделения периодических составляющих во временных рядах приземной температуры воздуха.

6. Составлена на основе предложенной математической модели программа для ПЭВМ, осуществляющая выделение линейного временного тренда и периодических составляющих.

7. Разработаны математические подходы к определению оптимальной дискретности измерений, контроля наличия пропусков и выбросов во временных рядах приземной температуры воздуха.

8. Осуществлен контроль качества имеющихся экспериментальных данных и на его основе получены фрагменты временных рядов, не содержащие пропусков и выбросов для четырех сезонов 2011-2012 гг.

9. Осуществлен анализ статистических характеристик временных рядов приземной температуры воздуха, измеренных в разные сезоны 2011-2012 гг. в мегаполисе (Санкт-Петербург) и за его пределами (Воейково Ленинградской области).

10. Показано наличие определенных различий во временных рядах, измеренных в мегаполисе и за его пределами.

11. На основе использования созданного архива данных натурных измерений произведен анализ значений характеристик периодических составляющих временных рядов.

12. Разработана технология оценки текущего прогнозирования приземной температуры воздуха по данным, полученным AMC.

13. На основе проведения замкнутых численных экспериментов, осуществленных с помощью специально созданных в процессе выполнения данного исследования программ для ПЭВМ, на основе сравнения точности инерционного и методических прогнозов выполнена оценка возможностей использования аналитических методов для осуществления текущего прогнозирования приземной температуры воздуха. Показано, что наилучшие результаты дает использование сплайн экстраполяции, когда перед его использованием предварительно из обучающего отрезка временного ряда исключается линейный тренд и перио-

дические составляющие, а непосредственно сплайн экстраполяция производится по схеме эксперимента, когда в обучающей выборке осуществляется сглаживание данных по 5 точкам (см. ф-лу (5)), а для расчета коэффициентов сплайна используется 12 узлов.

Полученные результаты показывают, что с достаточной для практики точностью предложенный подход к проведению текущего прогнозирования приземной температуры воздуха может быть рекомендован для практического использования.

Созданные в процессе выполнения данной диссертационной работы программы для ПЭВМ могут быть рекомендованы для проведения дальнейших исследований временных рядов, как приземной температуры воздуха, так и других метеорологических величин.

1. Восканян K.JL, Сероухова О.С., Солонин A.C. К вопросу о методике радиолокационного измерения интенсивности атмосферных осадков // Ученые записки РГГМУ. 2013. №27. С.63-70.

2. Восканян К.Л., Кузнецов А.Д., Сероухова О.С., Симакина Т.Е. К вопросу о выделении аддитивных составляющих временного ряда приземной температуры воздуха // Ученые записки РГГМУ. 2013. № 31. с. i> tUd^CClhl^C-

3. Восканян К.Л., Саенко А.Г. Актинометрические наблюдения // СПб, изд. РГГМУ. 2010-35 с.

4. Воинов Н.Е., Восканян К.Л., Кузнецов А.Д., Сероухова О.С., Симакина Т.Е.. Методика текущего прогнозирования эволюции зон осадков по радиолокационным данным // Тезисы доклада на заседании постоянно действующего семинара «Дистанционные методы зондирования природной среды», СПб, Военно-космическая академия имени А. Ф. Можайского. 2012.

5. Восканян К.Л., Григоров И.О., Кузнецов А.Д., Саенко А.Г., Сероухова О.С., Симакина Т.Е. Статистические характеристики приземной температуры воздуха по данным AMC РГГМУ // Тезисы доклада на Итоговой сессии Ученого совета РГГМУ. -2012.

Основные публикации по теме диссертации

Восканян Карина Левановна

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата физико-математических наук

ИССЛЕДОВАНИЕ СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК ВРЕМЕННЫХ РЯДОВ ЗНАЧЕНИЙ ПРИЗЕМНОЙ ТЕМПЕРАТУРЫ ВОЗДУХА

ЛР№ 020309 от 30.12.96

Подписано в печать 13.11.13. Формат 60x90 1/16. Гарнитура Times New Roman. Печать цифровая. Усл.печ.л. 1,75. Тираж 100 экз. Заказ № 228. РГГМУ, 195196, Санкт-Петербург, Малоохтинский пр., 98. Отпечатано в ЦОП РГГМУ

Текст научной работыДиссертация по наукам о земле, кандидата физико-математических наук, Восканян, Карина Левановна, Санкт-Петербург

Министерство образования и науки Российской Федерации

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования

"РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ ГИДРОМЕТЕОРОЛОГИЧЕСКИЙ

УНИВЕРСИТЕТ" (РГГМУ)

На правах рукописи

04201 453471

ВОСКАНЯН КАРИНА ЛЕВАНОВНА

ИССЛЕДОВАНИЕ СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК ВРЕМЕННЫХ РЯДОВ ЗНАЧЕНИЙ ПРИЗЕМНОЙ ТЕМПЕРАТУРЫ ВОЗДУХА

25.00.30 - метеорология, климатология, агрометеорология

Диссертация на соискание ученой степени кандидата физико-математических наук

Научный руководитель:

доктор физ.-мат. наук, проф. Кузнецов А.Д.

Научный консультант: кандидат физ.-мат. наук, доцент Сероухова О. С.

Санкт-Петербург - 2013

Содержание

Стр.

Введение.............................................................................. 4

1 Автоматические метеорологические станции общего и

специального назначения..........................................................................................11

1.1 Автоматическая информационно-измерительная система «Погода»..................................................................... 11

1.2 Автоматическая метеорологическая станция «НОВО».. 15

1.3 Аэродромные метеостанции (KPAMC) 18

1.4 Дорожная автоматическая информационно-измерительная система «МетеоТрасса»................................................ 24

1.5 Формирование архива данных 30

1.5.1 Формирование модельных временных рядов температуры

воздуха..........................................................................................30

1.5.2 Формирование временных рядов по данным AMC РГГМУ ................................................................................................................................33

1.5.3 Формирование временных радов по данным AMC ИРАМ ..................................................................................................................................38

2 Математические методы расчета статистических характеристик

временных рядов......................................................................................................41

2.1 Статистические характеристики временных рядов и методы их расчета............................................................................................................................................41

2.2 Оценивание статистических характеристик временных рядов ... 48

2.3 Специальные методы исследования временных рядов........................56

2.3.1 Оптимальная дискретность измерений..............................................................56

2.3.2 Контроль пропусков во временных рядах......................................................61

2.3.3 Контроль выбросов и смены характера протекания процесса .... 63

2.3.4 Сглаживание временных рядов..................................................................................65

2.4 Выделение временного тренда и периодических составляющих

временного ряда.......................................................... 69

3 Анализ статистических характеристик временных рядов приземной температуры воздуха........................................................................82

3.1 Сравнительный анализ временных рядов приземной температуры воздуха...................................................... 82

3.2 Анализ статистических характеристик приземной температуры воздуха........................................................................ 89

3.3 Исследование временного тренда и значений периодических составляющих............................................................. 101

4 Оценка возможностей использования аналитических методов для текущего прогнозирования приземной температуры

воздуха........................................................................ 111

4.1 Технология текущего прогнозирования............................... 111

4.2 Анализ результатов, полученных при использовании линейной экстраполяции.............................................................. 113

4.3 Анализ результатов, полученных при использовании полиномиальной экстраполяции........................................ 118

4.4 Анализ результатов, полученных при использовании сплайн экстраполяции............................................................. 125

Заключение........................................................................... 133

Список использованных источников............................................. 136

Введение

Температура воздуха у поверхности земли является одной из важнейших метеорологических величин. Без знания фактического значения этой метеорологической величины, а также ее прогностического значения трудно себе представить жизнь и хозяйственную деятельность современного общества. В своей повседневной жизни мы интересуемся прогностическим ее значением вечером, планируя как свою одежду, так и свою работу, если она будет протекать на открытом воздухе. Утром мы выясняем фактическое значение этой температуры, тем самым уточняя ее прогностическое значение. В своей хозяйственной деятельности трудно себе представить тот случай, когда этот метеорологический параметр или его прогноз различной заблаговременности не учитывался бы в той или иной мере. Это коммунальные службы, авиация, дорожные службы, прогностические подразделения гидрометеослужбы, строительство, энергетика и многие другие виды хозяйственной деятельности /1,2/.

Все выше сказанное определяет важность и актуальность исследования «поведения» временных рядов /3/ приземных значений температуры воздуха и этим же определяется актуальность и практическая значимость данной работы.

При исследовании приземной температуры атмосферного воздуха возможно как рассмотрение двухмерных полей этой метеорологической величины, так и временных рядов значений приземной температуры воздуха, измеренной в одном пункте /4/. В данной работе рассматривались только временные ряды приземной температуры воздуха, измеренные с помощью современных автоматических метеорологических станций (AMC). Использование современных AMC позволяет получать информацию об изменении метеорологических параметров атмосферы, начиная от нескольких секунд и заканчивая часами и сутками в зависимости от требования заказчика /5/. В настоящее время существуют десятки производителей AMC, Россия в том

числе {Aanderаа Data Instruments, Campbell Scientific, DA VIS Data Instruments).

Второй особенностью данной работы является отказ от рассмотрения климатических характеристик приземной температуры воздуха, требующих наличия длинных временных рядов этой величины (при этом дискретность измерений может быть достаточно большой), а сосредоточить свое внимание на исследовании относительно небольших (по продолжительности общего времени измерения) временных рядах, но с малой дискретностью. Такая возможность появилась с внедрением в метеорологическую практику AMC. Это позволило уменьшить дискретность измерений до 10 секунд получить и проанализировать статистические и другие характеристики временных рядов значений приземной температуры воздуха.

В качестве отдельного предмета исследования в данной работе рассмотрены возможности выполнения текущего прогнозирования приземной температуры воздуха. Изучение предсказуемости процессов в атмосфере возможно с использованием различных методов. В частности, для исследования временных рядов метеорологических величин, получаемых с помощью AMC, могут быть использованы аналитические и статистические модели. В данной работе рассматриваются возможности использования только аналитических методов к проведению текущего прогноза значений приземной температуры /6/.

Таким образом, основными целями диссертационной работы являлись получение и анализ статистических и других характеристик временных рядов значений приземной температуры воздуха, измеренных с помощью автоматических метеорологических станций, а также исследование возможностей применения аналитических методов к проведению текущего прогноза значений приземной температуры.

Основные задачи исследования:

- рассмотреть технические характеристики современных автоматических метеорологических станций общего и специального назначения;

- создать архив временных рядов приземной температуры воздуха, полученных с помощью AMC в Санкт-Петербурге и Ленинградской области;

- разработать и реализовать с помощью специально созданной для этой цели программы для ПЭВМ алгоритмы перевода текстовых значений данных с серверов, содержащих результаты измерений на AMC в Санкт-Петербурге и Воейково, в цифровую форму;

- разработать и реализовать с помощью специально созданной для этой цели программы для ПЭВМ алгоритмы контроля «качества» временных рядов и с их помощью исключить из архива данные, содержащие временные разрывы и выбросы;

- с использованием, как стандартных пакетов прикладных программ, так и специально созданных в процессе выполнения данной работы программ для ПЭВМ, произвести серию расчетов статистических характеристик временных рядов, соответствующих различным сезонам и пунктам измерения, и оценить доверительные интервалы для этих характеристик, а также произвести анализ полученных данных;

- разработать алгоритмы и подготовить соответствующую программу для ПЭВМ для расчета аддитивных составляющих временных рядов;

- на основе созданной программы и имеющегося архива данных исследовать поведение характеристик периодических составляющих временных рядов приземной температуры воздуха;

- исследовать, используя созданные для этой цели программы для ПЭВМ, точность текущего прогнозирования приземной температуры воздуха на основе аналитических методов проведения замкнутых численных экспериментов и дать практические рекомендации по их применению.

Исходные материалы и методика исследования:

- временные ряды приземной температуры воздуха, измеренные AMC в Санкт-Петербурге и поселке Воейково Ленинградской области;

- методики исследования статистических характеристик базировались на известных методах и подходах к их расчету с использованием как извест-

ных пакетов «Statistica» и «Excel», так и созданных в процессе выполнения данной работы специализированных программ для ПЭВМ:

— методика оценки точности текущего прогнозирования базировалась на проведении замкнутых численных экспериментов на ПЭВМ с использованием данных натурных измерений приземной температуры воздуха в Санкт-Петербурге и Ленинградской области.

Научная новизна работы заключается в следующем:

1. Скорректирована методика контроля «качества» временных рядов приземной температуры, адаптированная к работе с данными AMC РГГМУ и ИРАМ.

2. Разработана методика выделения аддитивных составляющих временных рядов с использованием специально созданной для этой цели программы для ПЭВМ.

3. Разработаны методики проведения замкнутых численных экспериментов для оценки точности текущего прогнозирования приземной температуры воздуха и для их реализации созданы соответствующие программы для ПЭВМ.

4. Определены статистические характеристики временных рядов приземной температуры воздуха и исследованы их вариации в зависимости от объема выборки, сезона и места проведения измерений.

5. Проведено сопоставление синхронных измерений приземной температуры воздуха в мегаполисе и за его пределами.

6. Для каждого сезона оценены параметры периодических составляющих временных рядов приземной температуры воздуха и исследована их изменчивость в зависимости от объема выборки и места проведения измерений.

7. Разработана методика использования аналитических методов прогнозирования приземной температуры воздуха, и определены оптимальные схемы его проведения на основе этих методов.

Положения, выносимые на защиту:

1. Методика выделения периодических составляющих временных рядов приземной температуры воздуха.

2. Методики использования аналитических методов для проведения текущего прогнозирования приземной температуры воздуха и результаты, полученные при определении оптимальной схемы такого прогнозирования.

В процессе выполнения данной работы автором были

- созданы и обработаны архивы данных с AMC Санкт-Петербурга и Ленинградской области, необходимые для проведения исследования;

- освоены методики и на их основе проведены расчеты статистических характеристик временных рядов приземной температуры;

- разработаны алгоритмы и составлены программы для ПЭВМ, позволяющие реализовывать разработанные методики.

Результаты исследований докладывались на научных семинарах кафедры экспериментальной физики атмосферы в 2012—2013 гг., на Итоговой сессии Ученого совета РГГМУ в 2012 г.

Основные результаты диссертации опубликованы в двух печатных работах и одном учебном пособии, в том числе две публикации - в издании, рекомендованном ВАК.

Работа состоит из введения, 4 глав, заключения, списка использованной литературы - 84 наименования. В ней содержится 145 страниц текста, 35 таблиц, 88 рисунков.

Во введении дано обоснование актуальности темы диссертационной работы, изложены цель и задачи исследования, отражена научная новизна и практическая значимость работы, а также определены положения, выносимые на защиту.

В первой главе рассматриваются структура, технические характеристики и особенности функционирования автоматических метеорологических станций различного назначения. Последовательно рассмотрены автоматические станции общего назначения (на примере АИИС «Погода» и AMC

«НОВО»), аэродромные метеорологические станции (на примере AMC «KPAMC») и дорожные метеорологические станции (на примере АИИС «МетеоТрасса»). Кроме того, в этой главе подробно описана методика получения информации о временных рядах приземной температуры воздуха. Рассмотрена методика формирования модельных временных рядов с заданными характеристиками, а также технология получения реальных данных измерения этого метеорологического параметра с помощью АИИС «Погода». Представленная здесь информация позволяет любому желающему сформировать свой собственный архив получаемых с помощью АИИС «Погода» временных рядов таких метеорологических величин как температура, влажность, скорость и направление ветра. При этом дискретность получаемых данных может колебаться от 1 мин до 6 ч (дискретность исходных данных от АИИС «Погода» составляет 10 с).

Вторая глава диссертационной работы посвящена математическим аспектам анализа временных рядов приземной температуры воздуха. Здесь наряду с рассмотрением методов расчета традиционных статистических характеристик временных рядов, приводятся адаптированные к временным рядам приземной температуры воздуха специально разработанной методики. Она позволяет выявлять временные разрывы, «выбросы» в результатах измерений, определять моменты изменения характера протекания процесса и др.

Отдельный параграф посвящен рассмотрению разработанной в рамках данной работы методики выделения временного тренда и периодических составляющих, адаптированной для относительно коротких временных рядов. Для ее реализации была составлена специальная программа для ПЭВМ.

В третьей главе анализируются статистические характеристики временных рядов приземной температуры воздуха. Эти данные были получены автором диссертационной работы с помощью автоматических метеорологических метеостанций (AMC), расположенных в мегаполисе (Санкт-

Петербург) и вне его (Воейково Ленинградской области). Здесь проведено сопоставление основных статистических характеристик временных рядов приземной температуры воздуха для различных сезонов и в различных пунктах измерения и выполнена их оценка. Особое внимание в этой главе уделено анализу результатов, полученных в процессе выделения, с помощью составленной программы для ПЭВМ, временного тренда и периодических составляющих временных рядов приземной температуры воздуха. Показаны сходство и различия различных характеристик временных рядов приземной температуры воздуха, измеренных в мегаполисе и за его пределами.

В четвертой главе рассматривается задача текущего прогнозирования приземной температуры воздуха на основе обработки аналитическими методами временных рядов приземной температуры воздуха, полученных с помощью AMC. Здесь с помощью специально созданных программ для ПЭВМ на основе проведения численных экспериментов исследованы точностные характеристики текущего прогнозирования приземной температуры воздуха. Для этого использовались архивные данные за 2011-2012 гг., полученные с помощью AMC в Санкт-Петербурге и Воейково. В качестве аналитических методов рассматривались линейная, полиномиальная и сплайн экстраполяции. Точность текущего прогнозирования с использованием этих методов сравнивалась с использованием для текущего прогнозирования инерционного прогноза.

В заключении приводятся перечень основных результатов, полученных в диссертационной работе. Также в заключении указывается направление дальнейшего развития исследования.

1. АВТОМАТИЧЕСКИЕ МЕТЕОРОЛОГИЧЕСКИЕ СТАНЦИИ ОБЩЕГО И СПЕЦИАЛЬНОГО НАЗНАЧЕНИЯ

1.1. Автоматическая информационно-измерительная система «Погода»

Автоматическая информационно-измерительная система (АИИС) «Погода» предназначена для автоматизации процесса проведения наблюдений и обработки результатов на метеорологических станциях наземной наблюдательной сети III.

Высокое качество результатов наблюдений с помощью АИИС «Погода» обеспечивается автоматизацией измерений (с помощью современных датчиков), автоматизацией обработ