Бесплатный автореферат и диссертация по наукам о земле на тему
Использование распределённых вычислительных систем для сбора, обработки и представления геофизических данных
ВАК РФ 25.00.10, Геофизика, геофизические методы поисков полезных ископаемых
Автореферат диссертации по теме "Использование распределённых вычислительных систем для сбора, обработки и представления геофизических данных"
На правах рукописи УДК [004.75/550.3]+[004.3/550.34.03]+[004.94/551.510.535]
Холодков Кирилл Игоревич
Использование распределённых вычислительных систем для сбора, обработки и представления геофизических данных
Специальность 25.00.10 — «Геофизика, геофизические методы поисков полезных ископаемых»
5 2015
Автореферат диссертации на соискание учёной степени кандидата технических наук
Москва — 2014
005558402
Работа выполнена в Федеральном государственном бюджетном учреждении науки Институте физики Земли им. О. Ю. Шмидта Российской академии наук
Научный руководитель:
Официальные оппоненты:
Ведущая организация:
к. ф.-м. н. зав. лаб. 501 Алёшин Игорь Михайлович
Черемесина Евгения Наумовна,
доктор технических наук, ВНИИгеосистем, заместитель директора Коноплев Вениамин Викторович,
кандидат технических наук, ИКИ РАН,
главный специалист
Федеральное государственное бгоджетно учреждение науки Институт проблем пе редачи информации им. А. А. Харкевич Российской академии наук
Защита состоится 5 марта 2015 г. в 14 часов на заседании диссертационного совета Д 002.001.01 на базе ИФЗ РАН по адресу: 123995 г. Москва, ул. Б. Грузинская, д. 10. стр. 1, конференц-зал.
С диссертацией можно ознакомиться в библиотеке ИФЗ РАН и на сайте www.ifz.ru. Автореферат размещён на официальном сайте Высшей аттестационной комиссии при Министерстве образования и науки Российской Федерации vak.ed.gov.ru и на сайте www.ifz.ru.
Автореферат разослан 23 января 2014 года.
Ученый секретарь диссертационного совета
Д 002.001.01, д.ф.-м.н. ..... , Онищенко Олег Григорьевич
Общая характеристика работы
Актуаттьнпгть трмн Высокопроизводительные системы играют заметную роль в различных отраслях геофизики, где зачастую возникает необходимость в масштабных расчётах при обработке данных и моделировании. Значительная доля расчётов в геофизике приходится на решение обратных задач. Ввиду сложности изучаемых явлений и процессов, точное решение подобных задач возможно только при численном моделировании. Традиционные высокопроизводительные системы - суперкомпьютеры - прекрасно справляются с такими задачами. Однако суперкомпьютеры обычно сильно загружены, и очередь на выполнение может достигать нескольких суток. Для решения задач можно воспользоваться вычислительными системами другого типа, распределенными, состоящими из различных компьютеров, объединенных в единую вычислительную систему. Распределённые вычислительные системы так же позволяют решать требовательные к ресурсам расчётные задачи в разумное время, однако не все расчётные задачи будут оптимально выполняться на распределённой системе. Расчётная задача, оптимально подходящая для распределённой вычислительной системы, должна обладать определённым типом параллелизма вычислений, который не должен предусматривать интенсивный обмен данными между потоками задачи во время выполнения.
Ключевым компонентом распределенных вычислительных систем являются программные продукты, называемые промежуточным программным обеспечением (англ. middleware) (промежуточное ПО). В задачи этого компонента входит организация многопользовательской работы в распределенных системах при максимальной защите от несанкционированного использования предоставляемых ресурсов. Активное развитие распределённых вычислительных систем
и их постоянно растущее число всё больше привлекает исследователей из всех отраслей науки, но большинство из них находят использование таких систем сложным и требующим определённых специфических навыков.
В рамках данной работы разработано веб-приложение для решения одного из классов обратных задач геофизики. Целью разработки этого приложения было сокрытие большей части технологических особенностей вычислений в распределенной вычислительной системе. Оно состоит из веб-интерфейса и средств стыковки с промежуточным программным обеспечением. Веб-интерфейс предоставляет возможность редактировать параметры вычислений, оценить время выполнения задания, отслеживать состояние его выполнения, а также проанализировать полученные результаты. Помимо удобств, использование веб-интерфейса обеспечивает дополнительную безопасность ввиду невозможности выполнения произвольного кода. Это позволяет отказаться от аутентификации пользователей мерами промежуточного программного обеспечения и скрыть от них детали запуска вычислений. Средства стыковки с промежуточным программным обеспечением являются программной платформой, предоставляющей определённые программные интерфейсы. Эти интерфейсы позволяют взаимодействовать с любым (поддерживаемым) промежуточным ПО существенно более простым способом и без знания специфики его работы. На их основе разработан упомянутый веб-интерфейс и может быть разработан другой, для решения других задач. Таким образом, созданный инструмент позволяет воспользоваться вычислительными возможностями распределенной системы исследователями, не имеющими специальных навыков работы с такими системами.
Другой аспект применения вычислительных систем касается непосредственного сбора геофизических данных. Регистраторы в составе станций сбора данных занимают одно из ключевых мест в си-
стемах оперативного геофизического мониторинга. От их параметров зависят как качество получаемых данных, так и оперативность их получения. Современные регистраторы для систем оперативного мониторинга должны обеспечивать передачу данных в реальном времени. Нередко используются беспроводные каналы связи общего пользования. Кроме того, регистраторы в портативном исполнении обычно отличаются от обычных компьютеров аппаратной архитектурой, что необходимо учитывать при разработке ПО для них.
Способы передачи в реальном времени различаются для различных типов получаемых на станции данных. Те данные, которые производят сейсмометры, акселерометры, магнитометры, термометры, барометры и другие приборы, применяемые в геофизике, можно назвать «временными рядами» (англ. time series). Для достижения оперативности и простоты эксплуатации сбор таких данных осуществляется по общепринятым протоколам реального времени. Если вновь устанавливаемая станция поддерживает такие стандарты, то их легко включить в существующую систему обработки информации в центрах сбора и хранения данных. Помимо этого, такой подход позволяет существенно упростить развёртывание густой сети станций, например, в зонах афтершоковой активности после крупных землетрясений, и делать это в максимально сжатые сроки. Таким образом, актуальной задачей стало создание программных средств, которые позволят реализовать протоколы реального времени для передачи регистрируемых временных рядов.
Примером второго типа данных могут служить данные измерений систем глобальных навигационных спутниковых систем (ГНСС). Такие данные представляют собой набор сообщений, содержащих разнородную информацию (характеристики эмитируемого сигнала, положение спутника, информация о состоянии приёмника) и имеющих нетривиальную лексическую структуру. Такая организация данных не может быть сведена к набору простых временных
рядов, хотя бы потому, что имеется значительное число типов сообщений, содержащих массивы переменной длины. Процедура регистрации, рекомендованная производителем приёмников плохо приспособлена как для передачи данных в режиме реального времени, так и для поиска и выборки из архива. Формат данных, полученный в результате такой процедуры не может быть эффективно использован для обмена. Обычно для этих целей используются стандартные форматы обмена, однако и они не могут рассматриваться как основа для создания оперативной службы в силу массы ограничений. Одно из возможных решений - разработка универсального формата для передачи и хранения данных в полном виде.
Другой аспект работы оперативной геофизической службы мониторинга - представление актуальной информации, основанной на регистрируемых данных. Часто для мониторинга того или иного геофизического процесса достаточно контролировать непосредственно измеряемую величину. Существуют задачи, в которых необходимо выполнять оперативную обработку комбинации таких данных. В общем случае процедура обработки может быть очень сложной, а результат обработки может представлять собой большой массив данных. На примере мониторинга состояния ионосферы с помощью сигналов ГНСС можно показать, что данные, которые поставляет эта служба, требуют особого подхода к визуализации. Актуальной становится задача разработки инструмента визуализации результатов в приведенном случае.
Целями данной работы являются создание программной платформы для интеграции с распределённой вычислительной системой, создание на её основе веб-интерфейса для решения одной из обратных задач геофизики; создание ПО для регистрации геофизических данных на станциях сбора данных; создание системы оперативного мониторинга состояния ионосферы.
Для достижения целей необходимо было решить следующие задачи:
1. На основе анализа существующих проектов, реализующих веб-приложения для работы с распределёнными вычислительными системами, и исследований доступных схем и программных средств их организации развернуть инфраструктуру распределённых вычислений, а также смонтировать и ввести в эксплуатацию необходимое вычислительное оборудование;
2. На основе выработанных принципов взаимодействия пользователя и распределённой вычислительной системы на программном уровне разработать платформу интеграции веб-приложений;
3. На базе платформы интеграции разработать и развернуть веб-приложение и провести пробные запуски;
4. Опираясь на исследования существующих схем использования портативных станций сбора данных и анализа форматов хранения и протоколов передачи, в том числе реального времени, представить оптимальные решения для каждого из упомянутых ранее типов данных;
5. Разработать системное и прикладное ПО на основе исследований существующих решений для организации автономного регистратора с низким энергопотреблением и аппаратной архитектурой ARM;
6. Рассмотреть возможные пути решения проблем передачи оперативных данных в беспроводных сетях общего пользования. Выбрать оптимальные решения и внедрить их для автономного регистратора. Это включает в себя как необходимое системное ПО, так и ПО для передачи данных измерений в реальном времени.
7. Разработать и внедрить систему оперативного мониторинга по данным сети станций ГНСС. По результатам критического об-
зора технологий визуализации разработать и развернуть веб-интерфейс для представления данных системы оперативного мониторинга.
Основные положения, выносимые на защиту:
1. Промежуточное программное обеспечение - платформа для интеграции геофизических веб-приложений со слабо связанной распределённой вычислительной системой, а также основанное на нем веб-приложение. Основное назначение разработанного промежуточного программного обеспечения - предоставить простой доступ к распределённым вычислительным ресурсам без необходимости взаимодействия с последними на низком уровне. Платформа ориентирована на решение обратных задач, которые могут быть представлены в рамках формализма апостериорной функции распределения вероятности. В разработанном веб-приложении, в качестве практического примера использования платформы, реализован точный расчет апостериорной функции распределения для задачи определения параметров сейсмической анизотропии коры и верхней мантии с помощью инверсии волновых форм обменных волн и волн SKS. Кроме организации вычислений разработанное приложение предоставляет инструменты анализа структуры апостериорной функции распределения.
2. Комплекс программных приложений, реализующих службу оперативного сбора и передачи сейсмических данных. Служба основана на использовании стандартного протокола передачи данных в реальном времени Seedlink и файловом формате miniSEED. Разработка ориентирована на применение энергоэффективных процессоров с архитектурой ARM для сбора данных, и беспроводных каналов связи для их передачи. Применение разработанной службы может быть эффективно расширено, с одной стороны, для применения процессоров х86 в системе сбора, и для организации сбора и передачи любых данных, пред-ставимых в виде временного ряда, с другой стороны.
3. Веб-приложение, предназначенное для визуализации результатов расчета программы высокоорбитальной радиотомографии. Разработаны вспомогательные программные решения, в первую очередь - уровень абстракции, инкапсулирующий данные результатов радиотомографии в высокоуровневое представление. Полученные на его основе представление данных и методов, схема хранения результатов расчета в реляционной системе управления базами данных позволили реализовать механизмы, осуществляющие визуальное представление результатов расчета с использованием современной техники интерполяции, а также веб-интерфейс, представляющий простой доступ к процедурам визуализации.
Научная новизна:
1. Разработана программная платформа интеграции слабосвязанных параллельных вычислительных задач с промежуточным ПО распределённых вычислительных систем. Платформа предоставляет специальные программные интерфейсы для разработчика прикладного ПО, исполнение которого предусматривается в распределённой системе. Эти программные интерфейсы не обязывают разработчика учитывать на каком именно промежуточном ПО будет запущена его задача.
2. В работе применена технология динамического создания экземпляров СУБД для хранения и обеспечения доступа к результатам. Такое решение позволяет изолировать результаты расчётов, а также делает возможным быструю передачу копии базы данных пользователю (в формате СУБД).
3. Проведено сравнение и сделаны выводы относительно двух технологий организации виртуальных частных сетей - ОрепУРИ и ББТР. Проверен феномен ТСР-перегрева на этих двух технологиях и сделан вывод об их поведении под воздействием этого феномена.
4. Внедрена методика и формат хранения оперативных данных систем ГНСС. Это позволяет сохранить и передать любые сообщения, получаемые с приёмников ГНСС, а также позволяет оперативно использовать полученные данные в широком спектре задач. Для демонстрации этого был создан веб-интерфейс публикации результатов моделирования на основе оперативных данных систем ГНСС.
Практическое применение
Практическая значимость диссертационной работы заключается в получении новых инструментов проведения геофизических исследований, получения, передачи и сохранения данных наблюдений, а также их оперативной обработки и публикации. Некоторые созданные в рамках данной работы системы успешно эксплуатируются Росгидрометом (Результаты внедрялись при выполнении НИП и ОКР по теме «Разработка аппаратно-программного комплекса сбора, передачи и хранения данных для информационно-аналитических подразделений станций геофизических наблюдений», шифр «2008-90-1-О»),
Апробация работы
Основные результаты работы докладывались на:
1. Международной конференции «Современные информационные технологии для фундаментальных научных исследований в области наук о Земле», 8-13 сентября 2014 года, г. Петр опавловск-Камчатский
2. Четвертой международной конференции «Распределённые вычисления и Грид-технологии в науке и образовании» 28 июня-3 июля 2010 года, г. Дубна, ОИЯИ
3. Пятой международной конференции «Распределённые вычисления и Грид-технологии в науке и образовании» 16 июня-21 июля 2012 года, г. Дубна, ОИЯИ
4. Генеральной ассамблеи Европейского союза наук о Земле (англ. European Geosciences Union General Assembly) 22-27 апреля 2012, г. Вена, Австрия
5. Конференции молодых сотрудников и аспирантов ИФЗ РАН 2829 апреля 2014 года, г. Москва ИФЗ РАН
6. Конференции молодых сотрудников и аспирантов ИФЗ РАН 2324 апреля 2013 года, г. Москва ИФЗ РАН
7. Конференции молодых сотрудников и аспирантов ИФЗ РАН 16 апреля 2012 года, г. Москва ИФЗ РАН
8. Конференции «Базы данных, инструменты и информационные основы полярных геофизических исследований» 24-26 мая 2011 года, г. Троицк ИЗМИРАН
Диссертационная работа была выполнена при поддержке грантов РФФИ 10-07-00491-а, 11-05-00988-а, 11-07-12045-ОФИ-М-2011
Личный вклад автора
Автор принимал активное участие в настоящей работе, в частности в выполнении и постановке таких задач как: непосредственная работа с аппаратурой, проектирование сетевой инфраструктуры, проектирование прикладного и системного ПО, системное программирование, развёртывание систем, написание прикладного ПО, запуск исследовательских расчётов, интерпретация результата и показателей производительности хода вычислений.
Публикации
Основные результаты по теме диссертации изложены в 22 изданиях, 9 из которых изданы в журналах, рекомендованных ВАК, 12 — в тезисах докладов и материалах конференций.
Объем и структура работы
Диссертация состоит из введения, двух глав, заключения и приложения. Полный объем диссертации 113 страниц текста с 12 рисунками и 3 таблицами. Список литературы содержит 82 наименования.
Содержание работы
Во введении обосновывается актуальность исследований, проводимых в рамках данной диссертационной работы, приводится обзор научной литературы и существующих решений по изучаемой проблеме, формулируется цель, ставятся задачи работы, сформулированы научная новизна и практическая значимость представляемой работы.
Первая глава посвящена разработке платформы интеграции с распределёнными вычислительными системами. Анализ показал, что многие современные высокопроизводительные системы строятся вокруг определенных парадигм: «High performance computing», «High-throughput computing», «Many-task computing» и так называемые системы анализа данных (англ. Data mining). Классификация построена на основе сложившихся в мировой практике определений. Применяемые в работе распределённые вычислительные системы, согласно такой классификации, являются «High-throughput C0mputing»-CHCTeMaMH.
Для организации вычислений в рамках данной работы мы используем вычислительные мощности двух территориально распределённых кластеров, специально созданных при непосредственном участии автора. Два кластера, построенные на базе процессоров Intel Хеоп серий Е5420, Е5520 и Е5630, используют в качестве внутренней связи сеть Gigabit Ethernet. Один из кластеров оснащён системой хранения с общим доступом.
Центральное звено распределенной вычислительной системы - промежуточное ПО было установлено на отдельном сервере. В процессе выбора промежуточного ПО из множества доступных была испытана распределенная система на базе Globus Toolkit, однако, оби-
лие функций, которые в рамках данной работы не требуются и общая сложность этого ПО привела к последующему выбору ПО Gridway.
Большое внимание уделено организации доступа к данным в грид и высокопроизводительных системах. Требования к системе хранения данных (далее СХД) могут в значительной мере изменяться в зависимости от решаемой высокопроизводительной системой задачи. Высокопроизводительные приложения использующие большие объемы данных в своих вычислениях требуют высокой производительности СХД и её одновременной доступности с произвольного количества узлов. В одном из установленных кластеров используется СХД, подключенная одновременно ко всем вычислительным узлам посредством соединения Serial Attached SCSI. Среди высокоуровневых технологий доступа рассмотрены распределенные системы хранения на базе GlusterFS и Hadoop HDFS. Однако, для непосредственной реализации проведен анализ работы файловых систем GFS2 и OCFS в комбинации с различными системами управления кластерами: cman, Pacemaker и corosync. В результате ряда экспериментов для одного из кластеров была выбрана комбинация gfs2+corosync. Другой кластер использует упрощенный режим доступа посредством сетевой файловой системы NFS.
В высокопроизводительных системах ключевым программным механизмом является система запуска и управления очередями (иначе говоря - планировщик). Система запуска - это та система, которая непосредственно взаимодействует с пользователем, получая от него необходимые для выполнения расчетов данные и параметры. В распределенных вычислительных системах используются похожие по функционалу системы, заметным отличием последних принято считать возможность работать в гетерогенной среде и подключаться к другим системам запуска. ПО для организации распределённых вычислений - это специальный класс ПО, называемый промежуточное ПО (middleware), призванный организовать много-
пользовательскую работу в распределенных системах, а также обезопасить распределенную систему от несанкционированного использования. Распределенные системы, использующие такое ПО, называются грид-системами, или просто грид.
Кластеры, в свою очередь, имеют собственные системы очередей и системы централизованного запуска. Эти системы работают в рамках кластера и подразумевают исключительный контроль над вычислительными ресурсами. Таким образом, запускать задачи на кластере допустимо только через подобную систему. В большинстве реализаций система управления вычислительными ресурсами выполняется на головном узле, а также на всех вычислительных узлах и обслуживает очередь, посредством которой пользователи могут отправлять и удалять свои задания, а также получать информацию об их состоянии. Существует множество систем планирования задач и управления ресурсами. В данной работе рассмотрены Sun/Oracle Grid Engine (SGE), Load Sharing Facility (LSF) и Torque/PBS. В результате анализа был сделан выбор в пользу ПО Torque.
Важное место в работе применена технология виртуализации вычислительных узлов на технологии Linux KVM. Использование виртуальных машин позволяет гибко регулировать вычислительные нагрузки за счёт изменения количества доступных процессорных ядер и объёма ОЗУ. В работе представлены результаты испытаний такого решения при помощи тестов High Performance LINPACK. Технология виртуализации, используемая в данной работе практически не снижает производительность процессора. Это достигается за счёт использования аппаратного ускорения виртуализации, в частности технологий VT-x и Extended Page Tables (ЕРТ), которые позволяют работать виртуальной машине практически без потерь в производительности.
Центральную частью работы является разработка структуры и функций программной платформы интеграции с распределен-
ными вычислительными системами. Платформа базируется на ПО Сос1е^пиег и имеет выраженную клиент-серверную архитектуру. Часть модулей реализована при помощи платформы №>с1е^5. Приведено описание основных методик и приёмов, в частности Мос1е1-У1е\у-Соп1:го11ег, используемых при разработке.
Для иллюстрации возможностей созданного ПО было разработано веб-приложение для решения одной из обратных задач геофизики. Задача определения параметров анизотропии коры и верхней мантии по данным телесейсмических наблюдений решается с использованием аппарата апостериорной функции распределения вероятности. Традиционно обратная задача - это поиск параметров модели явления или процесса по данным наблюдений за явлением или процессом. Таким образом, обратная задача может быть поставлена как поиск таких значений параметров модели, которые наиболее адекватно описывают наблюдённые данные. В идеальном случае решением задачи является единственная комбинация параметров. Даже отвлекаясь от рассмотрения традиционных проблем обратных задач, в частности, доказательства единственности решения и проблемы устойчивости решения, такую формулировку нельзя считать удовлетворительной. Отметим, что данные наблюдений не могут быть получены точно и в результатах их измерений содержится погрешность. Кроме этого, выбранная модель, являясь приближением, не может полностью объяснить данные наблюдений. В таком случае вместо поиска единственного значения целевой функции имеет смысл находить все значения, которые, в смысле некоторого критерия, одинаково хорошо описывают наблюдённые данные. Таким образом, решением задачи будут являться одна или несколько областей в пространстве параметров, т.е. континуум комбинаций параметров. Возникает проблема интерпретации полученного ответа. Следует определить правила анализа такого рода решения: выбор «средних» значений параметров, определения их разрешающей спо-
собности (погрешности в определении параметров) и других характеристик.
Одним из методов решения проблемы является применение аппарата апостериорной функции распределения вероятности. Формулировка решения в терминах функции распределения вероятности позволяет нам применить для анализа аппарат теории вероятностей: рассчитать моменты распределения плотности вероятности, построить сечения, определить наиболее вероятные значения. Кроме этого мы можем построить маргинальные распределения для выбранных параметров, а также другие интересующие нас величины.
Следует подчеркнуть, что для проведения подобного анализа необходимо вычислить значения функции для всех точек пространства параметров. Точное численное решение задачи сводится к табулированию этой функции, например, на прямоугольной решётке. Даже при относительно небольшом числе параметров эта процедура может занимать значительное время, что делает задачу практически невыполнимой. Использование большой вычислительной мощности существенно расширяет круг задач, допускающих точное численное решение. Необходимо заметить, что значение функции для каждой комбинации параметров вычисляется независимо, поэтому при её вычислении не возникает необходимости во взаимодействии между параллельными вычислительными процессами. Этот факт снимает ограничение на выполнение в распределённых вычислительных системах, или грид.
В рамках данной работы разработано грид-приложение, скрывающее большую часть технологических особенностей вычислений в грид. Веб-интерфейс предоставляет возможность редактировать параметры вычислений, оценить время выполнения задания, отслеживать состояние его выполнения, а также проанализировать полученные данные. Помимо удобств, использование веб-интерфейса обеспечивает дополнительную безопасность ввиду невозможности вы-
полнения произвольного кода пользователем. Это позволяет отказаться от аутентификации пользователей мерами промежуточного программного обеспечения для грид и скрыть от пользователя детали запуска вычислений в грид.
Вторая глава посвящена анализу протоколов передачи данных в реальном времени и разработке прикладного и системного ПО получения и передачи оперативных данных, а также созданию оперативной службы мониторинга состояния ионосферы по данным сети станций ГНСС.
Рассмотрены распространенные протоколы передачи в реальном времени и форматы хранения данных, такие как Antelope, Earthwork, LISS, Seedlink. Эти протоколы используются для передачи данных, которые поставляют такие приборы как сейсмометры, акселерометры, магнитометры и другие приборы, применяемые в геофизике. В работе проведена оценка сильных и слабых сторон упомянутых протоколов, в частности, то, насколько интенсивно продолжается развитие этих технологий. Решения производителей оборудования зачастую являются устройство-зависимыми и закрытыми, поэтому в рамках данной работы не рассматриваются. В рамках данной работы была создана портативная сейсмостанция, использующая протокол Seedlink для передачи регистрируемых данных в реальном времени посредством сотовой связи.
Данные глобальных навигационных спутниковых систем представляют собой набор сообщений, имеющих нетривиальную лексическую структуру. Такая организация данных не может быть сведена к набору простых «временных рядов». Поэтому для работы с такими данными необходимы специальные программные решения. На основе оригинального формата были разработаны программные средства, позволяющие получать, хранить и передавать массивы таких данных.
Регистраторы геофизических данных могут применяться в самых разных условиях - от полевых установок при тяжелых климатических условиях до установки внутри помещения. В первом случае основными аппаратными характеристиками являются низкое энергопотребление, компактные размеры, устойчивость к внешним воздействиям. Для удобства в рамках данной работы обобщим такие устройства как просто «регистраторы с низким энергопотреблением». Вторая группа - регистраторы, устанавливаемые в местах, где они не ограничены по электропитанию (в масштабах десятков ватт), поэтому вполне допустимо использовать потребительские настольные компьютеры, в частности, неттопы. Рассматривая решения с низким энергопотреблением, следует отдельно остановиться на выборе архитектуры системы - концептуальной структуре компьютера. Практическое применение имеют две архитектуры - Intel IA32 (х86) и архитектура ARM. LA32 - это традиционная, самая массовая в потребительском секторе архитектура. До недавнего момента целью разработчиков таких систем не являлось уменьшение энергопотребления, поэтому зачастую это мощные и производительные системы с тепловыделением до 150Вт TDP (TDP - Thermal Design Package, методика оценки тепловыделения электронных компонентов и сборок). Другая архитектура, являющаяся крайне популярной в отрасли портативных устройств - ARM. Принципиальным её отличием от х86-систем является использование сокращенного набора инструкций -для совершения сложных операций, например, с вводом-выводом ARM-системе придется выполнить в несколько раз больше операций, чем х86-системе. Тем не менее это редко сказывается на производительности при решении вычислительно простых задач, вроде сбора данных.
В работе рассмотрена острая проблема с организацией каналов передачи оперативных данных. Приведены обзоры доступных технологий радиодоступа, таких как 802.11 WIFI, GSM, UMTS, LTE,
CDMA, произведено их сравнение. Отдельно рассмотрены особенности работы в беспроводных сетях общего доступа зачастую препятствующих работе регистратора, в частности, использование «частных» и/или динамических ip-адресов провайдерами такой связи. Приведён ряд решений, в частности использование динамического DNS, позволяющих решить эти сложности. Кроме этого, предложено несколько "радикальных" методов обхода упомянутых сложностей при помощи виртуальных частных сетей. На практике рассмотрено влияние эффекта "TCP-перегрева" на туннель виртуальной частной сети. В рамках исследования было поставлено несколько экспериментов в которых показано реальное воздействие этого эффекта на способность туннеля к передаче данных.
В части «Реализация пункта сбора данных и оперативного мониторинга ГНСС» описан инструмент, предназначенный для визуализации состояния ионосферы. Визуализация построена на основе образа, полученного методом высокорбитальной радиотомографии. Исходная информация собирается с сети наземных станций ГНСС, а результатом являются значения концентрации электронов в ионосфере для набора высот. Упомянутый инструмент является частью оперативной службы геофизического мониторинга ионосферы. В рамках работы создан инструмент, публикующий карту полного содержания электронов, а также более сложный инструмент визуализации карты, отображающей содержание электронов на различных высотах. Также предоставляется возможность получения вертикальных срезов в заданных пользователем точках. Инструмент построен на веб-технологиях и работает в интерактивном режиме.
Заключение содержит оценку выполненным работам, а также указывает на пути возможного развития описанных в работе методов и технологий. Приведен критический анализ результатов, полученных в рамках данной работы.
Публикации автора по теме диссертации
1. Алёшин И. М., Холодков К. И. Применение распределённых вычислительных систем к расчёту апостериорных распределений // Геофизические исследования. 2014. № 3 [принято в печать].
2. Оперативная служба мониторинга ионосферы по данным станций глобальных навигационных спутниковых систем / И. М. Алёшин, В. В. Алпатов, А. Е. Васильев [и др.] // Геомагнетизм и аэрономия. 2014. Т. 54, № 4. С. 1-8.
3. Real-time 3D ionosphere imaging from ground based GNSS stations data / К. I. Kholodkov, I. M. Aleshin, V. Alpatov et al. // Geoinformatics Research Papers. Kaluga: Hie Partnership Conference Geophysical observatories, multifunctional GIS and data mining, 2013. Sep-Oct.
4. Globus toolkit web interface - application to seismology / I. M. Aleshin, К. I. Kholodkov, V. N. Koryagin et al. // Cluster Computing. Lviv, Ukraine: Second International Conference "Cluster Computing", 2013. Jun-Jul.
5. Kholodkov К. I. Implementation of seismic data inversion as grid-backed web service // Russian journal of Earth sciences. 2013. May. Vol. 13. P. ES1003.
6. Инверсия сейсмических данных: высокоуровневый веб-интерфейс к инструментарию Globus Toolkit / К. И. Холодков, И. М. Алёшин, С. С. Бургу-чев [и др.] // Научно-техническая информация. Серия 1. Организация и методика информационной работы. 2013. №7. С. 19-22.
7. Опыт развертывания грид-инфраструктуры для поддержки вычислительных веб-сервисов / К. И. Холодков, И. М. Алёшин, В. Н. Корягин [и др.] // Научно-техническая информация. Серия 1. Организация и методика информационной работы. 2012. Апр. №4. С. 15-19.
8. Geophysical data inversion grid aided web service prototype / I. M. Aleshin, К. I. Kholodkov, V. N. Koryagin et al. // Distributed Computing and Grid-Technologies in Science and Education: Proceedings of the 5th International Conference. 2012. Jul.
9. Implementation of probabilistic approach in solving inverse problems as a grid-backed web service. / К. I. Kholodkov, I. M. Aleshin, V. N. Koryagin et al. // EGU General Assembly Conference Abstracts. Vol. 14. 2012. P. 4585.
10. Using real-time protocol to transmit seismic data over cellular and satellite channels / S. S. Burguchev, I. M. Aleshin, К. I. Kholodkov et al. // Book of Abstracts: The 33rd General Assembly of the European Seismological Commission (GA ESC 2012), 19-24 August and Young Seismologist Training Course (YSTC 2012), 25-30 August 2012, Moscow-Obninsk, Russia. Obninsk: Poligraphiqwik, 2012. URL: http://books.google.ru/books?id=xRw2lQEACAAJ.
11. Инверсия геофизических данных (грид-приложение) / К. И. Холодков, И. М. Алёшин, Бургучев С. С. [и др.] // Базы данных, инструменты и информационные основы полярных геофизических исследований (POLAR 2011 ) / Троицк. 2011. Май.
12. Использование беспроводных сетей для передачи сейсмических данных по протоколу реального времени / Бургучев С.С., И.М. Алёшин, К. И. Холодков [и др.] // Базы данных, инструменты и информационные основы полярных геофизических исследований ( POLAR 2011 ) / Троицк. 2011. Май.
13. Опыт создания портативной автономной сейсмологической станции, работающей по протоколу реального времени / ДА. Ильинский, И.М. Алёшин, К. И. Холодков [и др.] // Сейсмические приборы. 2011. Т. 47, № 1. С. 52-67.
14. Применение слабо связанных распределенных вычислительных систем в геофизике / К. И. Холодков, И. М. Алёшин, Корягин В. Н. [и др.] // Распределенные вычисления и Грид-технологии в науке и образовании: Труды 4-й международной конференции / ОИЯИ. Дубна: 2010. Июнь-Июль.
15. Прототип грид веб-службы для решения обратных задач геофизики / К. И. Холодков, И. М. Алёшин, Корягин В. Н. [и др.] // Распределенные вычисления и Грид-технологии в науке и образовании: Труды 5-й международной конференции / ОИЯИ. Дубна: 2012. Июнь-Июль.
16. Прототип грид веб-службы для решения обратных задач геофизики / К. И. Холодков, И. М. Алёшин, Корягин В. Н. [и др.] // Распределенные
вычисления и Грид-технологии в науке и образовании: Труды 5-й международной конференции / ОИЯИ. Дубна: 2012. Июнь-Июль.
17. Метод решения некоторых обратных задач в геофизике с использованием слабо связанных распределенных вычислительных систем / И.М. Алешин, К. И. Холодков, О. В. Сухорослов [и др.] // Научно-техническая информация, Серия 2: Информационные процессы и системы. 2010. № 12. С. 14-15.
18. Использование технологий виртуальных частных сетей для организации оперативных систем геофизических наблюдений / И.М. Алешин, А.Е. Васильев, К.И. Холодков [и др.] // Сейсмические приборы. 2014. Т. 50, № 1. С. 63-69.
19. Use of distributed computing systems in seismic wave form inversion / I. M. Aleshin, M. N. Zhizhin, К. I. Kholodkov [и др.] // Russia journal of Earth sciences. 2009. T. 11.
20. Использование распределенных вычислительных систем при инверсии сейсмических волновых форм / И. М. Алешин, М. Н. Жижин, К. И. Холодков [и др.] // Международная конференция «ИТОГИ ЭЛЕКТРОННОГО ГЕОФИЗИЧЕСКОГО ГОДА». Переславль-Залесский: 2009. Июнь.
21. Determination of anisotropic properties of lithosphere and upper mantle by join inversion of receiver function and SKS waveforms / V. N. Koryagin, I. M. Aleshin, К. I. Kholodkov et al. Vol. 11 of Geophysical Research Abstracts. EGU General Assembly, 2009.
22. Опыт создания оперативной службы сбора данных сети наземных станций глобальных навигационных спутниковых систем / И.М. Алешин, В.В. Алпатов, А.Е. Васильев [и др.] // Международная Конференция "Современные информационные технологии для фундаментальных научных исследований в области наук о Земле". 2014. сен. С. 38.
- Холодков, Кирилл Игоревич
- кандидата технических наук
- Москва, 2014
- ВАК 25.00.10
- Разработка технологии удаленного доступа и обработки геолого-геофизических данных в распределенной вычислительной системе
- Создание АРМ обработки и комплексного анализа данных морских геофизических съемок на базе ГИС-технологий
- Автоматизированная интегрированная информационно-обрабатывающая система для геофизических исследований нефтяных и газовых скважин
- Разработка компьютеризованной технологии геофизических исследований нефтяных и газовых скважин
- Разработка информационного обеспечения для автоматизированной интегрированной системы сбора, обработки и обобщения геолого-геофизических данных