Бесплатный автореферат и диссертация по биологии на тему
Семантическая модель описания почв и почвенная информационная система
ВАК РФ 03.02.13, Почвоведение

Автореферат диссертации по теме "Семантическая модель описания почв и почвенная информационная система"

На правах рукописи

Рыбальский Николай Николаевич

СЕМАНТИЧЕСКАЯ МОДЕЛЬ ОПИСАНИЯ ПОЧВ И ПОЧВЕННАЯ ИНФОРМАЦИОННАЯ СИСТЕМА

Специальность 03.02.13 - почвоведение

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук

2 5 ОКТ 2012

МОСКВА-2012

005053914

Работа выполнена на кафедре географии почв факультета почвоведения Московского государственного университета имени М.В. Ломоносова

Научный руководитель: Иванов Александр Васильевич, доктор биологических наук, ведущий научный сотрудник кафедры географии почв факультета почвоведения МГУ имени М.В. Ломоносова

Официальные оппопеиты:

Васенев Иван Иванович, доктор биологических наук, профессор, заведующий кафедрой экологии факультета почвоведения, агрохимии и экологии Российского государственного аграрного университета - МСХА имени К.А. Тимирязева

Рухович Ольга Владимировна, кандидат биологических наук, старший научный сотрудник Всероссийского научно-исследовательского института агрохимии имени Д.Н. Прянишникова Российской академии сельскохозяйственных наук

Ведущая организация: Почвенный институт имени В.В. Докучаева РАСХН

Защита состоится «9» октября 2012 г. в 15 часов 30 минут, в ауд. М-2 на заседании диссертационного совета Д 501.001.57 при МГУ имени М.В. Ломоносова на факультете почвоведения по адресу: 119991, ГСП-1 Москва, Ленинские горы, МГУ имени М.В. Ломоносова, д. 1, стр. 12, ф-т почвоведения.

С диссертацией можно ознакомиться в библиотеке факультета почвоведения МГУ имени М.В. Ломоносова

Автореферат разослан «4» сентября 2012 года

Ученый секретарь диссертационного совета

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Информационные технологии (ИТ) дают возможность получать информацию о почвах ежедневно и обрабатывать ее в реальном времени. ИТ позволяют проводить пространственно-распределенный статистический анализ и многое другое - от построения системы информативных признаков (диагностики) до распознавания новых объектов (классификации) (Рожков, 2007, 2011). Расширение спектра возможностей получения почвенных данных, обусловленное развитием современных цифровых методов, приводит к острой необходимости разработки почвенных информационных систем (ИС).

Исследование современного состояния российских и зарубежных разработок в области использования ИТ для работы с почвенными данными показало, что наиболее актуальными являются почвенные ИС третьего поколения, в которых присутствуют три компонента: реляционные базы данных (БД), геоинформационные системы (ГИС) и использование сети Интернет (Иванов, Рыбальский, Сафрошкин, 2008). Такие системы используются для прогнозирования, моделирования и других почвенных исследований (Хомяков, 1997), таких как прогноз опасности эрозии, окисления и других типов деградации почв; почвенный мониторинг; агро-экологическое районирование и многих др. На данный момент известно несколько десятков региональных систем, более 10 почвенных ИС национального уровня (Australian Soil Resource Information System; National Soil Information System (США) и др.), а также несколько мультинациональных и глобальных систем (European Soil Database, Европа; SOTER, глобальная почвенная ИС и др.) (Finke, 2001; Brough, 2006; van Engelen, 2010). В 70-80-х гг. XX в. российскими почвоведами был внесен существенный вклад в разработку общих идей построения почвенных ИС на первом этапе - разработке атрибутивных баз данных (Шишов и др., 1975; Рожков, 1976, 1980, 1983). Несмотря на повышение интереса к подобным разработкам (Белоусова, Мешалкина, 2009; Крьпценко, Голозубов, 2010), в РФ до сих пор не существует актуальной действующей почвенной ИС (Колесникова и др., 2010), поэтому одной из важнейших задач является создание отечественной системы.

Невзирая на стремительное развитие зарубежных почвенных ИС, остается актуальной проблема сохранения первичного смысла исходной информации о почвах при переводе почвенной информации из текстового, «бумажного» формата в электронную форму. Эта проблема является следствием слабо проработанной модели описания предметной области, и для ее решения необходимо создание системы формализации разнородных почвенных данных, отражающей в себе все многообразие почвенных объектов и свойств почвы и позволяющей избежать искажения получаемой информации, слабой масштабируемости и трудоемких ручных приемов работы. Кроме того, формализация связана с решением фундаментальной проблемы математизации почвоведения (Рожков, 2007) - отсутствием класса моделей, позволяющих включить в активное использование специфические почвенные категории и понятия. Работа над этой проблемой приближает нас к тому, чтобы сделать почвоведение точной наукой, о чем мечтал основатель учения о почвах В.В. Докучаев (Докучаев, 1886).

3

Цель работы: изучение информационных взаимоотношений и разработка методов формализации основных понятий предметной области - почвоведения, необходимых для перехода от визуально доступных форм хранения почвенных документов к электронным формам, и создание семантической модели описания почв в виде почвенной ИС.

В работе поставлены следующие задачи:

1) провести анализ современного состояния зарубежных и отечественных разработок в области использования ИТ для работы с почвенными данными, исследовать существующие модели их описания;

2) дать информационную характеристику документам предметной области исследования, оценить проблемы и возможности перехода от визуальных форм хранения почвенных данных к электронным формам;

3) разработать информационную модель описания почвы для использования в электронной среде хранения и обработки данных, и на ее основе создать систему формализации разнородных почвенных данных;

4) спроектировать и создать почвенную ИС описания предметной области;

5) исследовать возможность гармонизации почвенных описаний, выполненных с использованием разных методик морфологического описания почв.

Научная новизна. Впервые, с использованием семантического подхода, проведен информационный анализ текстов почвенных документов и сформулирован принцип квантования почвенной информации, заключающийся в том, что передача почвенной информации осуществляется стандартными дискретными порциями, имеющими однородный состав структурных элементов и однородную структуру внутренних отношений, и инвариантных относительно формы хранения почвенных данных - вербальной, визуальной или электронной.

Впервые разработана модель предметной области, описывающая почву как семантические отношения, возникающие между именами базовых понятий предметной области - показателей, их значений, методов определения значений показателей свойств почв, и именами характеризуемых ими почвенных объектов. Данная модель, реализованная в форме оригинальной БД, является основополагающей частью почвенной ИС. Она позволяет переводить данные из текстовых (аналоговых) описаний почвенных разрезов в электронную (цифровую) форму хранения и восстанавливать их из цифровой формы хранения в аналоговую без потерь и искажения информации - точность авторского описания поддерживается и контролируется полнотой метаданных, описывающих предметную область.

Разработанная модель описания предметной области впервые позволяет дать математическую интерпретацию описанию почвы - как ассоциированного массива показателей свойств почв; и почвенного профиля в целом - как дерева ассоциированных массивов показателей свойств почв в пространстве почвенных объектов. Подобная интерпретация позволяет устанавливать и выражать связи между элементами строения почвы и их показателями через формальные логические отношения.

Практическая значимость. Использование почвенной ИС, описывающей предметную область, позволяет обеспечить ввод, хранение и обработку большого количества фактических материалов по почвам. В основе созданной ИС лежит разработанная оригинальная модель БД, которая позволяет объединить показатели, описывающие свойства почвы, с объектами, из которых состоит почвенное тело, в единую систему, обеспечивая взаимодействие между ними при помощи формальной логики на базе набора определенных алгоритмов, теоретически позволяя работать с бесконечным множеством данных. Благодаря концепции минимальной информационной почвенной единицы, которая играет роль своеобразного кванта почвенной информации, разработанная почвенная ИС стала гибкой, легко расширяемой и поддерживающей масштабируемость и интероперабельность (способность взаимодействовать с другими почвенными ИС и БД без каких-либо ограничений).

Важная особенность разработанной почвенной ИС, иллюстрирующая принцип квантования почвенной информации, - вывод полноценного описания почвенного разреза в том же виде, в котором он существовал на бумажном носителе, что по сути является сохранением смысловых и логических связей между почвенными показателями и объектами. Коллективный доступ к системе, осуществляемый через Интернет, позволяет преодолеть проблему того, что большое количество получаемой научной информации о почвах оказывается в ограниченном использовании. Другими преимуществами данной модели являются открытость инфраструктуры, возможность персонализацни интерфейса, сохранение алгоритмов обработки данных и извлечения информации при изменении списочного состава индексированных показателей и многое др.

Разработанная модель применена для реализации Почвенно-географической базы данных России (ПГБД).

Методология исследования. В работе использованы современные методы поиска и анализа информации, методы проектирования и построения моделей, методы преобразования и кодирования информации для ее представления в цифровых форматах и методы компьютерного моделирования для создания почвенной ИС.

Апробация работы. Результаты работы и основные положения были представлены и обсуждались на V съезде Всероссийского общества почвоведов им. В.В. Докучаева (Ростов-на-Дону, 2008), Всероссийской научной конференции «Научный сервис в сети Интернет: решение больших задач» (Новороссийск, 2008), XVII Международной конференции студентов, аспирантов и молодых ученых по фундаментальным наукам «Ломоносов - 2010» (Москва, 2010), Международной конференции «Научно-практические аспекты развития современной техники и технологий в условиях курса на инновации» (Санкт-Петербург, 2010), Европейском рабочем совещании «Global Soil Fertility: The role of next generation smart fertilizers» (Wageningen (Нидерланды), 2011), а также на рабочем заседании Международного информационно-справочного центра по почвам (ISRIC) (Wageningen (Нидерланды), 2011). Результаты работы обсуждались на заседания семинара по цифровой почвенной картографии (ЦПК) под-

5

комиссии "Картография почв" и комиссии по педометрике Общества почвоведов им. В.В. Докучаева в Почвенном институте им. В.В. Докучаева. Разработанная семантическая модель обсуждалась на совещании, посвященном интеграции почвенных БД России, Украины и Белоруссии (Москва, 2011).

Публикации. По теме диссертации опубликовано 12 работ, из них 2 статьи в реферируемых изданиях, включенных в список ВАК.

Структура и объем работы. Диссертация состоит из введения, трех глав и выводов, изложенных на страницах машинописного текста. Содержит таблицы и рисунков. Список литературы насчитывает наименования, из них на иностранном языке.

Благодарности. Автор выражает благодарность всем участникам рабочей группы, разрабатывающей ПГБД и особенно сотрудникам кафедры географии почв факультета почвоведения МГУ им. М.В. Ломоносова - В.М. Колесниковой, И.О. Алябиной, С.А. Шобе и сотрудникам Почвенного института им. В.В. Докучаева - В.А. Рожкову, Б.В. Шеремету и В.В. Сизову. Автор особенно признателен Ю.Л. Мешалкиной за ценные советы и критические замечания, способствовавшие улучшению содержания работы. Глубокая благодарность научному руководителю A.B. Иванову за неоценимую помощь и поддержку на всех этапах научной работы.

ОБЪЕКТЫ И МЕТОДЫ ИССЛЕДОВАНИЯ

Объектом исследования является множество понятий и категорий предметной области -почвоведения, использующихся при изучении почвы.

Использован метод описания почв, позволяющий переводить почвенные данные из бумажных носителей в электронную форму хранения и восстанавливать их из электронной формы в визуальную без потерь и искажения информации. Метод основан на использовании семантических отношений, возникающих при информационном обмене между именами элементов множеств четырех базовых понятий, описывающих предметную область - почвенных объектов, почвенных показателей, их значений и методов их определения.

Семантическая модель описания почвы была разработана в ходе анализа содержания и струюуры почвенных показателей, а также исследования модельных представлений в почвоведении. При разработке формализованного массива почвенных данных были использованы методы формализации и семантический анализ, основанные на информационном анализе текстов первичных документов, описывающих почвенные объекты.

Разработка инфологической и даталогической модели БД проводилась с использованием различных программных комплексов, таких как ErWin, Visio, MySQL и др. Для разработки интерфейса ввода-вывода данных был использован язык программирования PHP, который также был использован для автоматизации визуализации почвенных профилей.

Визуализация и вывод карт в Интернет осуществлялись при помощи пространственно-

б

распределенных интернет-приложении в Mapserver. В процессе работы использовалась Ма-plnfo, QGIS и различные инструменты для работы с пространственными данными, разработанные Open Source Geospatial Foundation.

Для исследования возможности гармонизации (корректировки различий и несоответствий между почвенными данными, чтобы сделать их единообразными или взаимно совместимыми) описаний почвенных профилей, выполненных с использованием разных методик морфологического описания почв, проведены полевые испытания. Испытания проводились в ходе зональной практики, проводимой факультетом почвоведения МГУ им. М.В. Ломоносова, в 2011 году. Помимо морфологического описания, были взяты почвенные образцы для анализов, а также отобраны монолиты этих почв для Всемирного музея почв в Нидерландах. Были заложены и описаны наиболее представительные типы почв Русской равнины - серая лесная, аллювиальная луговая, типичный чернозем, солонец, солодь, каштановая почва и солончак. Испытания проходили в два этапа: сначала морфологические почвенные описания проводили с использованием общепринятых в России методик (Методическое руководство по описанию почв в поле, 1982; Морфология почв, 2004; Классификация почв..., 1977), а затем по международной методологии FAO (Guidelines for soil description, 2006; WRB, 2006). Возможность гармонизации рассчитывалась при помощи коэффициента корреляции Пирсона (Мешалкина, Самсонова, 2008), основным параметром была глубина горизонтов. Статистическая обработка данных проводилась с помощью программ Microsoft Excel и Statistica.

РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЙ

Обзор почвенных ИС. Обзор показал, что в настоящее время зарубежными почвоведами разрабатываются и вводятся в действие почвенные ИС третьего поколения. Чтобы определить параметры и требуемые ресурсы для разработки отечественной системы, было проанализировано более двух десятков зарубежных почвенных ИС различного масштаба.

Выявлено, что международное сообщество почвоведов в качестве эталона современных систем предпочитает проект SOTER, который был инициирован в 1986 г. для преодоления ограничений на пути к глобальному моделированию и исследованиям - нехватке стандартизированной БД почв (Столбовой, Савин, 1996). Концепция проекта SOTER, основанная на связи атрибутивных и геоинформационных БД, сейчас де-факто является международным стандартом, и большинство существующих почвенных ИС выполнено по методологии SOTER.

Даталогическая модель атрибутивной БД SOTER состоит из нескольких таблиц, из которых две являются основными и содержат данные по профилям и горизонтам, а остальные -вспомогательными, содержащими расшифровку кодов показателей или некоторых методов определения значения показателей. Недостатками подобного способа организации являются:

- использование упрощенной модели данных (описывается только два объекта - профиль и горизонт);

- отсутствие информации о том, откуда взято каждое значение, является ли оно экспери-

7

ментальным или расчетным, что затрудняет работу с системой в целом;

- указание методов только для части показателей, что затрудняет гармонизацию и обуславливает неоднозначность интерпретации значений показателей;

- использование дополнительного (промежуточного) шифрования, осложняющего понимание и извлечение данных;

- необходимость периодического существенного изменения и переработки программного кода обработки данных (отсутствие единого системного подхода)

- добавление нового показателя приводит к появлению новой дополнительной таблицы, усложняющей извлечение данных;

- много ручной работы - неизбежно возникающие пустые значения при используемом способе упорядочения данных, приводящие к увеличению неэффективного объема БД;

- ограниченность возможностей использования формально-логического аппарата выборки и операций с данными;

- слабая масштабируемость: ограниченность имеющегося и потенциально возможного списочного состава показателей (из-за несовершенства модели данных и ограничений программной платформы - максимум 128 показателей);

- неэффективность при работе с системой нескольких пользователей - отсутствие контроля версий и возможности коллективного единовременного доступа к данным.

Кроме того, есть более глубокая проблема - существующая процедура преобразования аналоговых (визуально доступных) форм хранения в цифровые (электронные) и обратная операция восстановления из электронных форм в визуальную, приводит к потерям и искажению информации. Это основная проблема существующих систем: модели хранения данных в электронных формах основаны не на внутренних закономерностях и связях между понятиями предметной области, а на частных практических задачах. Отсюда ограниченность и узость набора показателей, используемых в проектируемой для конкретных исследовании системе.

Таким образом, при разработке почвенной ИС встают две важнейшие проблемы - проблема моделей описания почв и проблема формализации описательного языка предметной области.

Обзор модельных представлений. Установлено, что недостаток модельных представлений о почвах вызван сложностью физической интерпретации аргументов-факторов почвообразования и что создание почвенных ИС тесно связано с решением фундаме1пальной проблемы - созданием класса моделей, соединяющих предметную составляющую почвоведения с формально-логической.

Проведен простейший физико-математический анализ некоторых предельных решений уравнения В .В. Докучаева - функциональной зависимости свойств почвы от факторов почвообразования. Символьное определение почвы, данное В.В. Докучаевым, является первой постановкой проблемы математического описания почвы (Докучаев, 1899). Спустя 40 лет, подход Г. Йенни позволил осуществить переход к частным физико-математическим моделям описания свойств почв (Jenny, 1941). В конце 70-х гг. XX в. Т.Г. Гильманов попытался вернуть почвенное содержание в физико-математическое моделирование с помощью системного подхода и провел

8

анализ уравнения Докучаева с точки зрения его использования в моделировании при помощи ЭВМ (Гильманов, 1977). В 2003 г. А. МакБратни модифицировал уравнение Докучаева, добавив в него пространственное расположение почвенного профиля, представил его как систему уравнений и заложил его в основу цифрового почвенного картографирования (ЦПК) (МсВгаШеу, 2003).

Таким образом, анализ модельных представлений дат возможность выявэть три основные группы почвенных моделей:

Классификационные модели оперируют категориями и понятиями, имеющими смысловое значение почвенных объектов. Формалшация в таких моделях преимущественно сводится к какому-либо методу кодирования или шифрования с целью сжатия и сокращения потоков передаваемой информации. Почва в них описывается в виде вербальных модельных объектов -классов, а процессы и факторы - в форме вербальной логики высказываний. Примером таких моделей являются различные классификации почв.

Физико-математические модели, в отличие от классификационных, работают с категориями и понятиями, имеющими смысл показателей свойств почвенных объектов; объект упрощается. Этот класс моделей позволяет привлекать широкий спектр математических методов исследования, однако в используемый математический аппарат практически невозможно включить специфические показатели и понятия, используемые при изучении почв. В этих моделях фокус внимания сосредоточен на взаимосвязи показателей, а объект в его естественном виде заменяется упрощенным представлением об объекте. Основным недостатком в преобладающем в данное время физико-математическом моделировании является то, что в нем вне рассмотрения остается та часть понятийного аппарата и законов функционирования почв, которая не укладывается в рамки, ограниченные понятийным аппаратом и законами, заложенными в этих моделях - иными словам почва как самостоятельный природный объект растворяется во множестве частных физико-математических моделей.

В информационных моделях фокус внимания сосредоточен на объектах - почвенном профиле и горизонте; эти модели представляют собой симбиоз классификационных и физико-математических моделей. Основанные на использовании ИТ, они позволяют описывать почву с любой степенью точности и преодолевать основные недостатки описанных выше классов моделей, что дает возможность выявить количественные и качественные взаимосвязи между свойствами почв и почвенными объектами. Такие модели позволяют сохранить семантику почвенных категорий и понятий, создать единый алгоритм их описания и использования.

Принцип квантования. Анализ процессов информационного обмена данными, содержащимися в почвенных описаниях - основном способе записи и хранения фактических материалов изучаемой предметной области, показывает, что элементарный акт обмена информацией состоит из передачи однотипного набора вербальных утверждений (рис. I): - объект о характеризуется значением V показателя /, определенного методом т, или значение V показателя », определенное методом т, принадлежит объекту о, где о, /, т и V - конкретные имена и термины предметной области.

В качестве примера рассмотрим фрагмент описания почвенного разреза: "В горизонте AEL дерново-подзолистой глееватой почвы обильно представлены железисто-марганцевые конкреции размером 1-2 мм. Этот горизонт характеризуется следующими значениями: рНводн. -4,0; рНсол. - 3,2" (Апарин и др., 2007). Этот фрагмент содержит информацию о следующих именах: 4 объектах - почве, почвенном горизонте, железо-марганцевых конкрециях, образце; 8 показателях - наименовании почвы, индексе почвенного горизонта, новообразованиях, обилии новообразований, нижней границе размеров новообразований, верхней границе размеров новообразований, pH водной и солевой суспензий; 8 значениях - дерново-подзолистая, AEL, обильно, железо-марганцевые конкреции, 1, 2, 4.0, 3,2; 7 методах - согласно Классификации почв (2004), Справочнику индексов почвенных горизонтов (2004), классификации видов новообразований, справочнику обилия новообразований, авторский метод, потенциометрический метод, метод не указан.

Использование обычных наименований для структурных элементов о, г, т, v (табл. 1) позволяет превратить общую формулу информационного утверждения в конкретное осмысленное выражение простой подстановкой текстовых фрагментов из ячеек таблицы. Например, "объект почвенный горизонт характеризуется значением AEL показателя индекс горизонта, определенного методом согласно справочнику индексов почвенных горизонтов (2004)" или "значение 1 мм показателя нижняя граница размеров новообразований, определенное авторским методом принадлежит объекту железо-марганцевые конкреции".

Таблица 1.

Информационный разбор текстового фрагмента почвенного описания_

Показатель Метод Значение

Почва Наименование почвы По Классификации почв (2004) Дерново-подзолистая глееватая

Почвенный горизонт Индекс горизонта По Справочнику индексов почвенных горизонтов(2004) AEL

Морфологический Новообразования По Классификации видов новообразований Железо-марганцевые конкреции

Морфологический Обилие новообразований По Справочнику обилия новообразований Обильно

Почвенный горизонт Нижняя граница размера новообразований Авторский 1

Почвенный горизонт Верхняя граница размера новообразований Авторский 2

рН водной суспензии Потенциометрический 4,0

Образец рН солевой суспензии Не указан 3,2

і Щ

ПОКАЗАТЕЛЬ/

Ж.І

я

Ш о

ПРОФИЛЬ СЛОЙ ГОРИЗОНТ МОРФОІ-1

о

V >s

значение у

ОІЇРЛЗРЦ ПО'ІВРДЇИЬГЙ ДРУ£Ип 4 V : ШЯИФ: OJvfil.KTM

Рис. 1. Семантика элементов структуры утверждения в почвоведении

Таким же образом возможно представить любое описание характеристик предметной области, что позволяет сформулировать принцип квантования: информация предметной области формулируется и передается в дискретной форме, имеющей однородную структуру corn

держательных элементов и отношений между ними.

Конкретное смысловое значение (семантика) элементов структуры каждого утверждения определяется предметной областью. Будем формально записывать конструкцию этих высказываний с помощью набора четырех элементов [о,/', т, v], а сами утверждения назовем минимальной информационной единицей предметной области - Umi„=[o,;, т, v].

Утверждение, где представлены все четыре сущности, обладает свойствами min-max системы - содержит минимальное количество элементов и логических связей, максимально полно отражающих информационное содержание утверждения. Если это утверждение является полным, оно позволяет исследователю принять или отвергнуть его, то есть выразить субъективное отношение к факту одним из двух состояний - истина (true) или ложь (false). Если же утверждение является редуцированным, то перед исследователем встают дополнительные задачи, которые обычно решаются тремя путями: 1 - восстановлением из источника данных; 2 - проведением прямого наблюдения или эксперимента; 3 - использованием каких-либо теоретических умозаключений.

Приведенные выше формулировки утверждений обладают сочетанием важнейших системных свойств: они имеют однородную внутреннюю связь элементов структуры и одинаковый состав связываемых элементов структуры, а также позволяют оценить объективность информационного высказывания и сформулировать субъективное отношение исследователя к высказыванию.

Семантическая модель описания почвы. Рассмотрим базовые понятия:

- показатель свойства почвы - именованное понятие, характеризующее какое-либо свойство объекта и раскрывающее физический смысл показателя свойства почвы (например, для профиля это могут бьггь географические координаты, микрорельеф; для почвенного горизонта - цвет, гранулометрический состав; для морфологического элемента - новообразования, растительные остатки; для почвенного образца - содержат« SiC>2, емкость поглощения и т.д.); при этом наименования горизонтов, например, А, В, ВС, С и т.д. используются в качестве показателей, а не объектов;

- метод определения значения показателя свойства почвы - именованный способ определения значения показателя свойства почвы (одному показателю могут соответствовать несколько методов, например, для показателя географических координат могут бьггь следующие методы: с использованием GPS, топографической карты, GoogleEarth и т.д.; для показателя SiCh в почве: гравиметрический, фотометрический, атомно-абсорбцнонный и др.);

- значение показателя свойства почвы - именованное понятие, выражающее интенсивность проявления или степень выраженности показателя свойства почвы (например, значения показателя географических координат по методу «с использованием GPS» - 55.69167 37.53433, «с использованием Google Earth» - 55°45'20.83" с. ш., 37°37'03.48" в. д.; значения показателя пористость - тонкопористое, пористое и т.д.);

- почвенный объект - именованная часть или элемент иерархического строения почвы, характеризуемая каким-либо показателем как условно однородная часть почвенного тела. Модель

и

предусматривает следующее разделение объектов: профиль и горизонт являются аксиоматическими объектами (т.е. объектами, наличие которых является необходимым условием описания почвы), а морфон, конкреция и т.д. - дуальными или порождаемыми объектами (т.е. объектами, которые иногда могут встретиться при описании аксиоматических объектов).

Рассматривая подходы, которые используют почвоведы, описывая свою предметную область, весьма удобно использовать иерархию пространственной вложенности условно однородных элементов строения почвы: профиль -» горизонт -» морфологический элемент в двух вариантах: уровня профиля - РгоШеГО, НопгопШ, Е!егпеп1ГО, где конкретные объекты обозначаются уникальными числовыми значениями идентификаторов; и в форме прямого уровневого описания иерархического дерева объектов (ОЬуейГО), где вложенные элементы описываются системой идентификаторов (РагепЮГО), ссылающихся на идентификатор родительского объекта {табл. 2).

Таблица 2.

Объект Уровень С P H L М Е S

LevellD=0 Разрез

LevelID=I Профиль - - ■ ■ -

LeveUD=2 - Горизонт Слой Морфон - -

LevelID=3 - - - - Морфологический элемент Образец

В обоих случаях каждый объект характеризуется дополнительным индексом, указывающим на различие объектов, находящихся на одном и том же координатном уровне или ветви вложенности (ObjectTypelD). Подобная структура обеспечивает возможность отчуждения (независимости существования) аксиоматических и дуальных объектов.

Согласно смысловому значению, можно выделить соответствующие пространства и подпространства:

- пространство почвенных объектов - множество категорий и понятий, характеризующих пространственное строение почвенного тела - с учетом специфики его изучения можно выделить: профили, горизонты, морфологические элементы (в пределах почвенных горизонтов) и образцы (часть почвенного горизонта, отбираемая для физико-химических анализов) при изучении вертикального строения почвы; площадные (контуры, полигоны), линейные (трансекты, катены) и точечные элементы (разрезы, профили), используемые при географическом изучении почв.

- пространство почвенных показателей - множество категорий и понятий, отражающих смысл, степень проявления и метод определения значения свойств почв - его составляют показатели свойств почв, их значения и методы определения значений показателей.

Пространство почвенных показателей может быть выражено с помощью индексированного показателя свойства почвы - формализованного описания характеристики почвенного объекта, который состоит га трех числовых индексов (IndicatorlD, MethodID, ValuelD), через которые устанавливается связь с содержательным смыслом показателей, методов и значений, описанным и зафиксированным в форме метаописаний в соответствующих таблицах реляционной БД (indicator, method, value).

В основу формализации подобных пространств заложена индексация - метод упорядочения (нахождение объекта по его индексу и наоборот - индекса по объекту) и установления связей между информационными объектами с использованием индексов (установление реляционных отношений между индексируемыми объектами). Индексация пространств объектов и показателей позволяет создать «хранилище», содержащее глобальные индексы (рис. 2).

Для эффективной работы с хранилищем данных необходима возможность ввода данных, их обработки и извлечения информации. Данные приобретают смысл только тогда, когда субъект способен восстановить их исходные связи и взаимоотношения. Можно выделить статические связи - это постоянные связи, существующие между данными, и динамические связи - это связи, возникающие между данными при обращении к ним. Статические связи существуют всегда, динамические - возникают как результат обращения к данным - запроса. При этом сами данные и статические связи между ними остаются неизменными; динамически меняется состав запроса, в результате которого на выходе появляется интерпретация результата запроса - информация. Выявление постоянных, устойчивых связей между явлениями природы - центральный вопрос научного естествознания.

Например, значение «4» в хранилище представляет собой всего лишь абстракцию, используемую для количественной характеристики какого-то показателя. Это просто число в ячейке таблицы, у которого нет никаких смысловых характеристик - показателя, метода определения и объекта. Хранилище приобретает смысл только тогда, когда мы понимаем, что в нем хранится и можем извлекать из него информацию. При помощи реляционной структуры БД и используя принцип квантования стало возможным напрямую относить конкретное значение к конкретному показателю, методу и объекту. Таким образом, несмотря на различные возможности представления и визуализации почвенных данных, они всегда имеют постоянную четкую структуру {табл. 3).

Таблица 3.

Структура почвенного описания при использовании разных способов представления данных

Форма Объект Показатель Метод Значение

Вербальная Почвенный горизонт Индекс горизонта Согласно Справочнику индексов почвенных горизонтов АЕЬ

Обобщенная 0 \ гп V

Формализованная 2 31 4 13

Хранилище ОЬцесИЭ 1п(НсаЮгШ МеЙюёШ УаІиеШЛ/аІие

Итак, анализируя тексты, описывающие предметную область, была разработана семантическая модель описания почвы. Основная идея модели заключается в установлении семантических связей между различными категориями, имеющими смысл показателей почвенных свойств и элементов строения почвенных тел. Для этого использовались современные представления об уровнях иерархической организации строения почвенных тел, а используемые в почвоведении категории и понятия рассматривались как некоторые множества.

Центральное понятие семантической модели описания почвы - минимальная информационная почвенная единица (БТ-Гшт) - наименьший однородный набор информационных элементов, связывающий пространство почвенных показателей и почвенных объектов. Можно определить минимальную информационную почвенную единицу как однородный информационный элемент, состоящий из индексированного показателя свойства почвы и типа почвенного объекта:

Зигшп = [ЫюаЮгГО, Уа1иеГО, МеНюсГО, РгоШеГО, НопгопШ, ИетеШГО, О^есИуреГО]), где Битт - наименьшая порция почвенной информации, имеющая смысл и передаваемая в вербальных утверждениях. Битт играет роль своеобразного кванта почвенной информации, которым описывается многообразие почвенных тел. Ее внутренняя структура связывает категории пространств почвенных показателей и объектов: с одной стороны, позволяя по значению показателя восстановить объект, к которому относится показатель или, наоборот, по объекту восстановить показатели, которыми характеризуется данный объект; а с другой стороны, БТ-Гшт позволяет описывать почвенное тело как множество однородных элементов с формальными правилами и языком, определяемыми индивидуально для всей совокупности элементов БиттИ, выборки из БиттИ и отдельных элементов внутренней структуры информационною кванта. Информационный смысл Битт в том, что она фиксирует максимально полную информацию в минимальной однородной форме - как факте связи элементарного (единичного) объекта и элементарного свойства объекта.

Использование минимальной информационной почвенной единицы для описания почвенного профиля Б имеет простую математическую и географическую интерпретацию: Б = [ГО, Эигтап], где Э - почва (счетное множество минимальных информационных единиц), идентификатор ГО -номер элемента, ЭТЛ-пт - бесконечное множество натуральных чисел; или

Б = [ГО, ЫюаЮгГО, МеЛоаГО, УаЬеГО, РгоШеГО, НопгопГО, Е1ететГО, ОкуесГГурсГО].

В координатном представлении Б - это массив индексированных показателей свойств почв, отбираемых из глобальной выборки БШиф] по условию РгоШеГО^ог^, а в объектном - дерево многомерных ассоциативных массивов гетерогенных данных индексированных показателей свойств почв в индексированном пространстве почвенных объектов. Если в состав показателей уровня почвенного профиля включены известные географические координаты, то математический объект 8 представляет собой развернутое описание почвенного профиля в вертикальном направлении (в пространстве профильных осей почвенной системы координат) и точечный (пиксельный) элемент на географической карте (в пространстве географических осей координат).

На основе разработанной концепции разработана инфологическая модель БД (рис. 3) и словарь терминов.

множество Показателей свойств почв

каждый

показатель

должен

иметь

значение

method

значение

определяйте* одним из методов

множество

методов определения

э11ачеиий показателей свойств почв

каждое

значение

определено

каким-то

методом

value

множес тво

значений показателей

свойств почв

[ источник;данных у* site

почвенный разрез

одному дереву вложенных объектов соответствует один объект РАЗРЕЗ

object

описание почвенных теп в формате ІІІІІ иининапьиых1 і-информационных почвенных единиц

множество объектов почвенного профиля: ПРОФИЛЬ

- 1_еуе1Ю=1. ОЬ/есПуреЮ-Р ГОРИЗОИТ/СЛ ОЙ/МОРФ ОН

- 1_еуе1Ю*2. ОЬ)'есЛ"уреЮ«Н МОРФОЛОГИЧЕСКИЙ ЭЛЕМЕНТ

- 1_еуе1Ю=»3. ОЬ]есЯТуреЮ«=М ОБРАЗЕЦ

- ЬвУв1Ю=3. 0^есЛ"уреЮ=3

ObjBCtIO I

Т

образуют иерархическое дерооо впоженных объектов

I

Рис. 3. Мифологическая модель почвенной БД

Разработка системы формализации почвенных метаданных. Чтобы описать отношения между объектами и показателями предметной области и структуру хранения данных, необходимо формализовать предметную область - провести перевод простейших утверждений, используемых при работе с почвенными данными, в формализованный эквивалент. Анализ свойств минимальной информационной единицы показывает, что необходимым условием формализации предметной области, кроме использования разнообразной символики для обозначений понятий почвоведения - семантики имен, является описание взаимоотношений между ними - семантики отношений. Подобная формализация отличается от «традиционной» формализации (в которой понятиям присваивают индексы) тем, что в систему формализации включают метаданные (структурированные данные, представляющие собой характеристики описываемых сущностей для целей их идентификации, поиска, оценки и управления ими) с набором определений понятий, их способом хранения и их отношений между собой. Метаданные отдельно описывают отношения между объектами и показателями предметной области и структуру хранения данных. Каждый показатель должен быть описан в виде индексированного показателя свойства почвы, каждому имени (термину, наименованию) должна соответствовать запись в таблице, содержащая определение и метаданные, позволяющие описать отношения этих имен между собой.

Создать эффективный механизм формализации языка почвоведения в среде визуальных форм хранения данных невозможно: это можно сделать только в электронных формах хранения с помощью метаданных, в которых описываются отношения между объектами и показателями предметной области, а также структура хранения данных. Были выделены две основные группы наборов атрибутов, раскрывающих и передающих смысловое содержание понятия в среде: с визуально доступными формами хранения и коммуникации (вербальная часть): Name-тля, краткий термин, наименование понятия; Description - полное описание понятия; Unit - единицы измерения,

ValueSetName - имя значения показателя свойства почвы и т.д.; и группа электронных форм хрань ния и коммуникации (метаданные): LevellD - идентификатор иерархического уровня показател: свойства почвы; ObjectTypeID - тип почвенного объекта; Multi - кратность использования значе ния показателя; MethodSet - идентификатор множества методов определения значения показателя ValueSeí - идентификатор множества значений показателя и т.д.

Разработка системы формализации почвенных данных включала в себя следующие этапы: 1) составление списка критериев для отбора показателей, методов, значений и объектов, использу: драфт-версию списка формализованных показателей (Иванов, Рыбальский, Сафрошкин, 2008] Составлен перечень метаданных для описания пространства почвенных показателей, методов, зна чений, объектов и вспомогательной информации - 11 таблиц, включающих 124 поля с описании метаданных; ниже представлены таблицы по инфологическим блокам:

а) блок хранения измеренных почвенных данных, состоящий из четырех таблиц: r_data-Ta6 лица хранения ссылочных данных, n_data - целочисленных данных, f_data - дробных данных i c_data - символьных данных (фактически, это «хранилище» почвенных данных);

б) блок индексированных показателей свойств почв, состоящий из таблиц метаданных: показателей свойств почв - indicator, методов их определения - method и значений показателей свойств почв - value. Для примера в сокращенном виде приведена одна из таблиц (табл. 4).

Таблица z

Indicator - Таблица метаданных показателей свойств почв

Hone Описание Tun

IndicatorlD Уникальный идентификатор показателя Integer(5

Parent Ссылка на родительский идентификатор - организация иерархических зависимостей показателей в табл. indicator Integer(5

Name Краткое наименование показателя - для организации пользовательских интерфейсов Charit 00)

Description Подробное описание показателя Text

Unit Единица измерения - единицы измерения хранящихся в БД значений Char(18]

Property Краткое наименование свойства почвы, которое оценивает показатель Char(54)

LevellD Идентификатор иерархического уровня показателя - уровень организации морфологического строения профиля (профиль, горизонт, морфологический элемент и т.д.) Char( 1)

ObjectType ID Тип почвенного объекта: Р - профиль (LevelID=P), Н - горизонт (LevelID=H), Е -морфологический элемент (LeveIID=E), S - образец (LevelID=E) и т.д. Char( 1)

ViewForm Признак формы вывода значения показателя в БД - вспомогательное поле, используемое для организации форм ввода/вывода показателей: L, если значения показателя выводятся по одному в строку S - по несколько в одну строку; Т - таблицей; G - в нескольких вариантах Chart 1)

Order Порядок вывода, вспомогательное поле, используемое для дополнительной организации порядка вывода списков показателей Integer(5

Required Обязательность ввода. Вспомогательное поле. Показывает требования к вводу значения показателя в БД. 1 - обязательно, 0 - не обязательно Binary(l

DataType Тип данных, используемый для хранения значений показателя: Integer - целочисленные данные. Float - дробные данные с плавающей запятой, Char - символьные данные Chart 12)

ScaleType Тип шкалы, характеризующий множество значений показателя: NM - номинальная, OR - ординальная, IN - интервальная, DF - разностей, RT - отношений или пропорций, АВ - абсолютная шкала Char(2)

Multi Кратность использования показателя: сколько значений показателя используется при описании одного и того же почвенного объекта: 1 - одно значение; N - больше одного значения Chart 1)

Input Метод ввода значения показателя: 0 - ссылочный для значений, перечисленных в таблице value, 1 - вводимый, если значения показателя вводятся корреспондентом Binary(l

TableData Имя таблицы, в которой хранится значение показателя: r_data - ссылочных данных, перечисленных в value; п data - целочисленных данных, вводимых корреспондентом; f_data - дробных данных вводимых корреспондентом; с data - символьных данных, вводимых корреспондентом Chart 6)

Symbol Символьный код показателя - название поля показателя при генерации данных в табличной форме (in символов, входящих в англоязычные термины соответствующих величин с ограничением Char(8)

на длину не больше 8 символов)

MethodSet Идентификатор методов определения значения показателя - для организации связи между показателем и методами определения значения показателя, перечисленными в табл. method. Значение поля формируется из символьного кода показателя Symbol и следующего суффикса, добавляемого через символ подчеркивания: С - при прямоП ссылке на справочник, классификатор или указатель значений, если для определения значения показателя используется один общепринятый метод; М - при необходимости предварительного выбора одного из нескольких методов определения значения показателя; А - для любых иных вариантов методов Char( 10)

ValueSet Идентификатор набора ссылочных значений показателя - предназначен для организации связи между показателем и набором значений показателя, перечисленных в табл. Value (значение поля формируется из символьного кода показателя Symbol и суффикса V, добавляемого через символ подчеркивания, если метод ввода значения показателя определен как I - вводится, то поле принимает значение NULL) Char( 10)

TagName Имя тега в DTD-шаблоне XML-документа описания почвенных данных - для обеспечения обмена почвенными данными между разными приложениями Char(30)

QnOff Указатель использования текущей записи - для подключения или отключения использования показателя в БД Binary(l)

в) блок почвенных объектов, состоящий из таблиц почвенных профилей - profile и почвенных объектов - object и реализующий иерархические отношения в виде метаданных, что позволяет уменьшить количество таблиц в модели и вводить сколько угодно иерархических объектов;

г) блок источников почвенных данных, представленный таблицей источников данных -source, в которой указаны характеристики источника данных (название публикации, издания и пр.);

д) блок пользователей, состоящий из таблицы пользователей - user, которая описывает характеристики пользователей системы (например, статус пользователя: администратор, корреспондент и т.д.) и необходимый для реализации модели в открытой системе, использующей Интернет;

2) составление пространств почвенных показателей и объектов, их формализация и унификация. Для разработки подпространства показателей были использованы списки методов, показателей и значений показателей, составленные В.М. Колесниковой (Колесникова и др., 2010), на основе которых, после некоторой доработки (добавление новых показателей и исправления ошибок) был создан формализованный массив, описывающий все показатели, методы, значения и объекты атрибутивной части почвенной БД - около 300 показателей, 600 методов и 2100 индексированных значений;

3) апробация создашюй системы формализации при помощи данных, предоставленных сотрудниками Почвенного института им. В.В. Докучаева, и проведение работ по формализации данных и адаптации форматов и почвенной терминологии с используемыми за рубежом, которые показали, что разработанная процедура формализации работает на основе универсального алгоритма, не зависящего от принадлежности формализуемого показателя к той или иной научной школе.

Таким образом, в рамках создания ПГБД, разрабатываемой факультетом почвоведения МГУ им. М.В. Ломоносова и Почвенным институтом им. В.В. Докучаева, была проведена работа по переводу показателей, методов и значений, предлагаемых для ПГБД в формализованный массив, описывающий все показатели, методы, значения и объекты атрибутивной части почвенной БД. Формализация также включала в себя унификацию формализованных понятий, что позволило уменьшить количество разнородных интерпретаций одного и того же свойства почвы, что в перспективе поможет улучшить качество получаемой информации о почвах в целом.

Проведенная формализация позволяет дать почвенному профилю простую математическ} интерпретацию: почвенный объект - ассоциативный массив показателей. Тогда почвенный прс филь - дерево ассоциативных массивов показателей свойств почв в пространстве почвенных обт ектов или дерево многомерных ассоциативных массивов гетерогенных данных индексированны показателей свойств почв в индексированном пространстве почвенных объектов:

Б-Р + Н + Е^Ы + Ш + Ы,

где: Р = [р,]-одномерный массив показателей уровня почвенного профиля (i=l,...,iP); Н = Щ, J - двумерный массив показателей уровня почвенного горизонта (j=iP+l,... jH, k=l ...N, N количество горизонтов);

Е = [e„xi] - трехмерный массив показателей уровня почвенного морфологического элемента (п jH+l,...jE, k=l,...,N, 1=1.....L, L - количество морфологических элементов).

Если в состав показателей уровня почвенного профиля включить географические координ; ты, то математический объект S представляет собой развернутое описание почвенного профиля вертикальном направлении (вдоль профильной оси координат) и точечный (пиксельный) элемеь на географической карте.

Проектирование основы почвенной ИС- атрибутивной БД. Для того чтобы проводи] логико-математические операции в пределах всех описанных понятий предметной области - мш жеством показателей, методов, значений и объектов, а также данных, содержащихся в хранилищ была разработана почвенная атрибутивная БД, которая является единственным возможным cnoci бом реализации семантической модели описания предметной области.

Проектирование БД происходило в три стадии: разработка инфологической модели (с< мантической модели предметной области), даталогической модели (создание схемы баз данных в виде набора схем отношений) и непосредственно реализация физической модел для конкретной СУБД. Мифологическая модель БД была разработана, основываясь на пош таи минимальной информационной почвенной единицы и других идеях семантической моде ли предметной области (см. рис. 2). В основу даталогической модели положена блочна структура, состоящая из б блоков {рис. 4).

Каждый блок представляет собой набор характеристик, который описывает определи ные модули БД: 1) блок хранения измеренных почвенных данных (базовые таблицы: r_dat; n_data, f_data, c_data); 2) блок индексированных показателей свойств почв (табл.: indicato method, value, object, profile, выходной параметр - идентификатор почвенного объею (ObjectID); 3) блок источников почвенных данных (табл. source), блок пользователей (таб. user); 4) блок добавочных данных (табл.: images, commentary).

Даталогическая структура БД сконвертирована в физическую БД, работающую на осш ве системы управления базой данных (СУБД) MySQL. Запуск СУБД позволил начать тест! рование БД, и в ходе тестирования был проведен ряд работ по апробации различных вариа! тов почвенных описаний в рамках функционирующей БД, в результате чего были разработ; ны алгоритмы конвертации данных из устаревших почвенных ИС.

18

ObjectTypelO

OateTypelO ScaleType

efc

IridicatoilD (FK) VolimlO (FK) ■0- -T+ 1*

mtov

VeduelO (FK) MethodIO (FK) ■p-l ■fib-

Щ T+ 1*

torn

MethodIO (FK) IridiCeiarlO (FK)

Рис. 4. Схема атрибутивной части почвенной БД

Разработанная система позволяет осуществить ввод (рис. 5) и вывод (рис. 6) полноценного описания почвенного разреза в том же виде, в котором он существовал на бумажном носителе, что по сути является сохранением смысловых и логических связей между почвенными показателями и объектами.

»¡иеваа res fit»«

(4ШЗИЙ<5 ПК "

asyftv 1977

ншяка* т ктвоя&ашзт ША

"о-'*»*m кш

НШ5ЙЧЯ& ¿0><Ш т FAO

Неюд

уян^шт ватт

фТЗ

Ш.п игмхчтй рх&ш

"Ъ'-Ш пз ПК i'i/7

(aKmSwaww ям к« АеТОЙЖ-« "¿'Я*'«:'? zwm

вттфткт *М Щ»

__ЯАО !*

Puc. 5. Фрагмент интерфейса ввода почвенной карточки

Реализовано несколько способов вывода почвенных описаний - в виде традиционных карточек и в виде таблицы MS Excel. Подобный способ вывода информации принципиально отличается от символизации в обычной форме, воспринимаемой без технических средств. Помимо этого, для визуализации почвенного профиля непосредственно из почвенных описаний, был разработан алгоритм, позволяющий генерировать схематическое изображение профиля, используя цвета горизонтов, занесенные в БД. Благодаря семантической модели описания предметной области, потери и искажения информации возможны только на этапе разбора текстов почвенных описаний и зависят от качества и полноты описания элементов, из которых собирается минимальная информационная почвенная единица. Контроль потерь и иска-

жений определяется полнотой и точностью описания множеств значений элементов о, i, V, m. Гибкость системы обеспечивается сочетанием элементов глобального управления множествами i, m, v и возможностями настроек ввода-вывода под персональные потребности пользователя с сохранением всех возможностей глобальной системы; при этом алгоритм обработки данных и извлечения информации не изменяется при изменении состава индексированных показателей.

Разработанная модель позволяет выполнить процесс неоднократной гармонизации измеренных данных (содержащихся в описаниях конкретных почвенных разрезов, т.е. полученных и обработанных авторами описаний), при этом полученные расчетные данные (полученные в результате любой обработки измеренных данных, например, при гармонизации) будут сохранены отдельно от исходных, что позволяет сохранить исторический смысл данных. Рис. 6. Фрагмент почвенной карточки,

выведенной из БД

Вывод картографической информации в Интернет. В процессе работы над геош формационной компонентой почвенной ИС, в Интернет была выведена карта почвенн! экологического районирования (ПЭР) России (М 1:2500000, под ред. Г.В. Добровольского И.С. Урусевской). Таюке осуществлена возможность отображения карты административно! деления РФ (М 1:1000000) и точек разрезов с GPS-координатами, добавленных в БД. Карт возможно просматривать как в традиционной конической равнопромежуточной проекции, тг и в проекции Меркатора, совместно со слоем Google Maps (http://db.soil.msu.ru/map). Интера: тивная составляющая позволяет выводить как все слои одновременно, так и по отдельноеп Например, верхняя иерархическая единица - почвенная зона, представленная 16-ю основнъ ми контурами, может быть преобразована в отдельный слой с 67 почвенными провинциям] Подобный вывод картографической информации облегчает ее восприятие и обеспечива* комфортную образовательную и научную работу. Архитектура системы позволяет выводи] информацию о почвах через SQL-запросы к атрибутивной почвенной БД, что соответству< функционалу зарубежных систем.

Стоит отметить, что структура пространственных данных отвечает принципу квантов; ния информации, что в совокупности с разработанной семантической моделью описаш предметной области — почвоведения, открывает возможности перехода к совершенно новы технологиям, таким как ЦПК, система вероятностной оценки точности данных и др.

Морфолопгкгког описание профиля

АО 0-5(5) см цвет - однородный, структура - < А2 5-12(7) см цвет - однородный, основной - Г

Soil-DB - 1Дк-А2) В1 12-20(3) см свежий, цвет - однородный, осн

карточки Soil-DB - 1Дк-В1) B2g 20-33(13) см свежий, цвет - однородный, осн оглеенный, (наименование карт' ВС 33-42(9) см цвет - однородный, основной -1 Cea 42-82 цвет - однородный, основной - :

распадающаяся до муки с коыочк

Аналитические данные

Таблица 1.

Валовой химический состав минеральной част!

Гортонт Глубина. Глубнна Si02 А1203 Fe

см отЗорл

обратов.

см

АО 0-5 0-5 68.98 7.19 2

А2 5-12 5-12 82.68 9.19 1

В1 12-20 12-20 75.05 12.13 4

Исследование возможности гармонизации почвенных описаний. Важным требованием три проектировании почвенной ИС ставилась задача наиболее полной инвентаризации разнообразных почвенных данных. Одно из преимуществ разработанной системы - она обеспечи-:ает внутреннее хранение расчетных (гармонизированных) и измеренных (исходных) значе-ий, что позволяет сохранить исторический смысл дынных и дает возможность заносить в БД "днные, полученные при помощи самых разных методик.

Почвенный разрез является материальным объектом, что позволяет провести его описание двум почвоведам, использующим одни и те же методы морфологического описания, оди-аково, без принципиальных отличий, но если исследователи используют разные подходы писания почвенного профиля, может возникнуть проблема точности соответствия описаний ■ руг другу. В частности, один из принципиально важных моментов: выделение объекта -очвенного горизонта. Неоднократно осуществлялись попытки провести корреляцию терми-ов национальных почвенных классификаций с терминами международных классификаций /Срасильников, 1999; Столбовой, 2000; Герасимова и др., 2009). Насколько же одинаково выделяются почвенные горизонты при использовании разных подходов?

Чтобы ответить на этот вопрос была проведена оценка степени неоднородности при морфологическом описании почвенного разреза по разным системам морфологического опи-: ания почв. На основе проведенных полевых испытаний, включающих в себя сравнительный =иализ двух систем - принятую в России (по Розанову) и международную систему морфоло-лческого описания (РАО, 2006) — проведен корреляционный анализ (рис. 7).

Показано, что концепция морфологического описания БАО в достаточной мере соответствует отечественной методике; описания проводимые по ним близки по смыслу (по выборке мощностей горизонтов г=0,85). Это позволяет рассчитывать на то, что почвенные данные, полученные разными специалистами по различным методикам, можно гармонизировать в рамках почвенной ИС и использовать для расчетов.

Формализация, возможность гармонизации данных, вскрытие информационных закономерностей и связей в науке о почвах приближают нас к созданию единой во всем мире методики описания почв Рис. 7. Сравнительный анализ выделения почвенных и почвенной классификации. горизонтов по Розанову и по РАО

Название горизонта

1» , ГО,-

нлааание горизонта

А£ Е Ш В вССка

Выводы:

1) Основными недостатками имеющихся методов перевода почвенных данных из анах говой в цифровую форму хранения и созданных на их основе атрибутивных почвенных С данных являются: потеря части данных на этапе их ввода, искажение и неопределенность и формации на этапах их обработки и вывода, и как следствие возвращение исследователя ручным методам работы с почвенными данными. Эффективность использования почвенш данных, хранимых в электронной форме, определяется моделью описания предметной обл; ти, основанной на использовании фундаментальных информационных закономерностей связей, возникающих между понятиями предметной области, выражаемых их естественны] именами, и позволяющих соединить предметную составляющую почвоведения с формалы логической. Показано, что электронные формы хранения данных в форме баз данных являк ся не только средством хранения формализованных почвенных данных, но и инструменте позволяющим описывать закономерные отношения, возникающие и имеющие место в пре метной области - почвоведении.

2) Сформулирован принцип квантования почвенной информации и предложен метод оп сания почвенных данных и передачи почвенной информации, не зависящий от формы xpai ния данных. Метод основан на использовании инвариантных свойств определенного в hccj довании понятия - минимальной информационной почвенной единицы - SUmin. В визуальн среде хранения SUmin описывает отдельные единичные акты обмена почвенными даиньн набором вербальных утверждений: объект о характеризуется значением v показателя i, onj деленного методом т, где о, i, т и v - конкретные имена понятий и термины предметной с ласти. В среде электронного хранения SUraj„ описывается с использованием метаданных - с вокупностью специфических для электронной формы хранения данных и их спецификащ дополняющих каждый вербальный элемент, связанный с ними в одном кортеже. Инвариат ность SUmin проявляется в том, что она позволяет переходить из одной формы хранения да ных к другой, используя эту дополнительную связь как однозначное отношение двух набор данных [о, v, i, ш] = [ObjectID, ValuelD, IndicatorlD, MethodID].

3) Разработана семантическая модель описания почвы, описывающая отношения, име щие место в предметной области, как отношения между именами (терминами) базовых nor тий предметной области - показателей, значений, методов определения значений показател свойств почв, и характеризуемых ими почвенных объектов. Разработана и создана схема ба данных, реализующая семантическую модель описания почвы с раздельным описанием пре метной области и хранилища почвенных данных. По единой унифицированной методике pi работай и создан формализованный массив данных, описывающий предметную область множество потенциально хранимых почвенных данных. Дана физическая интерпретация пс венных объектов.

4) Формализация, проведенная в рамках семантической модели описания почв, позвол; дать математическую интерпретацию описанию единичного почвенного объекта как ассоци

званного массива значений показателей свойств почв, н почвенного профиля в целом - как :рева ассоциированных массивов значений показателей свойств почв в пространстве поч-мшых объектов:

5 = Я + Я + £ = [р,.] + [ад + [С„Л,],

Такая интерпретация позволяет легко устанавливать и выражать связи между любыми гементами строения почвы и показателями свойств почв через формальные логические от-эшения.

5) На основе концепции минимальной информационной почвенной единицы разработана эчвенная ИС описания предметной области - почвоведения, которая объединяет в себе пока-[тели, описывающие свойства почвы, с объектами, из которых состоит почвенное тело, в даную систему, обеспечивая взаимодействие между ними при помощи формальной логики 1 базе набора определенных алгоритмов, что теоретически позволяет работать с бесконеч-ам множеством данных. Благодаря созданной процедуре формализации, разработанная поч-мшая ИС описания предметной области, реализованная в виде атрибутивной БД, позволяет греводить данные из текстовых почвенных описаний в электронную форму и восстанавли-1ть их из электронной формы хранения в визуальную без потерь и искажения информации -)чность авторского описания и полнота перевода определяется не техническими возможно-:ями электронной формы хранения, а полнотой источника почвенного описания и контроли-/ется полнотой метаданных, описывающих предметную область.

6) Анализ данных, полученных с использованием разных систем морфологического опи-шия почв, показал, что описания, проводимые по общепринятым в России методикам и по еждународной методологии РАО, близки по смыслу, и их гармонизация в рамках разрабо-1нн0й почвенной ИС целесообразна. Начало работ по формализации почвоведения вместе с урным развитием учения о классификации почв, а так же исследований возможностей кор-¡ляции и гармонизации информации о почвах приближают нас к унификации методик изу-:ния почв и к созданию единой во всем мире почвенной классификации.

Интернет-ресурсы с результатами работы: http://db.soil.msu.ru, http://open.soil.msu.ru

Список работ, опубликованных по теме диссертации:

1) Иванов A.B., Рыбальский H.H., Сафрошкнн В.Ю., Колесникова В.М. Информацш ный разбор и формализация описания почвенного профиля. Матер. VI съезда Общества п< воведов им. В.В. Докучаева. (13-18 августа 2012 г., Петрозаводск - Москва) - Петрозавод Карельский научный центр РАН, 2012. - Кн. 1, С. 242-244.

2) Иванов A.B., Рыбальский H.H. Семантическая модель описания почв и почвеш информационная система // Использование и охрана природных ресурсов в России, 2012. J (122). - (в печати).

3) Рыбальский H.H. Управление почвенными ресурсами // Природно-ресурсные ве; мости, №3 (378), 2012. - С. 6.

4) Рыбальский H.H., Долгинова В.А. Оценка степени неоднородности морфологическ описаний почв // Всеросс. научная конф. «XV Докучаевские молодежные чтения» (1- 3 мар 2012 г., Санкт-Петербург). СПб.: Изд-во Химический факультет СПбГУ. - С. 58-59.

5) Рыбальский H.H. Расширение коллекции всемирного музея почв // Природ! ресурсные ведомости, №4 (367), 2011. - С. 4.

6) Иванов A.B., Алябина И.О., Иванов С.А., Колесникова В.М., Рыбальский H.H., Ca рошкин В.Ю., Шоба С.А. Почвенно-географическая база данных: структура данных и мс данные (ver. 1.0)//Доклады по экологическому почвоведению, 2010.Вып. 14.N2.-C. 1-11

7) "Иванов A.B., Рыбальский H.H. Информационная профильно-географическая моде почвы как основа почвенной информационной системы // Использование и охрана природн ресурсов в России, 2010. №6 (114). - С. 25-28.

8) *Иванов A.B., Рыбальский H.H. Информационная профильно-географическая моде почвы // Использование и охрана природных ресурсов в России, 2010. №5 (113). - С. 65-69.

9) Иванов A.B., Рыбальский H.H. Развитие модельных представлений о почве // На) но-практические аспекты развития современной техники и технологий в условиях курса инновации, (15-17 ноября 2010 г., Санкт-Петербург). СПб.: Изд-во НИИРРР, 2010. - С. 42-4:

10) Рыбальский H.H. Опыт разработки сетевой почвенной информационной системы Ломоносов - 2010: XVII Междунар. конф. студентов, аспирантов и молодых ученых по ф) даментальным наукам; секция "Почвоведение": тез. докл. (12-15 апреля 2010 г., Москва) - Г МАКС Пресс, 2010. - С. 99.

И) Иванов A.B., Сафрошкин В.Ю., Рыбальский H.H. Сетевые почвенные информацис ные системы и цифровые модели почв // Научный сервис в сети Интернет: решение болып задач: тр. Всеросс. научной конф. (22-27 сентября 2008 г., Новороссийск), 2008. - С. 448-45С

12) Иванов A.B., Рыбальский H.H. Научно-информационный портал по почвоведени Матер. V съезда Всероссийского общества почвоведов им. В.В. Докучаева (18-22 авгус 2008 г., Ростов-на-Дону) - Ростов-на-Дону: Ростиздат, 2008. - С. 512.

♦Статьи в журналах из списка ВАК

Подписано в печать:

06.09.2012

Заказ № 7555 Тираж -100 экз. Печать трафаретная. Типография «11-й ФОРМАТ» ИНН 7726330900 115230, Москва, Варшавское ш., 36 (499) 788-78-56 wvvw.autoreferat.ru

Содержание диссертации, кандидата биологических наук, Рыбальский, Николай Николаевич

ВВЕДЕНИЕ

ГЛАВА 1. ОБЗОР ЛИТЕРАТУРЫ

Раздел 1. Обзор почвенных информационных систем

1.1 .Обзор почвенных информационных систем и баз данных

1.2. Предпосылки и этапы создания почвенных информационных систем

1.3. Современные почвенные информационные системы

1.3.1. Почвенная информационная система SOTER

1.3.2. Почвенная информационная система CanSIS

1.3.3. Почвенная информационная система ASRIS

1.3.4. Почвенная база данных Европы ESDB

1.3.5. Почвенные информационные системы и базы данных США

1.3.6. Почвенная база данных WISE

1.3.7. Всемирная гармонизированная почвенная база данных HWSD

1.3.8. Цифровая почвенная карта мира - GlobalSoilMap.net

1.3.9. Другие почвенные информационные системы и базы данных

1.4. Ограничения современных почвенных информационных систем

Раздел 2. Обзор модельных представлений о почве

ГЛАВА 2. УСЛОВИЯ, ОБЪЕКТЫ И МЕТОДЫ ИССЛЕДОВАНИЯ

ГЛАВА 3. ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЙ

Раздел 1. Модельные представления в почвоведении

Раздел 2. Принцип квантования

Раздел 3. Семантическая модель описания почвы

Раздел 4. Разработка системы формализации почвенных метаданных

Раздел 5. Проектирование и создание почвенной информационной системы

Раздел 6. Вывод картографической информации в Интернет

Раздел 7. Степень неоднородности при описании почвенного разреза по разным системам морфологического описания почв

ВЫВОДЫ

Введение Диссертация по биологии, на тему "Семантическая модель описания почв и почвенная информационная система"

Информация о почвах жизненно необходима для того, чтобы принимать решения по повышению эффективности землепользования, защите окружающей среды, долгосрочному планированию в сфере управления почвенными ресурсами и др. (Handbook of Soil Sciences, 2011). Ход развития почвоведения предопределяет необходимость разработки новых подходов к анализу почвенных ресурсов в России (Савин, 2004), в тоже время современные средства компьютерного моделирования позволяют эффективно решать задачи количественного описания сложных динамических систем (Смагин, 2007). Информационные технологии (ИТ) дают широкий спектр возможностей для того, чтобы получать информацию о почвах ежедневно и обрабатывать ее в реальном времени. При помощи ИТ в перспективе возможно проводить пространственно-распределенного статистический анализ (Каневский, Демьянов, 1999), выполнять алгоритмизацию процедур классификации почв и многое другое - от построения системы информативных признаков (диагностики) до распознавания новых объектов, оценки качества и сравнения классификаций разных научных систем (Рожков, 2007, 2011). Расширение спектра возможностей получения почвенных данных, обусловленное развитием современных цифровых методов, таких как обработка ДДЗ, геостатистика, педометрика и цифровое почвенное картографирование, приводит к острой необходимости разработки почвенных информационных систем (почвенных ИС).

Исследование современного состояния зарубежных и российских разработок в области использования ИТ для работы с почвенными данными показало, что наиболее актуальными являются почвенные ИС третьего поколения, в которых присутствуют три компонента: геоинформационные системы (ГИС), дающие возможность работы с пространственными данными; реляционные базы данных (БД), обеспечивающие функциональность работы с множеством морфологических и физико-химических показателей свойств почв; и использующие принципы сети Интернет, что обеспечивает доступ к системе з в реальном времени и многопользовательском режиме (Иванов, Сафрошкин, Рыбальский, 2008). Подобные системы используется для прогнозирования, моделирования и других почвенных исследований (Хомяков, 1996), таких как прогноз опасности эрозии, окисления и других типов химической, биологической и физической деградации почв; контроль за урожаями; глобальные изменения почвы; мониторинг орошения; агро-экологическое зонирования; расчет рисков засухи и многие др (Eckelmann at al., 2006), а так же многих других исследований, в т.ч. для решения более специфических задач, например, исследований по изучению продуктивности лесов (Grigal, 2009).

На данный момент известно несколько десятков региональных систем, более 10 почвенных ИС национального уровня (Australian Soil Resource Information System, Австралия; National Soil Information System, США и др.), a также несколько мультинациональных и глобальных систем (European Soil Database, Европа; SOTER, глобальная почвенная ИС и др.) (Finke, 2001; Brough, 2006; van Engelen, 1996; Lagacherie, McBratney 2006). В 70-80-х гг. XX в. российскими почвоведами был внесен существенный вклад в разработку общих идей построения почвенных ИС на первом этапе - разработке атрибутивных баз данных (Шишов и др., 1975; Рожков, 1976, 1980, 1983). Несмотря на повышение интереса к подобным разработкам (Белоусова, Ме-шалкина, 2009; Крыщенко, Голозубов, 2010), в РФ до сих пор не существует актуальной действующей почвенной ИС (Рожков и др., 2010), поэтому одной из важнейших задач является создание отечественной системы.

Невзирая на стремительное развитие зарубежных почвенных ИС, остается актуальной проблема сохранения первичного смысла исходной информации о почвах (Handbook of Soil Sciences, 2011) при переводе почвенной информации из текстового, «бумажного» формата в электронную форму, возникающая из-за сложной иерархической системы строения почвы и приводящая к искажению информации, разнородности форматов хранения данных, слабой масштабируемости и необходимости трудоемких ручных приемов работы. Эта проблема является следствием слабо проработанной модели описания предметной области и для ее решения необходимо создание системы формализации разнородных почвенных данных, отражающей в себе все многообразие почвенных объектов и свойств почвы.

В результате исследований, которые начались в 2005 году, было выяснено, что, несмотря на большое количество зарубежных разработок в данной области, до сих пор остается нерешенным вопрос, связанный с фундаментальной проблемой математизации почвоведения - отсутствием класса моделей, позволяющих включить в активное использование специфические почвенные категории и понятия. Работа над этой проблемой приближает нас к тому, чтобы сделать почвоведение точной наукой, о чем мечтал В.В. Докучаев (1886).

Таким образом, одной из актуальных задач является восстановление работ по созданию почвенной ИС с использованием опыта собственных и зарубежных разработок, для чего в первую очередь необходимо создать систему формализации разнородных почвенных данных, отражающую в себе все многообразие почвенных объектов и показателей.

Цель работы: изучение информационных взаимоотношений и разработка методов формализации основных понятий предметной области - почвоведения, необходимых для перехода от визуально доступных форм хранения почвенных документов к электронным формам, и создание семантической модели описания почв в виде почвенной ИС.

В работе поставлены следующие задачи:

1) провести анализ современного состояния зарубежных и отечественных разработок в области использования ИТ для работы с почвенными данными, исследовать существующие модели их описания;

2) дать информационную характеристику документам предметной области исследования, оценить проблемы и возможности перехода из визуальных форм хранения почвенных данных к электронным формам;

3) разработать информационную модель описания почвы для использования в электронной среде хранения и обработки данных, и на ее основе создать систему формализации разнородных почвенных данных;

4) спроектировать и создать почвенную ИС описания предметной области;

5) исследовать возможность гармонизации почвенных описаний, выполненных с использованием разных методик морфологического описания почв.

Научная новизна. Впервые, с использованием семантического подхода, проведен информационный анализ текстов почвенных документов и сформулирован принцип квантования почвенной информации, заключающийся в том, что передача почвенной информации осуществляется стандартными дискретными порциями, имеющими однородный состав структурных элементов и однородную структуру внутренних отношений, и инвариантных относительно формы хранения почвенных данных - вербальной, визуальной или электронной. Данная концепция послужила базисом для разработанной семантической модели описания предметной области, в рамках которой в едином информационном пространстве была формализовано описана семантика отношений показателей свойств почв с элементами строения почвенного тела.

Впервые разработана модель предметной области, реализованная в виде оригинальной БД, описывающая почву как семантические отношения, возникающие между именами базовых понятий предметной области - показателей, их значений, методов определения значений показателей свойств почв, и именами характеризуемых ими почвенных объектов. Данная модель, реализованная в форме оригинальной БД, является основополагающей частью почвенной ИС. Она позволяет переводить данные из текстовых (аналоговых) описаний почвенных разрезов в электронную (цифровую) форму хранения и восстанавливать их из цифровой формы хранения в аналоговую без потерь и искажения информации - точность авторского описания поддерживается и контролируется полнотой метаданных, описывающих предметную область.

Разработанная модель описания предметной области впервые позволяет дать математическую интерпретацию описанию почвы - как ассоциированного массива показателей свойств почв; и почвенного профиля в целом -как дерева ассоциированных массивов показателей свойств почв в пространстве почвенных объектов. Подобная интерпретация позволяет устанавливать и выражать связи между элементами строения почвы и их показателями через формальные логические отношения.

Практическая значимость. Использование почвенной ИС, описывающей предметную область, позволяет обеспечить ввод, хранение и обработку большого количества фактических материалов по почвам. В основе созданной ИС лежит разработанная оригинальная модель БД, которая позволяет объединить показатели, описывающие свойства почвы, с объектами, из которых состоит почвенное тело, в единую систему, обеспечивая взаимодействие между ними при помощи формальной логики на базе набора определенных алгоритмов, теоретически позволяя работать с бесконечным множеством данных. Благодаря концепции минимальной информационной почвенной единицы, которая играет роль своеобразного кванта почвенной информации, разработанная почвенная ИС стала гибкой, легко расширяемой и поддерживающей масштабируемость и интероперабельность (способность взаимодействовать с другими почвенными ИС и БД без каких-либо ограничений).

Важная особенность разработанной почвенной ИС, иллюстрирующая принцип квантования почвенной информации, - вывод полноценного описания почвенного разреза в том же виде, в котором он существовал на бумажном носителе, что, по сути, является сохранением смысловых и логических связей между почвенными показателями и объектами. Коллективный доступ к системе, осуществляемый через Интернет, позволяет преодолеть проблему того, что большое количество получаемой научной информации о почвах оказывается в ограниченном использовании. Другим преимуществами данной модели являются открытость инфраструктуры, возможность персонали-зации интерфейса, сохранение алгоритмов обработки данных и извлечения информации при изменении списочного состава индексированных показателей и многое др.

Разработанная модель применена для реализации Почвенно-географической базы данных России (ПГБД).

Методология исследования. В работе использованы современные методы поиска и анализа информации, методы проектирования и построения моделей, методы преобразования и кодирования информации для ее представления в цифровых форматах и методы компьютерного моделирования для создания почвенной ИС.

Апробация работы. Результаты работы и основные положения были представлены и обсуждались на V съезде Всероссийского общества почвоведов им. В.В. Докучаева (Ростов-на-Дону, 2008), Всероссийской научной конференции «Научный сервис в сети Интернет: решение больших задач» (Новороссийск, 2008), XVII Международной конференции студентов, аспирантов и молодых ученых по фундаментальным наукам «Ломоносов - 2010» (Москва, 2010), Международной конференции «Научно-практические аспекты развития современной техники и технологий в условиях курса на инновации» (Санкт-Петербург, 2010), Европейском рабочем совещании «Global Soil Fertility: The role of next generation smart fertilizers» (Wageningen, Нидерланды, 2011), а также на рабочем заседании Международного информационно-справочного центра по почвам (ISRIC) (Wageningen, Нидерланды, 2011). Результаты работы обсуждались на заседания семинара по цифровой почвенной картографии (ЦПК) подкомиссии "Картография почв" и комиссии по пе-дометрике Общества почвоведов им. В.В. Докучаева в Почвенном институте им. В.В. Докучаева. Разработанная семантическая модель обсуждалась на совещании, посвященном интеграции почвенных БД России, Украины и Белоруссии (Москва, 2011).

Публикации. По теме диссертации опубликовано 12 работ, из них 2 статьи в реферируемых изданиях, включенных в список ВАК.

Структура и объем работы. Диссертация состоит из введения, трех глав и выводов, изложенных на 156 страниц машинописного текста. Содержит 13 таблиц и 29 рисунков. Список литературы насчитывает 199 наименований, из них 99 на иностранном языке.

Заключение Диссертация по теме "Почвоведение", Рыбальский, Николай Николаевич

выводы

1) Основными недостатками имеющихся методов перевода почвенных данных из аналоговой в цифровую форму хранения и созданных на их основе атрибутивных почвенных баз данных являются: потеря части данных на этапе их ввода, искажение и неопределенность информации на этапах их обработки и вывода, и как следствие, возвращение исследователя к ручным методам работы с почвенными данными. Эффективность использования почвенных данных, хранимых в электронной форме, определяется моделью описания предметной области, основанной на использовании фундаментальных информационных закономерностей и связей, возникающих между понятиями предметной области, выражаемых их естественными именами, и позволяющих соединить предметную составляющую почвоведения с формальнологической. Показано, что электронные формы хранения данных в форме баз данных являются не только средством хранения формализованных почвенных данных, но и инструментом, позволяющим описывать закономерные отношения, возникающие и имеющие место в предметной области - почвоведении.

2) Сформулирован принцип квантования почвенной информации и предложен метод описания почвенных данных и передачи почвенной информации, не зависящий от формы хранения данных. Метод основан на использовании инвариантных свойств определенного в исследовании понятия - минимальной информационной почвенной единицы - БИтт- В визуальной среде хранения 811т;п описывает отдельные единичные акты обмена почвенными данными набором вербальных утверждений: объект о характеризуется значением V показателя 1, определенного методом ш, где о, ¡, ш и V - конкретные имена понятий и термины предметной области. В среде электронного хранения 8ит1П описывается с использованием метаданных - совокупностью специфических для электронной формы хранения данных и их спецификаций, дополняющих каждый вербальный элемент, связанный с ними в одном кор

136 теже. Инвариантность 8итш проявляется в том, что она позволяет переходить из одной формы хранения данных к другой, используя эту дополнительную связь как однозначное отношение двух наборов данных [о, V, I, ш] = [СНуесШЭ, Уа1иеШ, 1псНса1огГО, МеЙюёГО].

3) Разработана семантическая модель описания почвы, описывающая отношения, имеющие место в предметной области, как отношения между именами (терминами) базовых понятий предметной области - показателей, значений, методов определения значений показателей свойств почв, и характеризуемых ими почвенных объектов. Разработана и создана схема базы данных, реализующая семантическую модель описания почвы с раздельным описанием предметной области и хранилища почвенных данных. По единой унифицированной методике разработан и создан формализованный массив данных, описывающий предметную область и множество потенциально хранимых почвенных данных. Дана физическая интерпретация почвенных объектов.

4) Формализация, проведенная в рамках семантической модели описания почв, позволяет дать математическую интерпретацию описанию единичного почвенного объекта как ассоциированного массива значений показателей свойств почв, и почвенного профиля в целом - как дерева ассоциированных массивов значений показателей свойств почв в пространстве почвенных объектов:

8 = Р + Н + Е = \р,] + [к]Л] + [е^] Такая интерпретация позволяет легко устанавливать и выражать связи между любыми элементами строения почвы и показателями свойств почв через формальные логические отношения.

5) На основе концепции минимальной информационной почвенной единицы разработана почвенная ИС описания предметной области - почвоведения, которая объединяет в себе показатели, описывающие свойства почвы, с объектами, из которых состоит почвенное тело, в единую систему, обеспечивая взаимодействие между ними при помощи формальной логики на базе на

137 бора определенных алгоритмов, что теоретически позволяет работать с бесконечным множеством данных. Благодаря созданной процедуре формализации, разработанная почвенная ИС описания предметной области, реализованная в виде атрибутивной БД, позволяет переводить данные из текстовых почвенных описаний в электронную форму и восстанавливать их из электронной формы хранения в визуальную без потерь и искажения информации - точность авторского описания и полнота перевода определяется не техническими возможностями электронной формы хранения, а полнотой источника почвенного описания и контролируется полнотой метаданных, описывающих предметную область.

6) По данным, полученным в ходе полевых испытаний, включающих в себя сравнительный анализ двух систем морфологических описаний почв -принятую в России и международную систему описания FAO - был подсчитан линейный коэффициент корреляции для следующих почвенных свойств: глубина горизонтов, характер переходов, влажность, гранулометрический состав, структура, твердость, тип сложения. Полученные результаты (средний коэффициент корреляции - выше 0.9) показали возможность гармонизации и интеграции данных в разработанную почвенную ИС из зарубежных почвенных ИС и БД.

Интернет-ресурсы с результатами работы: http://db.soil.msu.ru, http ://open. soil .msu.ru

Библиография Диссертация по биологии, кандидата биологических наук, Рыбальский, Николай Николаевич, Москва

1. Апарин Б.Ф., Касаткина Г.А., Матинян H.H., Сухачева Е.Ю. Красная книга почв Ленинградской области. - СПб.: Аэроплан, 2007. - 231 с.

2. Аринушкина Е.В. Руководство по химическим анализам почв. М.: Из-во Моск. Ун-та, 1970. - 488 с.

3. Базовые шкалы свойств морфологических элементов почв. Методическое руководство по описанию почв в поле. М., 1982. - 60 с.

4. Базы данных состава и свойств почв / В. С. Крыщенко, О. М. Голозубов, В. В. Колесов, Т. В. Рыбянец. Ростов-на-Дону, 2008. - 145 с.

5. Белобров В.П., Рожков В.А., Столбовой B.C. База данных о структурах почвенного покрова для их классификации // Почвоведение, 1993. № 7. С. 8388.

6. Белоусова Н.И., Мешалкина Ю.Л. Методические аспекты создания почвенно-атрибутивной базы данных // Бюлл. Почв, ин-та им. В.В. Докучаева, 2009. Вып. 64.-С. 23-33.

7. Белоусова Н.И., Мешалкина Ю.Л. Опыт создания унифицированной базы данных бореальных почв России (методические вопросы) // Почвоведение, 1997. №8.-С. 926-933.

8. Березовский Е.В., Захаренко А.В, Полин В.Д. Информационное обеспечение технологий точного земледелия: опыт РГАУ-МСХА / Информационный обмен в сельском хозяйстве на русском языке. М.: РГАУ-МСХА им. К.А. Тимирязева, 2010.-С. 172-180.

9. Бойко О.С., Васенев И.И. Базовые параметры агроэкологического мониторинга агроландшафтов ЦЧР // Вестник ОГУ, 2007. №10. С. 103-109.

10. Васенев И.И., Мешалкина Ю.Л., Грачев Д.А. Геоинформационные системы в почвоведении и экологии. М.: Изд-во РГАУ-МСХА имени К.А. Тимирязева, 2010.-214 с.

11. Васенев И.И. Почвенные сукцессии. М., 2008. - 400 с.

12. Герасимов И.П. Генетические, географические и исторические проблемы современного почвоведения. М.: Наука, 1976. - С. 165-177.

13. Герасимова М.И., Тонконогов В.Д., Лебедева И.И. Возможности и ограничения корреляции почвенных классификаций / Агрохимия и почвоведение. -Харьков: НИИ им. О.Н. Соколовского, 2009. С. 15-20.

14. Гильманов Т.Г. Интерпретация формул Докучаева и Йенни в терминах системного анализа // Вестн. Моск. Ун-та. Сер. Почвоведение, 1977. № 3. -С. 32-39.

15. Глаголев М.В., Смагин A.B. Приложения MATLAB для численных задач биологии, экологии и почвоведения. М.: МГУ. 2005. - 200 с.

16. ГОСТ 2759388, 2005. Почвы. Термины и определения.

17. Дейт К.Дж. Введение в системы баз данных. 8-е изд. М.: «Вильяме», 2006. - 1328 с.

18. Дмитриев Е.А. Математическая статистика в почвоведении: учебник. М.: Изд-во МГУ, 1995. - 320 с.

19. Добровольский Г.В. Лекции по истории и методологии почвоведения. М.: Изд-во Моск. ун-та, 2010. - 230 с.

20. Добровольский Г.В., Трофимов С.Я. Систематика и классификация почв (история и современное состояние): учеб. пособие. М.: Изд-во МГУ, 1996. -80 с.

21. Добровольский Г.В., Урусевская И.С. География почв: учебник. М.: Изд140во Моск. Ун-та: Наука, 2006. 460 с.

22. Докучаев В.В. Доклад Закавказскому статистическому комитету об оценке земель вообще и Закавказья, в особенности. Почвенные, горизонтальные и вертикальные зоны. - Тифлис: Тип. канцелярии Главноначальствующего гражданской частью на Кавказе, 1899. - 19 с.

23. Докучаев В.В. Доклад об оценке земель вообще и Закавказья в особенности. Почвенные горизонтальные и вертикальные зоны / Докучаев В.В. Сочинения. -М.: Изд-во АН СССР, 1951. T. VI. С. 379-397.

24. Иванов A.B., Рыбальский H.H. Информационная профильно-географическая модель почвы // Использование и охрана природных ресурсов в России, 2010. №5 (113).-68 с.

25. Иванов A.B., Алябина И.О., Иванов С.А., Колесникова В.М., Рыбальский H.H., Сафрошкин В.Ю., Шоба С.А. Почвенно-географическая база данных: структура данных и метаданные (ver. 1.0) // Доклады по экологическому почвоведению, 2010. Вып. 14. N 2. С. 1-118.

26. Иванов A.B., Сафрошкин В.Ю., Рыбальский H.H. Сетевые почвенные информационные системы и цифровые модели почв / Научный сервис в сети Интернет: решение больших задач: Тр. Всеросс. научной конф. (22-27 сентября 2008 г., Новороссийск). С. 448-450.

27. Каневский М.Ф., Демьянов В.В. Введение в методы анализа данных по окружающей среде // Проблемы окружающей среды и природных ресурсов. -М.: ВИНИТИ, 1999. № 11. С. 4-11.

28. Карта почвенно-экологического районирования России (цифровая версия) / Под ред. Г.В. Добровольского, И.С. Урусевской. М., 2007.

29. Классификация и диагностика почв России. Смоленск: Ойкумена, 2004. -343 с.

30. Классификация и диагностика почв СССР. М.: Колос, 1977. - 224 с.

31. Классификация почв России. М.: Почв, ин-т им. Докучаева, 1997. - 235 с.

32. Кобзарь А.И. Прикладная математическая статистика. М.: Физматлит, 2012.-816 с.

33. Кожина М.Н. О функциональных семантико-стилистических категориях текста. М.: Высшая школа, 1987. №2. - С. 35-41.

34. Колесникова В.М., Алябина И.О., Воробьева JI.A., Молчанов Э.Н., Шоба С.А., Рожков В.А. Почвенная атрибутивная база данных России // Почвоведение, 2010. №8.-С. 1-10.

35. Коннолли Т., Бегг К. Базы данных. Проектирование, реализация и сопровождение. Теория и практике. 3-е изд. — М.: Вильяме, 2003. 1436 с.

36. Крыщенко B.C., Голозубов О.М., Колесов В.В., Рыбянец Т.В. База данных состава и свойств почв. Ростов-на-Дону: Изд-во РСЭИ, 2008. - 145 с.

37. Кудеяров В.Н., Демкин В.А., Гиличинский Д.А., Горячкин C.B., Рожков В.А. Глобальные изменения климата и почвенный покров // Почвоведение, 2009. №9.-С. 1027-1042.

38. Кудеяров В.Н., Курганова И.Н. Дыхание почв России: анализ базы данных, многолетний мониторинг, моделирование, общие оценки // Почвоведение, 2005. №9.-С. 1112-1121.

39. Лебедева И.И., Тонконогов В.Д., Герасимова М.И. Диагностические горизонты в субстантивно-генетических классификациях почв // Почвоведение, 1999. №90.-С. 1068-1075.

40. Максимович Г. Ю., Романенко А. Г., Самойлюк О. Ф. Информационные системы : учебное пособие / Под общ. ред. К. И. Курбакова. — М.: Изд-во Рос. экон. акад., 1999. 198 с.

41. Мамихин C.B. Динамика углерода органического вещества и мрадионукле-дидов в наземных экосистемах. М.:Изд-во Моск. ун-та, 2003. - 172 с.

42. Мешалкина Ю.Л. Диалоговая система диагностики почв: автореф. дисс. к.б.н. -М.: МГУ, 1989. 24 с.

43. Мешалкина Ю.Л., Самсонова В.П. Математическая статистика в почвоведении: практикум. М.: МАКС Пресс, 2008. - 84 с.

44. Минеев В.Г. Агрохимия и экологические функции калия. М: Изд-во МГУ, 1999.-332 с.

45. Мировая коррелятивная база почвенных ресурсов: основа для международной классификации и корреляции почв. М.: ТНИ КМК, 2007. - 278 С.

46. Михайлов И.С. Морфологическое описание почвы. М.: Наука, 1975. - 72 с.

47. Морозов А.И., Самойлова Е.М. О методах математического моделирования динамики гумуса // Почвоведение, 1993. N 6. С. 24-32.

48. Мотузова Г.В., Безуглова О.С. Экологический мониторинг почв. М.: Гаудеамус, 2007. - 273 с.

49. Отчет о НИР по теме: «Ввести в действие систему управления базами данных общего назначения ИНЕС и АРФА». М.: ВНТИЦ, 1983. - 157 с.

50. Полевой определитель почв России. М.: Почв, ин-т им. В.В. Докучаева, 2008.- 150 с.

51. Полевые и лабораторные методы исследования физических свойств почв / Под ред. Е.В. Шеина. М.: Изд-во Моск. унта, 2001. - 200 с.

52. Почвоведение. Почва и почвообразование / Под ред. В.А. Ковды, Б.Г. Розанова. М.: Высшая школа, 1988. - 400 с.

53. Почвенная карта России (скорректированная цифровая версия Почвенной карты РСФСР масштаба 1 : 2500000) / Под ред. В.М. Фридланда. М.: 2007.

54. Почвенная номенклатура и корреляция / Сост. П.В. Красильников. Петрозаводск: КНЦ РАН, 1999. - 435 с.

55. Почвенные ресурсы России. Почвенная географическая база данных / С.А. Шоба, И.О. Алябина, В.М. Колесникова и др. М.:ГЕОС, 2010.-128 с.

56. Прокофьева Т.В., Малышева Т.И., Алексеев Ю.Е. Учебная зональная практика по почвоведению: описание маршрута. Методическое руководство. / Под ред. А.С.Владыченского; М.: МГУ, 2004. - 72 с.

57. Родзин В.И., Семенцов Г.В. Основы экологического мониторинга. Таганрог: ТРИ им. В. Д. Калмыкова, 1988. - 260 с.

58. Рожков В.А. Автоматизированная информационно-поисковая система "ПОЧВА" / Проблемы почвоведения. М., 1982. - С. 147-152.

59. Рожков В.А. Автоматизированные информационно-поисковые системы в почвоведении. М.: Изд-во Госстандарта, 1983. - 52 с.

60. Рожков В.А., Егоров В.В., Фридланд В.М., Акопян И.Х. Автоматизированная информационно-поисковая система "ПОЧВА" (ч.1,2 в кн. 1-3,3) М.: Изд-во ВАСХНИЛ, 1980. - 699 с.

61. Рожков В.А. Тектологическая концепция почвоведения. Основные разделы отчета за 2007 г. по гранту РФФИ № 07-04-00248а, 2007. 8 с.

62. Рожков В.А., Алябина И.О., Колесникова В.М., Молчанов Э.Н., Шоба С.А., Столбовой B.C. Почвенно-географическая база данных России // Почвоведение, 2010. №1.-С. 3-6.

63. Рожков В.А., Рожкова С.В. Почвенная информатика. М.: Изд-во МГУ, 1993.- 189 с.

64. Розанов Б.Г. Морфология почв: учебник для высшей школы. М.: Академический проект, 2004. - 432 с.

65. Романенков В.А, Сиротенко ОД., Рухович Д.И., Романенко И.А, Шевцова Л.К, Королева П.В. Прогноз динамики запасов органического углерода пахотных земель Европейской территории России. М.: ВНИИА, 2009. - 96 с.

66. Романенков В.А., Листова М.П., Беличенко М.В., Рухович О.В. Система «Почва-удобрения-погода-урожай» при возделывании озимой пшеницы на144дерново-подзолистых почвах ЕТР // Плодородие. 2009. №1 (46). С. 14-17.

67. Рыбальский H.H. Разработка и создание сетевых информационных систем по почвоведению. Дипл. работа. М.: ф-т почвоведения МГУ, 2008. - С. 68166.

68. Рыжова И.М. Математическое моделирование почвенных процессов. М.: Изд-во Моск. ун-та, 1987. - 82 с.

69. Рыжова И.М., Подвезенная М.А. Пространственная вариабельность запасов органического углерода в почвах лесных и степных биогеоценозов // Почвоведение, 2008. №12. С. 1429-1437.

70. Светлов В.А. Современная логика, учебное пособие. СПб.: Питер, 2006. -400 с.

71. Смагин A.B. Методологические подходы к построению математических моделей структурно-функциональной организации почв // Доклады по экологическому почвоведению, 2007, вып. 6. № 2. 58 с.

72. Смагин A.B. Смирнов Г.В. Методы определения эффективного коэффициента диффузии С02 в почве // Вестн. Моск. ун-та. Сер. 17 "Почвоведение", 1996. №2.-С. 3-10.

73. Смагин A.B., Харитонова Г.В., Манучаров A.C., Витязев В.Г., Дембовецкий A.B. Адсорбция паров воды почвами и почвенными агрегатами: учебное пособие. Тула: "Гриф и К.", 2009. - 100 с.

74. Стандартные цветовые шкалы для полевого определения и кодирования окраски почв / Сост. М. И. Андронова. М.: РосНИИземпроект, ПЕСО "Картография", 1992. - 12 с.

75. Столбовой В., Савин И.Ю. Опыт использования технологий SOTER для создания цифровой базы данных почв и суши России // Почвоведение, 1996.14511.-С. 1295-1302.

76. Столбовой B.C., Шеремет Б.В. Корреляция легенд Почвенной карты СССР масштаба 1:2,5 млн. и Почвенной карты Мира ФАО // Почвоведение, 2000. № З.-С. 277-287.

77. Терлеев В.В. Математическое моделирование в почвенно-гидрологических и агрохимических исследованиях. СПб.: Изд-во Политех, ун-та, 2005. - 104 с.

78. Тироф Р. Обработка данных в управлении. Т. 1. М.:Мир, 1976. - 614 с.

79. Урусевская И.С., Мешалкина Ю.Л., Хохлова О.С. Гумусное состояние серых лесных почв центра Русской равнины, развитых на разных почвообра-зующих породах // Вестн. Моск. ун-та. Сер. 17, почвоведение, 1997. №1. С. 7-14.

80. Философские проблемы информатики: курс лекций для аспирантов: учеб. пособие/ Ю. Н. Тарасов. 2-е изд., испр. и доп. М.: Изд-во Московского психолого-социального института; Воронеж: Изд-во НПО «МОДЭК», 2007. -136 с.

81. Флоринский И.В. Гипотеза Докучаева как основа цифрового прогнозного почвенного картографирования (к 125-летию публикации) // Почвоведение, 2012. №4. -С. 500-506.

82. Формальная логика / Под ред. И. Я. Чупахина, И. Н. Бродского. Л.: ЛГУ, 1977.-357 с.

83. Хакен Г. Информация и самоорганизация. Макроскопический подход к сложным явлениям. М.: Мир, 1991. - 240 с.

84. Ханина Л.Г., Бобровский М.В., Комаров A.C. и др. Моделирование динамики разнообразия лесного надпочвенного покрова // Лесоведение, 2006. № 1. -С. 70-80.

85. Хомяков Д.М., Мамихин С.В., Кулигина Е.А., Компьютеризация исследований в экологии, почвоведении и агрохимии: уч. пособие. М.: Изд-во Моск. Ун-та, 2005.- 100 с.

86. Хомяков Д.М., Хомяков П.М. Основы системного анализа. М.: Изд-во1461. МГУ, 1996.-108 с.

87. Хомяков П.М., Конищев В.Н., Пегов С.А., Смолина С.Г., Хомяков Д.М. Моделирование динамики геоэкосистем регионального уровня. М.: Из-во МГУ, 2000. - 382 с.

88. Чувакин А.А. Основы филологии. М.: Изд-во: Флинта, Наука, 2011. - 240 с.

89. Шеин Е.В. Курс физики почв. М.: Изд-во МГУ, 2005. - 432 с.

90. Шоба С.А., Столбовой B.C., Алябина И.О., Молчанов Э.Н. Почвенно-географическая база данных России // Почвоведение, 2008. № 9. С. 1029— 1036.

91. Якушев В.П., Якушев В.В. Информационное обеспечение точного земледелия. СПб.: Изд-во ПИЯФ РАН, 2007. - 384 с.

92. Badraoui М., Stitou М. Status of soil survey and soil information system in Morocco. -Bari: CIHEAM-IAMB, 2001. Pp. 193-201.

93. Bartsch H.U., Kues J., Sbresny J., Schneider J. Soil information system as part of a municipal environmental information system // Environmental Geology, 30 (3/4), April 1997.-Pp. 189-197.

94. Batjes N.H. Degradation and vulnerability database for Central and Eastern Europe / Preliminary Results of the SOVEUR Project. Proceedings of concluding workshop. Rome: FAO, Bucharest: RISSA, Wageningen: ISRIC, 1999. - 100 p.

95. Batjes N.H. A qualitative assessment of water erosion risk using the 1:5 M SOTER database for Northern Argentina, South-east Brazil and Uruguay // Working Paper and Preprint 96/0. Wageningen: ISRIC, 1996. - 18 p.

96. Batjes N.H. Effects of mapped variation in soil conditions on estimates of soil carbon and nitrogen stocks for South America // Geoderma, 2000. 97. Pp. 135144.

97. Batjes N.H. Mapping soil carbon stocks of Central Africa using SOTER // Geoderma, 2008. 146. Pp. 58-65.

98. Batjes N.H., Al-Adamat R., Bhattacharyya T., Bernoux M. at al. Preparation of consistent soil data sets for SOC modelling purposes: secondary SOTER data sets for four case study areas // Agriculture, Ecosystems and Environment, 2007. 122. -Pp. 26-34.

99. Batjes N.H. ISRIC-WISE Harmonized Global Soil Profile Dataset (Ver. 3.1). Report 2008/02. Wageningen: ISRIC - World Soil Information, 2008. - 59 p.

100. Batjes N.H. SOTER-based soil parameter estimates for Southern Africa (ver. 1.0). Report 2004/04. Wageningen: ISRIC - World Soil Information, 2004. - 27 P

101. Bhattacharyya T., Pal D.K., Easter M., Batjes N.H. Modelled soil organic carbon stocks and changes in the Indo-Gangetic Plains, India, between 2000 and 2030 // Agriculture, Ecosystems and Environment, 2007. 122. Pp. 84-94.

102. Brough, D.M., Claridge, J. and Grundy, M.J. Soil and landscape attributes: A report on the creation of a soil and landscape information system for Queensland. Brisbane, Australia: Natural Resources, Mines & Water, 2006. 80 p.

103. Brown K. W., Gauld M., Smith J. H., Bain B. F. L. at. al. Design of a database for Scottish soils // J. of Soil Science, 1987: 38. Pp. 267-277.

104. Burrough P.A. Soil information systems / Geographical information systems. Principles and applications. New York: John Wiley & Sons, 1991. - Pp. 153169.

105. Carre F., McBratney A.B., Minasny B. Estimation and potential improvement of the quality of legacy soil samples for digital soil mapping // Geoderma, 2007. 141. -Pp. 1-14.

106. Cerri C.E.P., Easter M., Paustian K., Killian K. at al. Predicted soil organic148carbon stocks and changes in the Brazilian Amazon between 2000 and 2030 // Agriculture, Ecosystems and Environment, 2007. 122. Pp. 58-72.

107. Daigle J.J., Hudnall W.H., Gabriel W.J. The National Soil Information System (NASIS): Designing soil interpretation classes for military land-use predictions // J. ofTerramechanics, 2005. 42. Pp. 305-320.

108. Data Specification on SOIL Draft Guidelines (D2.8.III.3). INSPIRE Infrastructure for Spatial Information in Europe. - Thematic Working Group SOIL, 2012.-370 p.

109. Dijkshoorn J.A., Huting J.R.M., Soil and terrain database for Nepal. Report 2009/01. Wageningen: ISRIC - World Soil Information, 2009. - 30 p.

110. Din9 A. O. Development of Soil Information System for the Turkish Republic of Northern Cyprus // J. of Tekirdag Agricultural Faculty, 2008. 5 (1). Pp. 53-60.

111. Dobos E., Daroussin J., Montanarella L. An SRTM-based procedure to delineate SOTER Terrain Units on 1:1 and 1:5 million scales. EUR 21571 EN, 2005. - 55 P

112. Codd E.F. The Relational Model for Database Management. Addison-Wesley Publ. Co., 2000. - 538 p.

113. Eckelmann W., Baritz R., Bialousz S., Bielek P. at al. Common Criteria for Risk Area Identification according to Soil Threats. Luxembourg: Office for official publications of the EC, 2006. - 96 p.

114. FAO UNESCO 1974. FAO-UNESCO Soil Map of the World 1:5000000. Legend: UNESCO, Paris: FAO, 1983. V. 1.

115. FAO/IIASA/ISRIC/ISS-CAS/JRC. Harmonized World Soil Database (version 1.2). FAO, Rome, Italy and IIASA, Laxenburg, Austria, 2012. 43 p.

116. FAO/ISRIC/University of Gent. Soil and Terrain Database of Central Africa -DR of Congo, Burundi and Rwanda (SOTERCAF 1.0), 2007. 28 p.

117. Finke P., Hartwich R., Dudal R., Ibanez J. at al. Georeferensced Soil Database for Europe. Manual of procedures. Version 1.1. European Soil Bureau, 2001. -178 p.

118. Global and National Soils and Terrain Digital Databases (SOTER) / Ed. V.W.P.149van Engelen and T.T.Wen. Wageningen: ISRIC - World Soil Information, 1995. -138 p.

119. Gray M.J., Humphreys G.S., Deckers J.A. Distribution patterns of World Reference Base soil groups relative to soil forming factors // Geoderma, 2011. 160. Pp. 373-383.

120. Grigal D.F. A soil-based aspen productivity index for Minnesota // Forest Ecology and Management, 2009. 257. Pp. 1465-1473.

121. Guidelines for soil description. Rome: FAO, 2006. - 97 p.

122. Handbook of Soil Science / Ed. M.E. Sumner. CRC Press, Boca Raton, 1999. -2313 p.

123. Handbook of Soil Sciences: Resource management and environmental aspects. -CRC Press, Boca Raton, 2011. 830 p.

124. Hartemink A.E., Huting J. Land Cover, Extent, and Properties of Arenosols in Southern Africa // Arid Land Research and Management, 2008. 22. Pp. 134-147.

125. Hartemink A., McBratney A., Mendonca-Santos M. Digital Soil Mapping with limted data. Springer Verlag, 2008. - 445 p.

126. Jenny H. Factors of soil formation. N.Y: McGraw-Hill, 1941. - 191 p.

127. Lagacherie P., McBratney A., Voltz M. Digital soil mapping: An introductory perspective. Elsevier, Amsterdam, 2006. 350 p.

128. Lilburne L.R., Hewitt A.E., Webb T.W. Soil and informatics science combine to develop S-map: A new generation soil information system for New Zealand // Geoderma, 2012. 170. Pp. 232-238.

129. MacMillan R.A., Pettapiece W.W., Nolan S.C., Goddard T.W. A generic procedure for automatically segmenting landforms into landform elements using DEMs, heuristic rules and fuzzy logic // Fussy Sets and Systems, 2000. 113. Pp. 81-109.

130. Maji A.K., Nayak D.C., Krishna N.D.R. Soil information system of Arunachal150

131. Pradesh in a GIS environment for land use planning // JAG, 2001. V. 3. Iss. 1. -Pp. 69-77.

132. Mantel S., van Engelen V.W.P. The Impact of Land Degradation on Food Productivity. Case studies of Uruguay, Argentina and Kenya. Report 97/01, Wageningen: ISRIC, 1997. V. 1-2. 76 p.

133. Mantel S. Identification of potential for banana in Hainan Island, China // Pe-dosphere, 2003. 13. Pp. 147-155.

134. McBratney A.B., Mendosa Santos M.L., Minasny B. On digital soil mapping // Geoderma, 2003. 117 (1-2). Pp. 3-52.

135. McDonald P. The Literature of Soil Science, 1994. Pp. 143-160.

136. McKenzie N.J., Jacquier D.W., Maschmedt D.J., Griffin E.A., Brough D.M. The Australian Soil Resource Information System. Technical specifications. Version 1.5,2005.-93 p.

137. Montanarella L., Jones R. Latest developments of the European Soil Information System. EUROSOIL 2004, Symposium 15: "Soil Information Systems", 2004. 1 P

138. Montanarella L., Käser F., Hansen B. European soil database as a tool for EU risk assessment and decision making // Trends in analytical chemistry, 1998. V. 17 №5.-Pp. 257-263.

139. Montanarella L., Negrel T. The development of the Alpine Soil Information System // JAG, 2001. V. 3. Iss. 1. Pp. 18-24.

140. Munsell Soil Color Charts. Revised Ed. New York: Division of Kollmorgen Instruments Corp., 1992.

141. Lagacherie P., McBratney A.B. Spatial Soil Information Systems and Spatial Soil Inference Systems: Perspectives for Digital Soil Mapping // Developments in151

142. Soil Science, 2006. V. 31. Pp. 3-22.

143. Pourabdollah A., Didier G., Simms D., Tempel P. at al. Towards a standard for soil and terrain data exchange: SoTerML // Computers and Geosciences, 2012. V. 45.-Pp. 270-283.

144. Richer de Forges A. C., Arrouays D. Analysis of requests for information and data from a national soil data centre in France // Soil Use and Management, 2010. 26.-Pp. 374-378

145. Rossiter D.G. Digital soil resource inventories: status and prospects // Soil Use and Management, 2004. V. 20, Issue 3. Pp. 296-30.

146. Schelling J. The role of soil information systems / Soil Information systems. -Wageningen: Pudoc, 1975. Pp. 13-16.

147. Schoeneberger P.J., Wysocki D.A., Benham E.C., Broderson W.D. Field book for describing and sampling soils (2nd ed.). USDA Natural Resources Conservation Service, National Soil Survey Center, 2002. - 228 p.

148. Shepherd K., Walsh M. Development of reflectance spectral libraries for characterization of soil properties // Soil Science Society of America Journal, 2002. 66. -Pp. 988-998.

149. Soil Geographic Data Standart. Soil Data Subcommittee. Federal Geographic Data Committee, 1997. - 286 p.

150. Soil Survey Division Staff. Soil survey manual. United States Department of Agriculture Handbook N. 18. U.S. Government Printing Office, 1993. - 437 p.

151. Soil Survey Staff. National Soil Survey Handbook. U.S. Government Printing152

152. Office, 1997. Раздел 430-VI.

153. Soil Survey Staff. Soil survey laboratory manual. USDA-SCS National Soil Survey Center Soil Survey Investigations Report 42, Version 3. U.S. Government Printing Office, 1996. - 694 p.

154. Soil Taxonomy: A basic system of soil classification for making and interpreting soil surveys. 2nd ed. Natural Resources Conservation Service. U.S. Department of Agriculture Handbook, 1999. - 436 p.

155. Sombroek W.G. Towards a global soil resource inventory at scale 1:1 M. Working paper 84/4. Wageningen: ISRIC, 1984.

156. Stolbovoi V.S. Soils of Russia: Correlated with the Revised Legend of the FAO Soil Map of the World and World Reference Base for Soil Resources. Laxen-burg, Austria: IIASA, 2000. - 111 p.

157. Tempel P. SOTER Global and National Soils and Terrain Digital Databases. Database Structure v3. - Working paper N. 02/01, September 2002. - 93 p.

158. The European Soil Information System. Proceedings of a Technical Consultation Rome, Italy, Rome, 2000. 163 p.

159. Van Engelen V.W.P. Are global soil information systems adequate in forecasting impacts of global change? / 19th World Congress of Soil Science, Soil Solutions for a Changing World (1-6 August 2010, Brisbane, Australia), 2010. Pp. 4-6.

160. Van Engelen V.W.P., Batjes N.H., Dijkshoorn K., Huting J. Harmonized Global Soil Resources Database (Final Report). Report 2005/06. Wageningen: FAO and ISRIC - World Soil Information, 2005. - 53 p.

161. Verdoodt A., van Ranst E. The soil information system of Rwanda: a useful tool to identify guidelines towards sustainable land management // Afrika Focus, 2006. 19.-Pp. 69-92.

162. World reference base for soil resources. Rome: IUSS, ISRIC, FAO, 2006. -133 p.

163. Почвенно-географическая база данных России ПГБД Электронный ресурс.: официальный сайт. - Режим доступа: http://db.soil.msu.ru (дата обращения 26.10.2011).

164. Africa Soil Information Service Электронный ресурс.: официальный сайт. -Режим доступа: http://www.africasoils.net (дата обращения 12.10.2011).

165. National Soil Database NSDB Электронный ресурс.: официальный сайт. -Режим доступа: http://sis.agr.gc.ca/cansis/nsdb (дата обращения 22.10.2011).

166. Australian Soil Resource Information System ASRIS Электронный ресурс.: официальный сайт. - Режим доступа: http://www.asris.csi-ro.au (дата обращения 13.08.2011).

167. Food and Agriculture Organization of the United Nations Электронный ресурс.: Land Resources, информация о проекте HWSD. Режим доступа: http://www.fao.org/nr/land/soils/harmonized-world-soil-database/en/ (дата обращения 25.10.2011).

168. GeoConnections program Электронный ресурс.: официальный сайт. -Режим доступа: http://geoconnections.nrcan.gc.ca/home (дата обращения 16.10.2011).

169. Global Earth Observation System of Systems GEOSS Электронный ресурс. : официальный сайт. - Режим доступа:http://www.earthobservations.org/geoss.shtml (дата обращения 14.08.2011).

170. Global Soil and Terrain Database SOTER Электронный ресурс.: официальный сайт. - Режим доступа: http://www.isric.org/projects/soil-and-terrain-database-soter-programme (дата обращения 13.08.2011).

171. GlobalSoilMap.net project Электронный ресурс.: официальный сайт.154

172. Режим доступа: http://www.globalsoilmap.net (дата обращения 13.10.2011).

173. Harmonized World Soil Database HWDS Электронный ресурс.: официальный сайт. - Режим доступа:http://webarchive.iiasa.ac.a1^esearch/LUC/External-World-soil-database/HTML/ (дата обращения 15.08.2011).

174. ISRIC World Soil Information Электронный ресурс.: официальный сайт. -Режим доступа: http://isric.org (дата обращения 11.08.2011).

175. Laboratory methods and data exchange LABEX Электронный ресурс.: информация о проекте LABEX. - Режим доступа: http://isric.org/projects/laboratory-methods-and-data-exchange-labex (дата обращения 16.08.2011).

176. Land Resources of Russia Электронный ресурс. / Stolbovoi V., Savin I., Sheremet В., Kolesnikova L. Laxenburg, Austria: International Institute for Applied Systems Analysis, 2002. - 1 эл. опт. диск (CD-ROM).

177. Land Information System LandlS Электронный ресурс.: официальный сайт. - Режим доступа: http://www.landis.org.uk/index.cfm (дата обращения 21.10.2011).

178. Land Management & Natural Hazards Unit Электронный ресурс.: информация о проекте SOTER. Режим доступа: http://eu-soils.jrc.it/projects/soter (дата обращения 18.08.2011).

179. National Soil Information System NASIS Электронный ресурс.: официальный сайт. - Режим доступа: http://soils.usda.gov/technical/nasis/ (дата обращения 11.10.2011).

180. Natural Resources Conservation Service US General Soil Map STATSGO Электронный ресурс.: официальный сайт. - Режим доступа: http://www.ncgc.nrcs.usda.gov/products/datasets/statsgo (дата обращения 18.10.2011).

181. Soil and Topography Information's SIS Электронный ресурс.: официальный сайт. Режим доступа: http://www.soilinfo.com (дата обращения 21.10.2011).

182. Soil Information System ISIS Электронный ресурс.: официальный сайт.155

183. Режим доступа: http://isis.isric.nl (дата обращения 21.10.2011).

184. Soil Information System Электронный ресурс.: официальный сайт. Режим доступа: http://soilinformationsystem.com (дата обращения 24.10.2011).

185. Soil information system FISBo BGR Электронный ресурс.: официальный сайт. Режим доступа:http://www.bgr.bund.de/EN/Themen/Boden/Informationsgrundlagen/informations grundlagennodeen.html (дата обращения 16.10.2011).

186. Soil Matrix база данных почв ЮФО Электронный ресурс.: официальный сайт. - Режим доступа: http://soilmatrix.ru (дата обращения 18.08.2011).

187. Soil Survey Géographie Database SSURGO Электронный ресурс.: официальный сайт. - Режим доступа: http://soils.usda.gov/survey/geography/ssurgo (дата обращения 14.08.2011).

188. Terra Spase Электронный ресурс.: официальный сайт. Режим доступа: http://www.terraspase.com (дата обращения 15.10.2011).

189. The European Soil Database distribution version 2.0 Электронный ресурс. -ЕС and the European Soil Bureau Network, 2004. 1 эл. опт. диск (CD-ROM).