Автор работы: Пользователь скрыл имя, 28 Февраля 2013 в 13:27, лабораторная работа
Порядок работы:
1.Из исходного поля выбрать и отделить в отдельную выборку точки независимой выборки (около 30% общего количества точек). Оставшиеся 70% составят зависимую выборку. (Выбирать точки в центре региона в хаотичном порядке, не оставлять больших пустых областей, не выбирать много точек на границе).
2.Для зависимой выборки методом исключения переменных МЛР определить оптимальную модель зависимости характеристики от координат. На основании модели рассчитать значения характеристики в точках независимой выборки.
3.Определить значения характеристики в точках независимой выборки на основании 12 методов интерполяции (в пакете Surfer8).
4.На основании полученных значений характеристики в точках независимой выборки рассчитать ошибки для каждого метода интерполяции и МЛР, а также их среднеквадратическую ошибку.
5.Сделать вывод о наилучшем методе восстановления пространственных пропусков.
6.С помощью этого метода нарисовать карту распределения характеристики. На нее нанести точки независимой выборки с указанием около них значений ошибок. Найти закономерности в распределении ошибок в зависимости от распределения характеристики, рельефа местности и т.п.
Министерство образования Российской Федерации
Российский
Государственный
Кафедра промысловой океанологии и охраны природных вод | |
Лабораторная работа №4:
Объективный анализ гидрометеорологических полей
и пространственная интерполяция
Выполнил: |
Коткин А.А. | ||
гр. МЭ-6-Г | |||
Проверила: |
Гордеева С.М. | ||
доц. |
Санкт-Петербург 2013
Исходные данные:
Порядок работы:
Исходное поле значений поверхностной температуры, состоящее из 48 точек (6×8), было разделено на 2 части:
- независимая выборка (14 точек);
- зависимая выборка (34 точки).
Для построения модели МЛР зависимости поверхностной температуры от географической широты и долготы (для зависимой выборки) был принят полный полином второго порядка вида
Т = a1φ2+a2λ2+a3φλ+a4φ+a5λ+a6 ,
где Т – значение температуры в точке поля, φ – широта, λ – долгота этой точки.
Был произведен расчет полной модели МЛР и всех ее характеристик. Далее с помощью пошаговой регрессии методом исключения переменных были рассчитаны остальные 4 модели МЛР и все их параметры. Результаты расчета приведены в таблице 1.
Таблица 1 - Характеристики моделей МЛР, полученные пошаговым моделированием методом исключения переменных | |||||||||
№ шага |
Количество предикторов |
t*min |
tкр |
F* |
Fкр |
R2 |
σε |
0,67σy |
σy |
1 |
5 |
-0,946 |
2,048 |
60,579 |
2,558 |
0,915 |
1,693 |
3,592 |
5,361 |
2 |
4 |
-2,473 |
2,045 |
75,777 |
2,545 |
0,913 |
1,690 | ||
3 |
3 |
-5,608 |
2,042 |
84,569 |
2,534 |
0,894 |
1,829 | ||
4 |
2 |
-4,789 |
2,040 |
56,067 |
2,523 |
0,783 |
2,574 | ||
5 |
1 |
-7,275 |
2,037 |
52,928 |
2,512 |
0,623 |
3,342 |
Где tmin* - t-статистика Стьюдента;
tкр - критическое значение статистики Стьюдента при уровне значимости α = 0,05 и числе степеней свободы ν = N-m-1, где N – длина ряда, m – количество предикторов;
F* - значение критерия Фишера;
Fкр - критическое значение критерия Фишера при уровне значимости α = 0,05 и числе степеней свободы ν1 = N-m-1 и ν2 = m, где N – длина ряда, m – количество предикторов;
R2 – коэффициент детерминации;
σε – стандартная ошибка модели;
σy – стандартное отклонение исходного ряда.
В качестве наилучшей модели была выбрана модель МЛР, полученная на 2-ом шаге. Величина стандартной ошибки (1,69) является наименьшей и не превышает 0,67 стандартного отклонения исходного ряда (3,59). Коэффициент детерминации больше 90 %, что говорит о достаточности информации для описания дисперсии исходного ряда. Все коэффициенты регрессии являются значимыми по критерию Стьюдента. Модель также адекватна по F-критерию.
Полученное
уравнение множественной
Т = – 0,046φ2 – 0,134λ2 – 0,095φλ – 9,078λ – 232,8
На основе полученной оптимальной модели МЛР были рассчитаны значения характеристики в точках независимой выборки. Результаты представлены в таблице 2.
По значениям зависимой выборки были определены значения поверхностной температуры в точках независимой выборки на основании следующих 12 методов интерполяции, представленных в пакете Surfer 8:
- Inverse Distance to a Power;
- Kriging;
- Minimum Curvature;
- Modified Shepard's Method;
- Natural Neighbor;
- Nearest Neighbor;
- Polynomial Regression;
- Radial Basis Function;
- Triangulation with Linear Interpolation;
- Moving Average;
- Data Metrics;
- Local Polynomial.
Полученные результаты представлены в таблице 2.
Для определения наилучшего метода восстановления пространственных пропусков в таблице 3 на основании полученных значений поверхностной температуры в точках независимой выборки были рассчитаны ошибки для каждого метода интерполяции и МЛР, а также их среднеквадратическая ошибка:
, где e = Храсч – Хфакт;
N – количество значений независимой выборки.
Таблица 2 - Значения поверхностной температуры в точках независимой выборки
Таблица 3 - Ошибки интерполяции в точках независимой выборки
Величина стандартного отклонения зависимой выборки составляет 5,36. Как видно из таблицы 3, все рассмотренные методы, за исключением Data Metrics, обладают достаточно высокой точностью, так как величина их ошибки не превышает 0,67 стандартного отклонения зависимой выборки. При этом наименьшей ошибкой (1,058) °C обладает метод Natural Neighbor. Однако следует отметить, что интерполяция данным методом производится не по всему полю, и определить значения температуры в краевых точках (точки № 1, 9) с помощью данного метода невозможно. Следующим по величине ошибки интерполяции после метода Natural Neighbor является Modified Shepard's Method (1,252) °C. Следует отметить, что хотя его ошибка больше, он позволяет определить значения поверхностной температуры во всех точках независимой выборки. Наибольшая ошибка соответствует методу Data Metrics и составляет 31,205 °C, что намного превышает величину стандартного отклонения зависимой выборки.
С использованием наилучшего метода пространственной интерполяции (Natural Neighbor) была построена карта распределения поверхностной температуры на исследуемой территории. На нее были нанесены точки независимой выборки с указанными около них значениями ошибок (ε). Результаты представлены на рисунке 1.
Как видно на рисунке 1, ошибки распределены на исследуемой территории неравномерно. Так, точки с наибольшими по модулю значениями ошибок (2.4, -1.3, 1.2) °C располагаются в основном в северо-восточной части исследуемой территории, в районе прохождения изолиний 1-5 ˚С. Это может быть связано с тем, что по направлению с юго-запада на северо-восток градиент поверхностной температуры постепенно увеличивается.
Для юго-западной
и центральной части
Рисунок 1 - Пространственное распределение температуры воздуха (изолинии) и независимых ошибок интерполяции методом Natural Neighbor
Информация о работе Объективный анализ гидрометеорологических полей и пространственная интерполяция