English Français Español Русский 中文 Deutsch Português عربي italiano 日本



         Некоторые вопросы сейсморазведки



 Домашняя  Сервис  Софт  Учебный материал  Контакты

Почти математика

Хотя обработка сейсмических данных использует некоторые из наиболее сложных известных числовых алгоритмов, геофизик – обработчик может запросто понять, что за процесс происходит, но не как он происходит!

Тем не менее, было бы весьма полезно понять основные применяемые принципы. Наиболее необходимы базовые знания арифметики, геометрии и тригонометрии. Хотя мы полагаемся на компьютер, что он выполнит основной объем работ, но нам необходимо подбирать параметры для каждого этапа обработки (а это уже ощутимо математически (да и геологически)), и проверять компьютерные результаты.

Единственная наиболее общая математическая нить, что происходит через обработку сейсмических данных, - это «метод наименьших квадратов», процесс сведения к минимуму ошибок, появляющихся при некотором приближении наших данных. Этот метод используется неоднократно в процессе обработки сейсмических данных, поэтому стоит на нем немного остановится. Если же вы разбираетесь с этим методом, или вы просто боитесь, или вас тошнит от таких перспектив, можете просто перейти на Следующую страницу.


 

Чтобы объяснить принцип метода наименьших квадратов, возьмем набор чисел, представляющих время, которое затрачиваю, чтобы добраться до работы в течение нескольких дней подряд:

День 1 - 25 мин
День 2 - 37 мин
День 3 - 28 мин
День 4 - 35 мин
Я бы хотел установить «наилучшую оценку» моего времени, не применяя «среднего», но применяя некоторые знания азов математики.

Начнем с предположения, что наилучшее время – скажем, 30 минут. Чтобы увидеть, насколько правильно это предположение, просто вычтем это число из истинных значений:

День 1 - 25: 25 - 30 = -5
День 2 - 37: 37 - 30 = 7
День 3 - 28: 28 - 30 = -2
День 4 - 35: 35 - 30 = 5
Общую ошибку можно описать -5 + 7 + -2 + 5 = 5, но здесь не принимается тот факт, что некоторые из этих чисел положительные, а некоторые – отрицательные. На самом деле, я заинтересован только в величине ошибки, а не в ее знаке, поэтому я сделаю самую простую (математическую) процедуру, т.е. возведу в квадрат все числа, прежде чем их складывать. Это дает мне (для предположения 30) общую квадратическую ошибку 25 + 49 + 4 + 25 = 103. Наилучшим будет то предположение, где число будет минимальным.

Вот целый ряд предположений с соответствующими квадратическими ошибками:

Предположение 20 – Квадратическая ошибка = 603 Предположение 30 - Квадратическая ошибка = 103
Предположение 22 - Квадратическая ошибка = 439 Предположение 32 - Квадратическая ошибка = 99
Предположение 24 - Квадратическая ошибка = 307 Предположение 34 - Квадратическая ошибка = 127
Предположение 26 - Квадратическая ошибка = 207 Предположение 36 - Квадратическая ошибка = 187 и т.д. ...
На графике приводится отношение квадратической ошибки к предположению по всем значениям:

На графике приводится отношение квадратической ошибки к предположению по всем значениям

Совершенно очевидно, что Общие значения квадратической ошибки стремятся к минимальному значению в основании кривой, и это соответствует положению «наиболее подходящему». Чтобы рассчитать ее значение, нам необходимо выразить наши расчеты общими терминами.

Если мы возьмем наши начальные данные как X1, X2 и т.д., тогда для любого заданного значения квадратическая ошибка равна:

квадратическая ошибка

где G - предположение. Общая квадратическая ошибка (E) равна:

Общая квадратическая ошибка (E) равна

где N –число значений. Мы можем расширить это выражение до:

Мы можем расширить это выражение

или (упрощенно):

упрощенно

Теперь единственная (небольшая) сложность. Чтобы привести эту общую квадратическую ошибку к минимуму, нам необходимо дифференцировать правую сторону вышеприведенного уравнения относительно G (то, что мы пытаемся выяснить). Это даст нам склон конечной кривой и точку «переворота» там, где оно равно нулю.

Дифференциал от E тогда равен:

Дифференциал от E

который мы устанавливаем равным нулю, чтобы найти минимальное значение ошибки для G:

минимальное значение ошибки

и переупорядочим (разделим на 2):

чтобы найти минимальное значение ошибки для G

и найдем G:

и переупорядочим (разделим на 2):

Это, кажется, говорит нам о том, что наилучшее предположение для G – это сумма всех отдельно взятых значений (25+37+28+35=125), разделенных на число значений. Долгий запутанный путь доказательства того, что наиболее подходящее постоянное значение для набора чисел - СРЕДНЕЕ!

Конечно, этот процесс можно продлить , чтобы найти «наиболее подходящее» от любой математической функции к любому набору чисел любых размеров; решение в каждом случае будет иметь минимальную квадратическую ошибку. Вот еще раз наши данные (отметки) и целый набор подходящих кривых более высоких порядков:

целый набор подходящих кривых более высоких порядков

Красная линия – среднее значение, которое мы только что рассчитали, зеленая – пряма линия, голубая – квадратическая, и коричневая - кубическая. Коричневая (кубическая) кривая точно соответствует четырем точкам, но едва ли она наиболее подходящая в данном случае. (Если ее применить, то на следующей неделе мне потребуется месяц, чтобы добраться до работы, и я предполагаю, что движение будет действительно ужасным!).

Мы еще вернемся к методу наименьших квадратов позднее!