Оценка качества воды с использованием -метода
проверки статистических гипотез 3
Методики, описанные в предыдущих разделах, основаны на предположении, что заранее известны точные (т.е. истинные) значения C1, C2 ,..., Cn концентраций вредных веществ в воде изучаемого водоема. В реальных условиях исследователь имеет дело с некоторой эмпирической выборкой значений Ci, j =
, из стохастического временного ряда наблюдений, имеющего принципиально вероятностную природу вследствие нестационарного воздействия антропогенных факторов и погрешности измерений.
Пусть (С1, С2,…, Сn)Т - случайный вектор концентраций примесей в воде, элементы которого независимы и измеряются со случайными погрешностями. Концентрация каждого j-го компонента (j=
) имеет нормальный закон распределения с математическим ожиданием M{Сj} и дисперсией D{Сj }.
Предположим, что мы располагаем представительными выборками
объемом по Nj значений результатов параллельных измерений концентрации вредных веществ, что позволяет получить оценки параметров - математических ожиданий
и среднеквадратических отклонений
для распределений соответствующих случайных величин Сj :

,

, (3.10)
где fj = Nj -1 - число степеней свободы величины Sj (j =
).
Рассмотрим возможные подходы к комплексной оценке качества воды. Согласно СанПиН 2.1.5.980-00 «при обнаружении в воде химических веществ с одинаковыми лимитирующими признаками вредности, сумма отношений обнаруженных концентраций к их ПДК:
(3.11)
не должна быть более единицы». Использование формулы (3.11) предполагает две оценки качества воды - «безвредная» (при μ < 1) и «вредная» (при μ > 1).
Поскольку концентрации загрязняющих компонентов Сi представляют собой случайные величины, то и критерии качества воды на их основе также носят вероятностный характер. Следовательно, для оценки качества воды необходимо воспользоваться теорией проверки статистических гипотез [Леман, 1964].
Статистическая оценка математического ожидания показателя μ загрязнения воды примесями может быть вычислена по формуле (3.11), куда вместо параметров Сj подставляются их соответствующие оценки
:
, (3.12)
а ПДК каждой примеси являются действительными (неслучайными) числами.
Оценка
дисперсии D{μ} и дисперсия
ошибки оценки m показателя качества μ выражаются формулами
и
. (3.13)
Формально задача ставится следующим образом. Необходимо оценить качество воды путем проверки двух гипотез НА: μ < 1 (безвредная) против НВ: μ > 1 (вредная), для чего воспользуемся последовательностью действий, определяемой теорией [Леман, 1964] и практикой [Цейтлин, 1984] проверки статистических гипотез.
1. В качестве статистической характеристики гипотезы выбирается распределение Стьюдента tf с f степенями свободы при малых значениях f (1 ≤ f ≤ 25) и нормированное нормальное распределение Z при больших значениях f (f > 25).
2. В качестве нулевой Н0 гипотезы формулируется то предположение, ошибочное отклонение которого дает наибольший ущерб. Например, с точки зрения экосистемы водоема ошибочное отклонение гипотезы НВ, когда она верна, приводит к более тяжелым последствиям, чем ошибочное отклонение НА, когда она верна. Исходя из этого, формулируем
Н0 = НВ : μ ≥ 1 против альтернативы Н1 = НА : μ < 1. (3.15)
3. Задается критические значения уровня значимости αк из рекомендованных в работе [Цейтлин, 1984] интервалов: 0,3 ≤ αк ≤ 1, когда ответственность за выводы предельно малая, 0,1 ≤ αк < 0,3 - малая; 0,03 ≤ αк < 0,1 - обычная; 0,001<αк<0,03 - большая; 0 < αк < 0,001 - предельно большая.
4. Выполняются необходимые эксперименты, имеющие цель получить представительные выборки
объемом по Nj значений величин Сj (i =
) результатов параллельных измерений концентрации загрязняющих веществ.
5. Вычисляется оценка
уровня значимости α (α - вероятность ошибочного отклонения проверяемой гипотезы Н0, если она верна):

, (3.16)
где Zα = L- [L2-2tf,α∙(f + 3)]0,5, L = f +1.5tf,α+3; tf,α - верхний α-предел распределения Стьюдента (tf,α > 1) с f степенями свободы, число которых может быть определено по формуле Уэлча [Браунли, 1977]:
. (3.17)
Если рассматривается гипотеза Н0 = НB, то значения tf,α вычисляются как
. (3.18)
6. Принимается решения о проверяемой гипотезе. Условия отклонения нулевой гипотезы
≤ αк. Если же
> αк , то гипотезу Н0 не отклоняют.
Формулировка нулевой гипотезы Н0 в виде (3.15) отражает точку зрения «Водопользователя» (ВП), т.е. населения, использующего воду в хозяйственных или питьевых целях, а также сообществ гидробионтов, населяющих водоем, активистов движения «Green Peace» и проч. С позиций ВП ошибочное отклонение гипотезы о плохом качестве воды может привести к тяжелым последствиям для экосистемы и здоровья человека и, с учетом этого риска, критическое значение αк выбирается из большого или предельно большого уровня ответственности, например, αкВП = 0.01.
Однако, представляется целесообразным учесть и экономические интересы «Водоочистителя» (ВО) – организации, ответственной за очистку сбрасываемых в водоем сточных вод до нормативного качества, а также другого производителя, лимитирующего свою хозяйственную деятельность в соответствии с требованиями водоохранных органов. Для ВО ошибочное отклонение гипотезы о чистоте воды (НА), когда она верна, приводит к более тяжким экономическим последствиям, чем ошибочное отклонение НB, если она справедлива (см. табл. 3.20). Поэтому ВО формулирует нулевую гипотезу следующим образом:
Н0 =
НА:
μ ≤ 1 против
Н1 =
НB:
μ > 1, (3.19)
а верхний α-предел распределения Стьюдента вычисляется по формуле:

. (3.20)
Для принятия решения о проверяемой гипотезе для ВО могут быть выбраны более "мягкие" уровни ответственности за выводы, например, при критических значениях αкВ0 = 0.1.
Области (0 <
≤ αкi) (i
[ВО; ВП]) отклонения нулевой гипотезы называются критическими. Их взаимно однозначное отображение на область значений показателя μ загрязнения водоема происходит по-разному, в зависимости от сформулированных нулевой и альтернативной гипотез, отражающих интересы субъектов с различной точкой зрения (см. рис. 3.2.).
Для ВО критической областью является (μ: μкВО< μ < ∞); для ВП - это (μ: 0 < μ < μкВП). Поскольку уравнение (3.16) легко выразить явно относительно tf,α , то критические значения меры μ можно найти [Дубницкий, Цейтлин, 1999], подставив в формулы (3.18) и (3.20) критические значения уровней значимости αкВ0 и αкВП соответственно, и решая их относительно
:
μкВО = 1 +

;
α =
αкВ0; (3.21)
μкВП = 1 -

;
α =
αкВП. (3.22)
На рис. 3.2 представлены функции распределения оценки
величины μ в предположении о справедливости гипотезы Н0, сформулированной с точки зрения «Водоочистителя» F(μ) и «Водопользователя» P(
< μ). Очевидно, что P(μ) = 1- F(μ).
Таблица 3.20
Распределение результатов решений при проверке гипотез о соответствии качества воды установленным нормам
Предполагается
|
Позиция лица, принимающего решение (ЛПР)
|
Результат решения в зависимости от истинности гипотезы
|
НА: <1
(безвредная вода)
|
НВ : >1
(вредная вода)
|
Отклонить
НВ: >1
(вода безвредная)
|
Станция очистки воды (ВО)
|
Верно: получает плату за безвредную воду
|
Ошибка: получает плату за безвредную воду, хотя она вредная
|
Потребитель воды (ВП)
|
Верно: платит за безвредную воду
|
Ошибка: платит за безвредную воду, но отравляется вредной водой
|
Отклонить
НА: <1
(вода вредная)
|
Станция очистки воды (ВО)
|
Ошибка: лишние затраты на очистку или (и) штраф
|
Верно: необходимы затраты на очистку или (и) штраф
|
Потребитель воды (ВП)
|
Ошибка: лишние затраты, вызванные ограничением потребления воды
|
Верно: необходимы затраты, вызванные ограничением потребления воды
|

Рис. 3.2. Отображение критических областей оценки уровня значимости
(0 <
≤ αкi) показателя качества воды μ для лиц, принимающих решения в интересах «Водоочистителя» (а) и «Водопользователя» (б)
Среди множества решений о качестве воды существует область (μкВП<
<μкВО), в которой могут встретиться спорные решения, т.е. «Водоочиститель» оценивает качество воды как безвредное, а «Водопользователь» – как вредное. Один из способов разрешения такого "спора" заключается в увеличении объемов Nj выборок: согласно формуле (3.13) среднеквадратичное отклонение Sμ новой оценки μ с ростом Nj уменьшается; а спорная область при неизменных αкВ0 и αкВП сужается. Менее трудоемким способом выхода из спорной области может быть пересмотр обоими субъектами критических уровней значимости αкi: при их увеличении принимается меньший уровень ответственности за выводы (чем больше αкi, тем значения tf,α в формулах (3.21) и (3.22) меньше).
Изложенный подход формализации задачи остается
, в основном, без изменений и при других способах комплексной оценки качества воды, описанных в разделе 3.4. В алгоритм необходимо лишь внести коррективы, учитывающие особенности расчетной формулы выбранного показателя, отличного от (3.11). Например, примем более мягкие условия нормирования качества: вода считается "чистой", если каждая из анализируемых примесей
Ci,
j =

, не более нормируемой величины ПДК
i то есть, для всех
j справедливо
Ci,/
ПДК
i < 1. Тогда исходные гипотезы примут вид:
НА j:
Сj < ПДК
j (безвредная) против
НВj :
Сj > ПДК
j (вредная).
<предыдущая страница