Что такое доверительная вероятность 95. Доверительные вероятности и уровни значимости

Доверительный интервал. Доверительная вероятность.

ПРИМЕНЕНИЕ ТЕОРИИ ВЕРОЯТНОСТИ К СТАТИСТИКЕ.

Основные понятия.

Математическая статистика - это раздел математики, в котором изучаются методы обработки и анализа экспериментальных данных, полученных в результате наблюдений над массовыми случайными событиями, явлениями.

Наблюдения, проводимые над объектами, могут охватывать всех членов изучаемой совокупности без исключения и могут ограничиваться обследованиями лишь некоторой части членов данной совокупности. Первое наблюдение называется сплошным или полным, второе частичным или выборочным .

Естественно, что наиболее полную информацию дает сплошное наблюдение, однако к нему прибегают далеко не всегда. Во-первых, сплошное наблюдение очень трудоемко, а во-вторых, часто бывает практически невозможно или даже нецелесообразно. Поэтому в подавляющем большинстве случаев прибегают к выборочному исследованию.

Совокупность, из которой некоторым образом отбирается часть ее членов для совместного изучения, называется генеральной совокупностью , а отобранная тем или иным способом часть генеральной совокупности - выборочная совокупность или выборка .

Объем генеральной совокупности теоретически ничем неограничен , на практике же он всегда ограничен.

Объем выборки может быть большим или малым, но он не может быть меньше двух.

Отбор в выборку можно проводить случайным способом (по способу жеребьевки или лотереи). Либо планово, в зависимости от задачи и организации обследования. Для того, чтобы выборка была представительной, необходимо обращать внимание на размах варьирования признака и согласовывать с ним объем выборки.

2. Определение неизвестной функции распределения.

Итак, мы сделали выборку. Разобьем диапазон наблюдаемых значений на интервалы , , …. одинаковой длины . Для оценки необходимого числа интервалов можно использовать следующие формулы:

Далее пусть m i - число наблюдаемых значений , попавших в i -ый интервал. Разделив m i на общее число наблюдений n , получим частоту , соответствующую i -ому интервалу: , причем . Составим следующую таблицу:

Номер интервала Интервал m i
m 1
m 2
... ... ... ...
k m k

которая называется статистическим рядом . Эмпирической (или статистической ) функцией распределения случайной величины называется частота события, заключающегося в том, что величина в результате опыта примет значение, меньшее x :

На практике достаточно найти значения статистической функции распределения F * (x) в точках , которые являются границами интервалов статистического ряда:

(5.2)

Следует заметить, что при и при . Построив точки и соединив их плавной кривой, получим приближенный график эмпирической функции распределения (рис. 5.1). Используя закон больших чисел Бернулли, можно доказать, что при достаточно большом числе испытаний с вероятностью, близкой к единице, эмпирическая функция распределения отличается сколь угодно мало от неизвестной нам функции распределения случайной величины .

Часто вместо построения графика эмпирической функции распределения поступают следующим образом. На оси абсцисс откладывают интервалы , ,…. . На каждом интервале строят прямоугольник, площадь которого равна частоте , соответствующей данному интервалу. Высота h i этого прямоугольника равна , где - длинна каждого из интервалов. Ясно, что сумма площадей всех построенных прямоугольников равна единице.

Рассмотрим функцию , которая в интервале постоянна и равна . График этой функции называется гистограммой . Он представляет собой ступенчатую линию (рис. 5.2). С помощью закона больших чисел Бернулли можно доказать, что при малых и больших с практической достоверностью как угодно мало отличается от плотности распределения непрерывной случайной величины .

Таким образом на практике определяется вид неизвестной функции распределения случайной величины.

3. Определение неизвестных параметров распределения.

Таким образом мы получили гистограмму, которая дает наглядность. Наглядность представленных результатов позволяет сделать различные заключения, суждения об исследуемом объекте.

Однако на этом обычно не останавливаются, а идут дальше, анализируя данные на проверку определенных предположений относительно возможных механизмов изучаемых процессов или явлений.

Несмотря на то, что данных в каждом обследовании сравнительно немного, мы бы хотели, чтобы результаты анализа достаточно хорошо описывали бы все реально существующее или мыслимое множество (т.е. генеральную совокупность).

Для этого делают некоторые предположения о том, как вычисленные на основе экспериментальных данных (выборке) показатели соотносятся с параметрами генеральной совокупности.

Решение этой задачи составляет главную часть любого анализа экспериментальных данных и тесно связано с использованием ряда теоретических распределений, рассмотренных выше.

Широкое использование в статистических выводах нормального распределения имеет под собой как эмпирическое, так и теоретическое обоснование.

Во-первых, практика показывает, что во многих случаях нормальное распределение действительно является довольно точным представлением экспериментальных данных.

Во-вторых, теоретически показано, что средние значения интервалов гистограмм распределены по закону, близкому к нормальному.

Однако следует четко представлять, что нормальное распределение - это лишь чисто математический инструмент и совсем необязательно, чтобы реальные экспериментальные данные точно описывались нормальным распределением. Хотя во многих случаях, допуская небольшую ошибку, можно говорить, что данные распределены нормально.

Ряд показателей, такие как среднее, дисперсия и т.д., характеризуют выборку и называются статистиками. Такие же показатели, но относящиеся к генеральной совокупности в целом, называются параметрами. Таким образом, можно сказать, что статистики служат для оценки параметров.

Генеральной средней называется среднее арифметическое значений генеральной совокупности объема :

Выборочной средней называется среднее арифметическое выборки объема :

(5.4)

если выборка имеет вид таблицы.

Выборочную среднюю принимают в качестве оценки генеральной средней.

Генеральной дисперсией называется среднее арифметическое квадратов отклонения значений генеральной совокупности от их среднего значения :

Генеральным средним квадратическим отклонением называется корень квадратный из генеральной дисперсии: .

Выборочной дисперсией называется среднее арифметическое квадратов отклонения значений выборки от их среднего значения :

Выборочное среднее квадратическое отклонение определяется как .

Для лучшего совпадения с результатами экспериментов, вводят понятие эмпирической (или исправленной) дисперсии :

Для оценки генерального среднего квадратического отклонения служит исправленное среднее квадратическое отклонение, или эмпирический стандарт :

(5.5)

В случае, когда все значения выборки различны, т.е. , , формулы для и принимают вид:

(5.6)

Доверительный интервал. Доверительная вероятность.

Различные статистики, получаемые результате вычислений, представляют собой точечные оценки соответствующих параметров генеральной совокупности.

Если из генеральной совокупности извлечь некоторое количество выборок и для каждой из них найти интересующие нас статистики, то вычисленные значения будут представлять собой случайные величины, имеющие некоторый разброс вокруг оцениваемого параметра.

Но, как правило, в результате эксперимента в распоряжении исследователя имеется одна выборка. Поэтому значительный интерес представляет получение интервальной оценки, т.е. некоторого интервала, внутри которого, как можно предположить, лежит истинное значение параметра.

Вероятности, признанные достаточными для уверенных суждениях о параметрах генеральной совокупности на основании статистик, называются доверительными.

Для примера рассмотрим как оценку параметра .

В котором с той или иной вероятностью находится генеральный параметр. Вероятности, признанные достаточными для уверенного суждения о генеральных параметрах на основании выборочных показателей, называют доверительными .

Понятие о доверительных вероятностях вытекает из принципа, что маловероятные события считаются практически невозможными, а события, вероятность которых близка к единице, принимают за почти достоверные. Обычно в качестве доверительных используют вероятности Р 1 = 0.95, Р 2 = 0.99, Р 3 = 0.999. Определенным значениям вероятностей соответствуют уровни значимости , под которыми понимают разность α = 1-Р. Вероятности 0.95 соответствует уровень значимости α 1 = 0.05 (5%), вероятности 0.99 - α 2 = 0.01 (1%), вероятности 0.999 - α 3 = 0.001 (0.1%).

Это означает, что при оценке генеральных параметров по выборочным показателям существует риск ошибиться в первом случае 1 раз на 20 испытаний, т.е. в 5% случаев; во втором - 1 раз на 100 испытаний, т.е. в 1% случаев; в третьем - 1 раз на 1000 испытаний, т.е. в 0.1% случаев. Таким образом, уровень значимости обозначает вероятность получения случайного отклонения от установленных с определенной вероятностью результатов. Вероятности, принятые как доверительные, определяют доверительный интервал между ними. На них можно основывать оценку той или иной величины и те границы, в которых она может находиться при разных вероятностях.

Для различных вероятностей доверительные интервалы будут следующими:

Р 1 = 0.95 интервал - 1.96σ до + 1.96σ (рис. 5)

Р 2 = 0.99 интервал - 2.58σ до + 2.58σ

Р 3 = 0.999 интервал - 3.03σ до + 3.03σ

Доверительным вероятностям соответствуют следующие величины нормированных отклонений:

Вероятности Р 1 = 0.95 соответствует t 1 = 1.96σ

Вероятности Р 2 = 0.99 соответствует t 2 = 2.58σ

Вероятности Р 3 = 0.999 соответствует t 3 = 3.03σ

Выбор того или иного порога доверительной вероятности осуществляют исходя из важности события. Уровень значимости в таком случае - эта та вероятность, которой решено пренебрегать в данной исследовании или явлении.

Средняя ошибка (m), или ошибка репрезентативности.

Выборочные характеристика, как правило, не совпадают по абсолютной величине с соответствующими генеральными параметрами. Величину отклонения выборочного показателя от его генерального параметра называют статистической ошибкой, или ошибкой репрезентативности. Статистические ошибки присущи только выборочным характеристикам, они возникают в процессе отбора вариант из генеральной совокупности.


Средняя ошибка вычисляется по формуле:

где σ - среднее квадратическое отклонение,

n - количество измерений (объем выборки).

Выражается в тех же единицах измерения, что и .

Величина средней ошибки обратно пропорциональна численности выборочной совокупности. Чем больше размеры выборки, тем меньше средняя ошибка, а следовательно, меньше расхождение между значениями признаков в выборочных и генеральной совокупностях.

Среднюю ошибку выборки можно использовать для оценки генеральной средней согласно закону нормального распределения. Так, в пределах ±1 находится 68.3% всех выборочных средних арифметических , в пределах ±2 - 95.5% всех выборочных средних , в пределах ±3 - 99.7% всех выборочных средних .

После получения точечной оценки желательно иметь данные о надежности такой оценки. Понятно, что величина является лишь приближенным значением параметра q. Вычисленная точечная оценка может быть близка к оцениваемому параметру, а может и очень сильно отличаться от него. Точечная оценка не несет информации о точности процедуры оценивания. Особенно важно иметь сведения о надежности оценок для небольших выборок. В таких случаях следует пользоваться интервальными оценками.

Задачу интервального оценивания в самом общем виде можно сформулировать следующим образом: по данным выборки построить числовой интервал, относительно которого с заранее выбранной вероятностью можно сказать, что внутри этого интервала находится оцениваемый параметр. Здесь существует несколько подходов. Наиболее распространенным методом интервального оценивания является метод доверительных интервалов .

Доверительным интервалом для параметра q называется интервал , содержащий неизвестное значение параметра генеральной совокупности с заданной вероятностью g, т.е.

.

Число g называется доверительной вероятностью , а число a=1–g – уровнем надежности . Доверительная вероятность задается априорно и определяется конкретными условиями. Обычно используется g=0,9; 0,95; 0,99 (соответственно, a=0,1; 0,05; 0,01).

Длина доверительного интервала, характеризующая точность интервальной оценки, зависит от объема выборки n и доверительной вероятности g. При увеличении величины n длина доверительного интервала уменьшается, а с приближением вероятности g к единице – увеличивается.

Часто доверительный интервал строят симметричным относительно точечной оценки, т.е. в виде

, (3.15)

Здесь число D называется предельной (или стандартной ) ошибкой выборки . Однако симметричные интервалы не всегда удается построить, более того, иногда приходится ограничиваться односторонними доверительными интервалами:

или .

Поскольку в эконометрических задачах часто приходится строить доверительные интервалы параметров случайных величин, имеющих нормальное распределение , приведем схемы их нахождения.



3.4.2. Доверительный интервал оценки генеральной
средней при известной генеральной дисперсии

Пусть количественный признак X генеральной совокупности имеет нормальное распределение с заданной дисперсией s 2 и неизвестным математическим ожиданием a . Для оценки параметра a извлечена выборка X 1 , X 2 , …, X n , состоящей из n независимых нормальной распределенных случайных величин с параметрами a и s, причем s известно, а величину a оценивают по выборке:

.

Оценим точность этого приближенного равенства. Для этого зададим вероятность g и попробуем найти такое число D, чтобы выполнялось соотношение

.

Далее воспользуемся свойствами нормального распределения. Известно, что сумма нормально распределенных величин также имеет нормальное распределение. Поэтому средняя величина имеет нормальное распределение, математическое ожидание и дисперсия которой равны

Следовательно,

.

Воспользуемся теперь формулой нахождения вероятностей отклонения нормально распределенной случайной величины от математического ожидания:

,

где F(x ) – функция Лапласа. Заменяя X на и s на , получим

,

где . Из последнее равенства находим, что предельная ошибка выборки будет равна

.

Приняв во внимание, что доверительная вероятность задана и равна g, получим окончательный результат.

Интервальная оценка генеральной средней (математического ожидания) имеет вид

, (3.17)

или более кратко

где число t g определяется из равенства .

Приведем значения t g для широко распространенных значений доверительной вероятности:

, , .

Обсудим, как влияет на точность оценивания параметра a объем выборки n , величина среднего квадратичного отклонения s, а также значение доверительной вероятности g.

а) При увеличении n точность оценки увеличивается. К сожалению, увеличение точности (т.е. уменьшение длины доверительного интервала) пропорционально , а не 1/n , т.е. происходит гораздо медленнее, чем рост числа наблюдений. Например, если мы хотим увеличить точность выводов в 10 раз чисто статистическими средствами, то мы должны увеличить объем выборки в 100 раз.

б) Чем больше s, тем ниже точность. Зависимость точности от этого параметра носит линейный характер.

в) Чем выше доверительная вероятность g, тем больше значение параметра t g , т.е. тем ниже точность. При этом между g и t g существует нелинейная связь. С увеличением g значение t g резко увеличивается ( при ). Поэтому с большой уверенностью (с высокой доверительной вероятностью) мы можем гарантировать лишь относительно невысокую точность. (Доверительный интервал окажется широким.) И наоборот: когда мы указываем для неизвестного параметра a относительно узкие пределы, мы рискуем совершить ошибку – с относительно высокой вероятностью.

Отметим, что величина

называется средней ошибкой выборки . Для бесповторной выборки эта формула примет вид

. (3.20)

Тогда предельная ошибка выборки D будет представлять собой t -кратную среднюю ошибку:

Пример 3.7. На основе продолжительных наблюдений за весом X пакетов орешков, заполняемых автоматически, установлено, что среднее квадратичное отклонение веса пакетов равно s=10 г . Взвешено 25 пакетов, при этом их средний вес составил . В каком интервале с надежностью 95% лежит истинное значение среднего веса пакетов?

.

Для определения 95%-го доверительного интервала вычислим предельную ошибку выборки

Следовательно 95%-й доверительный интервал для истинное значение среднего веса пакетов будет иметь вид

,

На первый взгляд может показаться, что полученный результат представляет только теоретический результат, поскольку среднее квадратичное отклонение s, как правило, тоже неизвестно и вычисляется по выборочным данным. Однако если выборка достаточно большая, то полученный результат вполне приемлем для практического использования, поскольку функция распределения будет мало отличаться от нормальной, а оценка дисперсии s 2 будет достаточно близка к истинному значению s 2 . Более того, полученный результат часто используют и в том случае, когда распределение генеральной совокупности отличается нормального. Это обусловлено тем, что сумма независимых случайных величин, в силу центральной предельной теоремы, при больших выборках имеет распределение, близкое к нормальному. â

Пример 3.8. Предположим, что в результате выборочного обследования жилищных условий жителей города на основе собственно-случайной повторной выборки, получен следующий вариационный ряд:

Таблица 3.5

Построить 95%-доверительный интервал для изучаемого признака.

Решение. Рассчитаем выборочную среднюю величину и дисперсию изучаемого признака.

Таблица 3.6

Общая площадь жилищ, приходящаяся на 1 чел., м 2 Число жителей, n i Середина интервала, x i
До 5,0 2,5 20,0 50,0
5,0–10,0 7,5 712,5 5343,8
10,0–15,0 12,5 2550,0 31875,0
15,0–20,0 17,5 4725,0 82687,5
20,0–25,0 22,5 4725,0 106312,5
25,0–30,0 27,5 3575,0 98312,5
30,0 и более 32,5 2697,5 87668,8
Итого 19005,0 412250,0

; ; .

Средняя ошибка выборки составит

.

Определим предельную ошибку выборки с вероятностью 0,95 ():

Установим границы генеральной средней

.

Таким образом, на основании проведенного выборочного обследования с вероятностью 0,95 можно заключить, что средний размер общей площади, приходящейся на 1 чел., в целом по городу лежит в пределах от 18,6 до 19,4 м 2 . â

3.4.3. Доверительный интервал оценки генеральной
средней при неизвестной генеральной дисперсии

Выше была решена задача построения интервальной оценки для математического ожидания нормального распределения, когда его дисперсия известна. Однако на практике дисперсия обычно тоже неизвестна и ее вычисляют по той же самой выборке, что и математическое ожидание. Это приводит к необходимости использования другой формулы при определении доверительного интервала для математического ожидания случайной величины, имеющей нормальное распределение. Такая постановка задачи особенно актуальна при малых объемах выборки.

Пусть количественный признак X генеральной совокупности имеет нормальное распределение N (a ,s), причем оба параметра a и s неизвестны. По данным выборки X 1 , X 2 , …, X n , вычислим среднее арифметическое и исправленную дисперсию:

, .

Для нахождения доверительного интервала в этом случае строится статистика

имеющая распределение Стьюдента с числом степеней свободы n=n–1 независимо от значений параметров a и s. Выбрав доверительную вероятность g и зная объем выборки n, можно найти такое число t, что будет выполняться равенство

,

.

Отсюда находим

интервальную оценку для генеральной средней (математического ожидания) при неизвестном s:

, (3.22)

или более кратко

Число t (коэффициент Стьюдента ) находится из таблиц для распределения Стьюдента. Отметим, что он является функцией двух аргументов: доверительной вероятности g и числа степеней свободы k =n –1, т.е. t=t (g,n).

Следует быть очень внимательным при использовании таблиц для распределения Стьюдента. Во-первых, обычно в таблицах вместо доверительной вероятности g используют уровень надежности a=1–g. Во-вторых, очень часто в таблицах приводятся значения т.н. одностороннего критерия Стьюдента

Или .

В этом случае в таблицах следует брать значения , если в таблице используется уровень надежности, или , если в таблице используется доверительная вероятность.

Несмотря на кажущееся сходство формул (3.17) и (3.22), между ними имеется существенное различие, заключающееся в том, что коэффициент Стьюдента t зависит не только от доверительной вероятности, но и от объема выборки. Особенно это различие заметно при малых выборках. (Напомним, что при больших выборках различие между распределением Стьюдента и нормальным распределением практически исчезает.) В этом случае использование нормального распределения приводит к неоправданному сужению доверительного интервала, т.е. к неоправданному повышению точности. Например, если n =5 и g=0,99, то, пользуясь распределением Стьюдента, получим t =4,6, а используя нормальное распределение, – t =2,58, т.е. доверительный интервал в последнем случае почти в два раза уже, чем интервал при использовании распределения Стьюдента.

Пример 3.9. Аналитик фондового рынка оценивает среднюю доходность определенных акций. Случайная выборка 15 дней показала, что средняя (годовая) доходность со средним квадратичным отклонением . Предполагая, что доходность акций подчиняется нормальному закону распределения, постройте 95%-доверительный интервал для средней доходности интересующего аналитика вида акций.

Решение. Поскольку объем выборки n =15, то необходимо применить распределение Стьюдента с степенями свободы. По таблицам для распределения Стьюдента находим

.

Используя это значение, строим 95%-доверительный интервал:

.

Следовательно, аналитик может быть на 95% уверен, что средняя годовая доходность по акциям находится между 8,44% и 12,3%. â

Доверительный интервал пришел к нам из области статистики. Это определенный диапазон, который служит для оценки неизвестного параметра с высокой степенью надежности. Проще всего это будет пояснить на примере.

Предположим, нужно исследовать какую-либо случайную величину, например, скорость отклика сервера на запрос клиента. Каждый раз, когда пользователь набирает адрес конкретного сайта, сервер реагирует на это с разной скоростью. Таким образом, исследуемое время отклика имеет случайный характер. Так вот, доверительный интервал позволяет определить границы этого параметра, и затем можно будет утверждать, что с вероятностью в 95% сервера будет находиться в рассчитанном нами диапазоне.

Или же нужно узнать, какому количеству людей известно о торговой марке фирмы. Когда будет подсчитан доверительный интервал, то можно будет, к примеру, сказать что с 95% долей вероятности доля потребителей, знающих о данной находится в диапазоне от 27% до 34%.

С этим термином тесно связана такая величина, как доверительная вероятность. Она представляет собой вероятность того, что искомый параметр входит в доверительный интервал. От этой величины зависит то, насколько большим окажется наш искомый диапазон. Чем большее значение она принимает, тем уже становится доверительный интервал, и наоборот. Обычно ее устанавливают равной 90%, 95% или 99%. Величина 95% наиболее популярна.

На данный показатель также оказывает влияние дисперсия наблюдений и Его определение основано на том предположении, что исследуемый признак подчиняется Это утверждение известно также как Закон Гаусса. Согласно ему, нормальным называется такое распределение всех вероятностей непрерывной случайной величины, которое можно описать плотностью вероятностей. Если предположение о нормальном распределении оказалось ошибочным, то оценка может оказаться неверной.

Сначала разберемся с тем, как вычислить доверительный интервал для Здесь возможны два случая. Дисперсия (степень разброса случайной величины) может быть известна либо нет. Если она известна, то наш доверительный интервал вычисляется с помощью следующей формулы:

хср - t*σ / (sqrt(n)) <= α <= хср + t*σ / (sqrt(n)), где

α - признак,

t - параметр из таблицы распределения Лапласа,

σ - квадратный корень дисперсии.

Если дисперсия неизвестна, то ее можно рассчитать, если нам известны все значения искомого признака. Для этого используется следующая формула:

σ2 = х2ср - (хср)2, где

х2ср - среднее значение квадратов исследуемого признака,

(хср)2 - квадрат данного признака.

Формула, по которой в этом случае рассчитывается доверительный интервал немного меняется:

хср - t*s / (sqrt(n)) <= α <= хср + t*s / (sqrt(n)), где

хср - выборочное среднее,

α - признак,

t - параметр, который находят с помощью таблицы распределения Стьюдента t = t(ɣ;n-1),

sqrt(n) - квадратный корень общего объема выборки,

s - квадратный корень дисперсии.

Рассмотри такой пример. Предположим, что по результатам 7 замеров была определена исследуемого признака, равная 30 и дисперсия выборки, равная 36. Нужно найти с вероятностью в 99% доверительный интервал, который содержит истинное значение измеряемого параметра.

Вначале определим чему равно t: t = t (0,99; 7-1) = 3.71. Используем приведенную выше формулу, получаем:

хср - t*s / (sqrt(n)) <= α <= хср + t*s / (sqrt(n))

30 - 3.71*36 / (sqrt(7)) <= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Доверительный интервал для дисперсии рассчитывается как в случае с известным средним, так и тогда, когда нет никаких данных о математическом ожидании, а известно лишь значение точечной несмещенной оценки дисперсии. Мы не будем приводить здесь формулы его расчета, так как они довольно сложные и при желании их всегда можно найти в сети.

Отметим лишь, что доверительный интервал удобно определять с помощью программы Excel или сетевого сервиса, который так и называется.

Анализ случайных погрешностей основывается на теории случайных ошибок, дающей возможность с определенной гарантией вычислить действительное значение измеренной величины и оценить возможные ошибки.

Основу теории случайных ошибок составляют следующие предположения:

при большом числе измерений случайные погрешности одинаковой величины, но разного знака встречаются одинаково часто;

большие погрешности встречаются реже, чем малые (вероятность появления погрешности уменьшается с ростом ее величины);

при бесконечно большом числе измерении истинное значение измеряемой величины равно среднеарифметическому значению всех результатов измерений;

появление того или иного результата измерения как случайного события описывается нормальным законом распределения.

На практике различают генеральную и выборочную совокупность измерений.

Под генеральной совокупностью подразумевают все множество возможных значений измерений или возможных значений погрешностей
.

Для выборочной совокупности число измерений ограничено, и в каждом конкретном случае строго определяется. Считают, что, если
, то среднее значение данной совокупности измеренийдостаточно приближается к его истинному значению.

1. Интервальная оценка с помощью доверительной вероятности

Для большой выборки и нормального закона распределения общей оценочной характеристикой измерения являются дисперсия
и коэффициент вариации:

;
. (1.1)

Дисперсия характеризует однородность измерения. Чем выше
, тем больше разброс измерений.

Коэффициент вариации характеризует изменчивость. Чем выше , тем больше изменчивость измерений относительно средних значений.

Для оценки достоверности результатов измерений вводятся в рассмотрение понятия доверительного интервала и доверительной вероятности.

Доверительным называется интервал значений , в который попадает истинное значение измеряемой величины с заданной вероятностью.

Доверительной вероятностью (достоверностью) измерения называется вероятность того, что истинное значение измеряемой величины попадает в данный доверительный интервал, т.е. в зону
. Эта величина определяется в долях единицы или в процентах

,

где
- интегральная функция Лапласа (табл.1.1 )

Интегральная функция Лапласа определяется следующим выражением:

.

Аргументом этой функции является гарантийный коэффициент :

Таблица 1.1

Интегральная функция Лапласа

Если же на основе определенных данных установлена доверительная вероятность (часто ее принимают равной
), то устанавливаетсяточность измерений (доверительный интервал
) на основе соотношения

.

Половина доверительного интервала равна

, (1.3)

где
- аргумент функции Лапласа, если
(табл.1.1 );

- функции Стьюдента, если
(табл.1.2 ).

Таким образом, доверительный интервал характеризует точность измерения данной выборки, а доверительная вероятность - достоверность измерения.

Пример

Выполнено
измерений прочности дорожного покрытия участка автомобильной дороги при среднем модуле упругости
и вычисленном значении среднеквадратического отклонения
.

Необходимо определить требуемую точность измерений для разных уровней доверительной вероятности
, приняв значения потабл.1.1 .

В этом случае соответственно |

Следовательно, для данного средства и метода измерений доверительный интервал возрастает примерно в раза, если увеличитьтолько на
.

Понравилась статья? Поделиться с друзьями: