2.1. Генеральная и
выборочная средние.
При обработке данных могут
быть рассмотренными средние показатели, которые могут быть генеральными или выборочными
средними значениями.
Пусть изучается дискретная
генеральная совокупность объема N относительно количественного признака X.
Генеральной
средней хсред (или а) называется среднее арифметическое значений признака
генеральной совокупности.
Если все значения x1 x2, ..., хп признака генеральной совокупности
объема N различны, то
Как уже отмечалось ранее, извлечение
объекта из генеральной совокупности есть наблюдение случайной величины X.
Пусть все значения xit xz, ..., хп различны. Так как каждый объект может
быть извлечен с одной и той же вероятностью 1 / N, то
Такой же итог следует, если значения x1t x2, ..., хk имеют соответственно частоты ni, N1, N2, …Nk
В случае непрерывного распределения
признака X полагают xсред = М (X).
Пусть для изучения генеральной
совокупности относительно количественного признака X произведена выборка объема п.
Выборочной средней называется среднее арифметическое значений признака выборочной
совокупности.
Если все значения x1 x2, ..., хп признака выборки объема п различны,
то
или
Задание
8-3. Выборочным путем
были получены следующие данные о массе 20 яблок (в г): 30, 30, 25, 32,
30,25,33,32,29, 28, 27, 36, 31, 34, 30, 23.28. 31. ЯВ. ЯП. Найти выборочную
среднюю величину .
Решение:
Ответ
Ниже, не уменьшая общности рассуждений,
будем считать значения x1 x2, ..., хп признака различными.
Выборочная средняя для различных выборок
того же объема п из той же генеральной совокупности будет получаться,
вообще говоря, различной. И это не удивительно - ведь извлечение 1- го по
счету объекта есть наблюдение случайной величины Xt, а их среднее арифметическое
есть тоже
случайная величина.
Таким образом, всевозможные могущие
получиться выборочные средние есть возможные значения случайной величины X, которая называется выборочной средней
случайной величиной.
Найдем М (),
пользуясь тем, что М (Xi) = М (X).
С учетом свойств МО получаем:
Итак, М(Х) (МО выборочной средней)
совпадает с а (генеральной средней).
Найдем D (X). Так как D (Хi) = D (X) и X1 X2 … Х„ независимы, то согласно свойствам дисперсии получаем:
Если варианта хi большие числа, то для облегчения вычисления
выборочной средней применяют следующий прием. Пусть С - константа.
Так
как
то:
Константу С (так называемый ложный
нуль) берут такой, чтобы, разности xi - С были небольшими и число С было
"круглым", а именно, оканчивалось нулями.
Задание 8-4. Для заданной выборки найти
выборочную среднюю величину.
Решение. Берем ложный ноль С - 72,00 и вычисляем
разности: ai= xi - С
а1 + а2 + … + a10 = -0,38; среднее арифметическое: - =-038: 10 = -0,038» - 0,04.
Выборочная средняя равна разности между
ложным нулем и найденным средним значением:
3.2.
Генеральная и выборочная дисперсии.
Для того чтобы охарактеризовать рассеяние
значений количественного признака X генеральной совокупности вокруг своего среднего значения,
вводят следующую характеристику - генеральную дисперсию.
Генеральной
дисперсией Dr называется среднее арифметическое
квадратов отклонений значений признака X генеральной совокупности от генеральной
средней хг.
Если все значения x1 х2, ..., xN признака генеральной совокупности объема N различны, то
Если же значения признака хг,
х2, ..., xk имеют соответственно частоты N1, N2 … Nk причем
ni + N2 + ... + Nk = N, то
Задание
8-5. Найти генеральную
дисперсию для генеральной совокупности, заданной таблицей распределения:
Решение.
Генеральным средним квадратическим отклонением (стандартом)
называется s =
Пусть все значения x1 х2, ..., xN различны.
Найдем дисперсию признака X, рассматриваемого как случайную
величину:
Таким образом, дисперсия D (X) равна Dr.
Такой же итог следует, если значения x1 х2, ..., xk имеют соответственно частоты N1t N2, ..." Nk.
В случае непрерывного распределения
признака X по
определению полагают:
Эту формулу можно записать в виде:
откуда или
Величина
называется средней квадратической ошибкой.
Для того чтобы охарактеризовать рассеяние
наблюдаемых значений количественного признака выборки вокруг своего
значения вводят выборочную дисперсию.
Выборочной
дисперсией DB называется среднее арифметическое квадратов отклонений наблюдаемых значений признака X от выборочной средней .
Если все значения x1 x2, ..., хп признака выборки объема п различны,
то
Если же значения признака x1 x2, ..., хk имеют соответственно частоты n1 n2…nk, причем n1 +n2+…+nk,= n, то
Выборочным средним
квадратическим отклонением
(стандартным отклонением) называется квадратный корень из выборочной
дисперсии:
|