Задание
8-2. Построить
гистограмму непрерывного распределения выборки V=100 (n=100), Хmin=5, X max=40,
h=5
Частичный
интервал
|
Частота
|
Gi= ni /n
|
5-10
|
4
|
0,8
|
10-15
|
6
|
1,2
|
15-20
|
16
|
3,2
|
20-25
|
36
|
7,2
|
25-30
|
24
|
4,8
|
30-35
|
10
|
2,0
|
35-40
|
4
|
0,8
|
Третий столбик
показывает отношение частоты к объему выборки, например:
G1= n1
/n=4:5=0,8;
G2= n2 /n=6:5=1,2 и т.д.
2.3. Выборка как набор
случайных величин.
Пусть имеется некоторая генеральная
совокупность, каждый объект которой наделен количественным признаком X. При случайном извлечении объекта из генеральной совокупности
становится известным значение xi признака Xi этого объекта. Таким образом, мы можем рассматривать извлечение
объекта из генеральной совокупности как испытание, Xi - как случайную величину, а хi - как одно из возможных значений X.
Допустим, что из теоретических соображений
удалось установить, к какому типу распределений относится признак X. Естественно, возникает задача оценки (приближенного нахождения)
параметров, которыми определяется это распределение. Например, если известно,
что изучаемый признак распределен в генеральной совокупности нормально, то
необходимо оценить, т. е. приближенно найти математическое ожидание и среднее
квадратическое отклонение, так как эти два параметра полностью определяют
нормальное распределение.
Обычно в распоряжении исследователя
имеются лишь данные выборки генеральной совокупности, например значения количественного
признака x1 х2
…xn полученные в результате п наблюдений
(здесь и далее наблюдения предлагаются независимыми). Через эти данные и выражают
оцениваемый параметр.
Опытные значения признака X можно рассматривать и как значения разных
случайных величин X1 Х2 .., Хn с тем же распределением, что и X, и, следовательно, с теми же числовыми характеристиками, которые
имеет X. Значит, М
(Хi) = М (X) и D (Xi;) = D (X). Величины
X1 Х2 .., Хn можно считать независимыми в силу
независимости наблюдений. Значения x1 х2 …xn в этом случае называются реализациями случайных величин Х1,
Х2, ..., Хп Отсюда и из предыдущего следует, что найти
оценку неизвестного параметра - это значит найти функцию от наблюдаемых случайных
величин X1 Х2 .. Хn, которая и дает приближенное значение
оцениваемого параметра.
3.
Числовые характеристики выборки
3.1. Характеристика положения. К таковым
характеристикам относятся все вопросы, касающиеся качественным показателям. В спортивной
метрологии разработаны на этот счет соответствующие специальные методы
количественной оценки качественных показателей. К ним относятся следующие
показатели, получаемые в процессе обработки данных: ранжирование данных среднее
арифметическое, медиана, мода. Рассмотрим отдельно каждый из этих показателей:
1. Ранжирование данных – расположение
полученных значений признака в порядке возрастания. Одинаковым числовым данным
присваиваются очередные последовательные
числа. Ранжированные данные представляются
в виде таблицы, в которой первый столбик – номера от 1 до n, второй столбик – значения признака.
2.Средне арифметическое (среднее, взвешенное
среднее). , Хср, хср. Вычисляется по
формуле: , где n- число данных,
хi –числовые
данные .
2. Медиана. Ме. В
ранжированных данных выбирается номер, находящийся посредине. Если такой номер
один, медиана равна значению признака, стоящего под соответствующим номером.
Если таковых номеров два, то берется среднее значение признаков, находящихся
под этими номерами. Срединный номер можно определить визуально или вычислить по
формуле:
Если полученное
число N - целое, то и есть срединный номер. Если число N- дробное, то срединных номеров два. Они непосредственно
содержат это дробное число.
3. Мода. Мо. Мода значение признака,
встречающееся наибольшее число раз. Если несколько признаков встречаются
одинаковое число раз, то берется среднее значение этих признаков. Если данные
сгруппированы по интервалам, интервал, содержащий Моду, называется модальным
интервалом.
Замечания. Вполне вероятно, что все
числовые данные окажутся различными, то в этом случае мода равна среднему
арифметическому всех значений. Среднее
значение, Медиана, Мода в общем случае не совпадают, но в частных случаях они
могут совпасть все или попарно. Это дает возможность делать ряд дополнительных
выводов и предположений по выборке.
2. Характеристика рассеивания. К таковым
характеристикам относится: размах вариации, дисперсия, стандартное (среднее
квадратичное) отклонение, коэффициент вариации.
4. Размах R, d,
Δ. Вычисляется по формуле R=Хmax - Xmin
5. Дисперсия.
δ2. Дисперсия – среднее значение квадратов отклонения каждого значения
признака и их среднего значения. Дисперсия вычисляется по формуле:
Таблица
1. Квадрат отклонения
|
№
|
Значение
признака
xi
|
Отклонение
Xi-Xср
|
Квадрат
отклонения
(Xi-Xср)2
|
1
|
|
|
|
2
|
|
|
|
…
|
|
|
|
n
|
|
|
|
Сумма
|
|
|
|
δ2=((х1-хср)2+
(х2-хср)2+ (х3-хср)2+….+
(хn-хср)2)/n
Для вычисления дисперсии рекомендуется построить
таблицу 1, которая можно получить из таблицы
ранжированных значений, добавив к ней
третий и четвертый столбики. В
третьем столбике записываются отклонения соответствующих значений от среднего,
в четвертом столбике – квадраты отклонений. Суммируются значения второго и
четвертого столбиков
6. Среднее квадратичное отклонение σ. Вычисляется по формуле:
7. Коэффициент вариации V. Вычисляется по формуле V=·100%
|