2.2. Способы представления и обработки статистических
данных
Исследуемая
статистическая совокупность в оптимальном варианте должно иметь от 30 до 200 данных.
Большее число данных требует больших усилий при их
обработке, меньшее их число не всегда дает достоверные результаты для анализа.
При испытаниях
(тестировании, соревнованиях) статические данные, как правило, поступают в
произвольном, случайном порядке. Поэтому возникает необходимость эти данные
каким-то образом систематизировать, обработать., получить некоторые результаты.
которые можно было бы анализировать, сопоставлять и др.
В статистике разработано несколько способов
представления и обработки данных. Все они направлены на то, чтобы получить результаты обработки с
требуемой точностью и достоверностью. Если число данных велико, то возникает
вопрос, нельзя ли их число уменьшить, сжать. Причем это не должно повлиять на
численные значения результатов обработки и не привести к спорным или не верным
выводам.
К наиболее популярным методам обработки и
представления статистических данных выделим следующие:
1. Метод средних величин. Он заключается в получении некоторых средних
показателей, которые позволяют анализировать статистические данные.
2. Интервальный способ. Он основан на разбиении
исходных численных значений на интервалы
3. Графический способ. Он предназначен для
представления некоторых исходных и полученных результатов обработки данных в
виде графика, гистограммы на координатной плоскости.
Пусть из генеральной совокупности
извлечена выборка, объем которой равен n, которая изучается по нескольким
однородным признакам. Признаками может служить любой численный параметр объекта: масса, объем, скорость перемещения и
др.
Если некоторый признак xl из совокупности однородных признаков наблюдалось п1 раз, признак х2
- п2 раз, и т.д., то п1+п2
+ ... = п - объем
выборки.
Наблюдаемое
значение признака называются
вариантой – одно из наблюдаемых
значений х1, x2, … x k.
Вариационный
ряд - последовательность
вариант, записанная в возрастающем порядке.
Частота -
числа наблюдений п1,
п2, ... nk
Относительные частоты - отношение соответствующей частоты п1, п2,
... nk к объему их выборки n. Причем сумма всех относительных частот
равна единице:
Статистическим
распределением выборки
называют перечень вариант и соответствующих им частот или относительных частот.
Статистическое распределение можно задать
также в виде последовательности интервалов и соответствующих им частот
(непрерывное распределение). В качестве частоты, соответствующей интервалу,
принимают сумму частот вариант, попавших в этот интервал.
В теории вероятностей под распределением
понимают соответствие между возможными значениями случайной величины и их
вероятностями, а в математической статистике - соответствие между наблюдаемыми
вариантами и их частотами, или относительными частотами.
Задание
8-1.
Варианта xt
|
2
|
6
|
12
|
Относительная частота рi
|
0,15
|
0,50
|
0,35
|
Варианта xt
|
1
|
2
|
3
|
5
|
Относительная
|
|
|
|
|
частота р*
|
0,4
|
0,2
|
0,3
|
0,1
|
1. Перейти от частот к относительным частотам
в следующем распределении выборки объема п. = 20:
Найдем относительные частоты:
2. Распределение, представлено
таблицей. Построить полигон
Для графического изображения статистического
распределения используются полигоны и гистограммы.
Для построения полигона на оси Ох откладывают
значения вариант xt, на оси Оу - значения частот рi (относительных частот),
Полигоном обычно пользуются в случае
небольшого количества вариант. В случае большого количества вариант и в случае
непрерывного распределения признака чаще строят гистограммы. Для этого
интервал, в котором заключены все наблюдаемые значения признака, разбивают на
несколько частичных интервалов длиной h и находят для каждого частичного интервала
nL - сумму
частот вариант, попавших в i интервал. Затем на этих интервалах, как на основаниях, строят прямоугольники
с высотами g=ni /n. Площадь i-го
частичного прямоугольника
равна hni/ h=ni. Следовательно, площадь гистограммы равна
сумме всех частот т. е. объему выборки.
Возможет второй вариант построения гистограмм, когда площадь
i-го частичного прямоугольника равна ni / nh и площадь
гистограммы равна сумме всех относительных
частот или единице.
|