рефераты

рефераты

 
 
рефераты рефераты

Меню

Реферат: Статистика рефераты

Рассчитываем среднюю по новым вариантам: .

Пользуясь свойствами средней переходим от условного   к фактической средней величине  .

5. Степенные средние.

Средняя арифметическая величина является частным случаем, который называется степенной средней.

 - для несгруппированных данных;

 - для сгруппированных данных.

Последовательно придавая  k дискретное значение 0, 1, 2, 3, … и т.д. получим различные виды средних.

Если k=-1 степенные средние приобретают вид средней гармонической.

 - для несгруппированных данных;

 - для сгруппированных данных.

Пример: В течение рабочей смены 3 рабочих изготовляли детали. 1й рабочий затрачивая на изготовление 1 детали – 6 мин., 2й – 8 мин., 3й – 7,5 мин. Определить средние затраты времени на изготовление 1 детали.

Среднюю арифметическую взвешенную нельзя использовать для расчета, так как каждый из рабочих изготавливал за смену разное количество деталей. В числителе формулы отражается количество человеко-силы, а в знаменателе условное количество деталей, изготавливаемых за смену.

Пример: Продавец в течении нескольких дней продавал на рынке морковь. В первые 4 дня цена составляла 6 руб./кг, в последние 5 дней  цена поднялась до 7 руб., а оставшаяся морковь была продана за 4,50 руб./кг. Поскольку данные о товарообороте отсутствуют, то для решения задачи применяется средняя гармоническая взвешенная:

При этом число дней продаж моркови по различным ценам рассматривается как показатель условного товарооборота.

Средняя гармоническая применяется в тех случаях, когда частоты ряда выражены в неявном виде.

Если величина k=0, то степенная средняя приобретает вид средней геометрической.

 для несгруппированных данных;

 для сгруппированных данных.

Средняя геометрическая применяется в тех случаях, когда отдельные варианты ряда резко отличаются от остальных.

Наиболее часто формулу средней геометрической используют для определения средних валютных курсов, эффективности валютных курсов, реальной эффективности валютных курсов (международная финансовая статистика).

Если k=1 степенная средняя принимает вид средней арифметической, взвешенной и невзвешенной.

Если k=2, средняя квадрата.

 для несгруппированных данных;

 - для сгруппированных данных.

Результаты статистического исследования зависят от того, насколько верно избран вид средней. Расчет средних, выполненных на основе одних и тех же данных разными способами дает различные результаты.

В курсе математической статистики доказано, что чем ниже степень средней, тем меньше ее величина. Это называется правилом мажорантности средней.

k -1 0 1 2

Доказано так же, что чем интенсивней колеблются значения вариантов ряда, тем больше разница между ними.

6. Мода и процентили.

Наряду со средними для характеристики распределения применяют такие показатели как мода и процентили, которые дополняют характеристику (обобщающую) и позволяют сравнивать между собой и находить различия в рядах с одинаковыми средними.

Мода – это наиболее часто встречающийся вариант ряда.

В дискретных рядах распределения модой является вариант, имеющий максимальную частотную характеристику.

В интервальных рядах мода определяется в два этапа. В начале определяется интервал, содержащий моду (модальный интервал), а затем рассчитывается значение моды по формуле:

, где  - нижняя граница модального интервала, i – величина этого интервала, , ,  - частоты модального, предшествующего ему и следующего за ним интервалов.

Для последней таблицы (данные о выработке рабочих токарей):

Медиана (вид процентиля),  который занимает серединное положение в ряду распределения. Медиана определяется по формуле:

, где  - нижняя граница интервала, содержащего медиану (интервал определяется по накопленной частоте, первой превышающей 50% суммы частот (в дальнейшем для квартилей, децилей – 25%, 75%, 0,1%, 0,2% и т.д.)), i – величина этого интервала,  - номер медианы,  - накопленная частота интервала, предшествующего медиане,  - частота медианного интервала.

Поскольку медиана разновидность процентиля то данная формула носит универсальный характер, она может применяться для определения квартилей (Q) и децилей (d).

Квартили (четверти) отсекают от совокупности соответственно 25%, 50% и 75%.

Децили отсекают от совокупности соответственно 10%, 20%, 30% и т.д.

На первом этапе определяется номер процентиля по формуле:

 - для ряда четным числом единиц;

 - с нечетным числом единиц.

 - номер процентиля (порядковый),  - индекс процентиля (выражается десятичной дробью) (), N – численность совокупности.

Расчет моды и процентилей

на примере группировки магазинов по сумме товарооборота.

Группы магазинов

с торговой площадью,

кв. м

Число

магазинов,

Накопленная

частота,

До 100 6 6
100-200 12 18
200-300 27 45
300-400 13 58
400-500 8 66
Свыше 500 5 71
Итого 71

Накопленная частота – это сумма частот данного и всех предшествующих ему интервалов.

Четверть всех магазинов имеет площадь менее 200 кв. метров, а остальные 75% более 200 кв. метров.

Три четверти магазинов имеют торговые площади не превышающие 369,2 кв. метров, остальные больше.

Показатели вариации.

1.   Понятие вариации и роль ее изучения в статистических исследованиях.

2.   Измерители вариации.

3.   Прямой способ расчета показателей вариации.

4.   Свойства дисперсии и среднего квадратического отклонения.

5.   Упрощенный способ расчета дисперсии и средне квадратического отклонения.

6.   Относительные показатели вариации.

7.   Стандартизация данных.

8.   Моменты распределения.

9.   Показатели асимметрии и эксцесса.

10.         Средняя арифметическая и дисперсия альтернативного признака.

1. Понятие вариации и роль ее изучения в статистических исследованиях.

Вариация – это колеблемость значений признака у отдельных единиц совокупности.

Наличию вариации обязана своим появлением статистика. Большинство статистических закономерностей проявляется через вариацию. Изучая вариацию значений признака в сочетании с его частотными характеристиками, мы обнаруживаем закономерности распределения (например: население по возрасту, студентов по уровню оценок).

Рассматривая вариацию одного признака параллельно с изменением другого, мы обнаруживаем взаимосвязи между этими признаками или их отсутствие (например: зависимость между торговой площадью и товарооборотом).

Вариации в статистике проявляются двояко, либо через изменения значений признака у отдельных единиц совокупности, либо через наличие или отсутствие изучаемого признака у отдельных единиц совокупности.

Изучение вариации в статистике имеет как самостоятельную цель, так и является промежуточным этапом более сложных статистических исследований.

2. Измерители вариации.

Простейшим показателем вариации является размах колебаний: .

Достоинство этого показателя простота расчета, возможность использования для оценки вариации однородных совокупностей. Недостаток – неприемлемость для неоднородных совокупностей с редкими выбросами крайних значений признака.

Частично недостатки этого показателя устраняет межквартельный размах: .  Однако, он характеризует вариацию только половины совокупности.

Для учета колеблемости всех значений признака применяют показатели среднего линейного отклонения, дисперсии и средне квадратического отклонения.

Средне линейное отклонение – среднее значение отклонений всех вариантов ряда от средней арифметической (иногда от моды или медианы):

 - для несгруппированных данных;

 - для сгруппированных данных.

    

Аналогичным по смыслу среднему линейному отклонению является показатель дисперсии и рассчитываемый на его основе показатель средне квадратического отклонения.

Дисперсия – рассеивание, данный показатель характеризует рассеивание значений признака относительно его средней величины.

  - для несгруппированных данных;

 - для сгруппированных данных.

Дисперсия – средне квадратическое отклонение всех вариантов ряда от средней арифметической. Если извлечь квадратный корень из дисперсии, получим средне квадратическое отклонение.

 - для несгруппированных данных;

 - для сгруппированных данных.

Несмотря на логическое сходство, дисперсия является более чувствительной к вариации и, следовательно, чаще применяемый показатель.

3. Прямой способ расчета показателей вариации.

Расчет показателей вариации заработной платы работников завода.

Группы со среднемесячной з/п, руб.

Число раб-в,

До 1500 30 750 22500 1909,09 57272,7 3644628 109338843
1501-3000 75 2250 168750 409,09 30681,8 167355 12551653
3001-4500 45 3750 168750 1090,91 49090,9 1190083 53553719
Свыше 4501 15 5250 78750 2590,91 38863,6 6712810 100692149
Итого 165 438750 175909 276136364

Заработная плата каждого из работников в среднем отклоняется от средне заработной платы на 1066,12 руб.

Средне квадратическое отклонение  заметно больше, чем аналогичный ему по смыслу среднее линейное отклонение.

4. Свойства дисперсии и среднего квадратического отклонения.

Так же как и средняя дисперсия обладает рядом свойств, имеющих важное значение для понимания сущности этого показателя, методологии его расчета и практического использования для разработки более совершенных статистических методов.

Свойства дисперсии и средне квадратическое отклонение:

1)   Если все варианты ряда уменьшить или увеличить на постоянное число, то величина дисперсии и средне квадратического отклонения не изменится. ;

2)   Если все варианты ряда умножить или разделить на постоянное число, дисперсия соответственно увеличится или уменьшится в квадрат этого числа раз, а средне квадратическое отклонение в это число раз. ;

3)   Если частоты ряда уменьшить или  увеличить в постоянное число раз, то дисперсия и средне квадратическое отклонение от этого не изменится;

4)   Дисперсия равна среднему квадрату вариантов ряда минус квадрат средней арифметической. ;

Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12