Ваш репетитор, справочник и друг!

Ваш репетитор, справочник и друг!

Математическая статистика – краткий курс для начинающих



6.3. Перегруппировка


– это вторичная группировка, которая состоит в преобразовании уже построенного вариационного ряда. И одним из инструментов перегруппировки является укрупнение интервалов. В примере выше можно просто объединить три последних интервала, и коль скоро нам известны первичные (исходные) данные, то заодно подкорректируем границы всех интервалов до удобных значений:

Не так, конечно, получилось подробно, как в равнонаполненной группировке, но тоже вполне наглядно. При желании, к слову, первый интервал легко измельчить, получив нечто близкое или даже совпадающее с этой группировкой. Благо, исходные числа в нашем распоряжении.

Но что делать, если первичные данные не известны?

Пример 40

Перегруппируйте данные о численности работа­ющих на 55 предприятиях, образовав следующие группы: до 400, 400-1000, 1000-3000, 3000-6000, свыше 6000:
рисунок_85

В этой задаче мы не знаем исходные варианты (конкретную численность рабочих по предприятиям), но решение есть! Держите исходную таблицу перед глазами (распечатайте или перепишите на листок) и ВНИМАТЕЛЬНО вникайте в суть:

1) Выделим новый промежуток «до 400» (красный цвет на рисунке ниже). В него, понятно, войдёт интервал «до 100» (4 предприятия) и часть интервала «100-500», а именно часть, выделенная коричневым цветом:

Теперь длину коричневой части  нужно сопоставить с длиной всего интервала «100-500», которая составляет :
 – таким образом, три четверти предприятий интервала «100-500» следует отнести в пользу промежутка «до 400»: .
Итого в промежутке «до 400» оказывается  предприятий.

…Вроде всё просто, а объяснить довольно сложно :) Соответственно, на кусок «400-500» останется  предприятия. Выражаясь академично, этот принцип можно называть выделением пропорциональных долей. Доли выделяются пропорционально длинам частей интервала

2) Выделим новый промежуток «400-1000». В него войдёт оставшийся старый «кусок» «400-500» с 2 предприятиями и старый интервал «500-1000» с  5 предприятиями:

Итого на промежутке «400-1000» оказалось  предприятий.

3) Выделим новый промежуток «1000-3000». В него полностью войдёт старый интервал «1000-2000» с 14 предприятиями и одна треть старого интервала с «2000-5000» с  предприятиями:

Нужную долю (одну треть) мы нашли как отношение длины коричневого интервала  к длине интервала «2000-5000» :

Таким образом, в промежуток «1000-3000» вошло:
 предприятий.
4) В новый промежуток «3000-6000» входят две трети старого интервала «2000-5000» (см. рис. выше), что составляет  предприятий (или ), и, кроме того, одна пятая старого интервала «5000-10000», к которой относится   предприятие:

Одна пятая найдена как отношение длины коричневого интервала «5000-6000» к длине интервала «5000-10000»:
Таким образом, в промежуток «3000-6000» вошло  предприятий.

5) И, наконец, в последний новый промежуток «свыше 6000» входят четыре пятых старого интервала «5000-10000» (см. рис. выше) или  предприятия, а также 3 предприятия старого интервала «10000-20000» и 1 предприятие интервала «свыше 20000».

Итого:  предприятий

Перегруппировка завершена, новый вариационный ряд построен:

И обязательно проконтролируем объем выборки, мало ли что-то потерялось или мы где-то обсчитались:
, в чём и требовалось убедиться.

Следует отметить, что метод выделения долей, строго говоря, не точен, и если в нашем распоряжении есть первичные данные, то, конечно, ориентируемся на них – в результате с высокой вероятностью получатся немного другие частоты по группам. Но для выборочной совокупности годится и долевая перегруппировка, поскольку от выборки к выборке мы всё равно будем получать разные значения и строить похожие, но всё же разные вариационные ряды.

Перегруппировка часто применятся для того чтобы сопоставить «родственные»  совокупности с разными интервалами:

Пример 41

По результатам выборочного исследования двух банок банков получены данные о заработной плате их служащих:

Сравнить уровень з/п в банках, выделив интервалы: до 500, 500-1000, 1000-2000, 2000-3000, 3000-4000, 4000-5000, свыше 5000, и рассчитав относительные частоты по каждому банку. Результаты представить в виде общей таблицы, сделать выводы.

И для удобства есть традиционный эксель-шаблон, не ленимся! Если трудно, то можно использовать рисунки с разметкой интервалов (по образцу предыдущего примера); в образце я ограничился аналитическим решением. Расширяем поле деятельности:

6.4. Аналитическая группировка

6.2. Структурная группировка

| Оглавление |




  © mathprofi.ru - mathter.pro, 2010-2022, сделано в Блокноте.