Ваш репетитор, справочник и друг! Математическая статистика – краткий курс для начинающих |
6.3. Перегруппировка– это вторичная группировка, которая состоит в преобразовании уже построенного вариационного
ряда. И одним из инструментов перегруппировки является укрупнение интервалов. В примере выше можно просто объединить
три последних интервала, и коль скоро нам известны первичные (исходные) данные, то заодно подкорректируем границы всех
интервалов до удобных значений: Но что делать, если первичные данные не известны? Пример 40 Перегруппируйте данные о численности работающих на 55 предприятиях, образовав следующие группы: до 400, 400-1000,
1000-3000, 3000-6000, свыше 6000: В этой задаче мы не знаем исходные варианты (конкретную численность рабочих по предприятиям), но решение есть! Держите исходную таблицу перед глазами (распечатайте или перепишите на листок) и ВНИМАТЕЛЬНО вникайте в суть: 1) Выделим новый промежуток «до 400» (красный цвет на рисунке ниже). В него, понятно, войдёт
интервал «до 100» (4 предприятия) и часть интервала «100-500», а именно часть, выделенная коричневым цветом: Теперь длину коричневой части нужно сопоставить с длиной всего интервала «100-500», которая
составляет : …Вроде всё просто, а объяснить довольно сложно :) Соответственно, на кусок «400-500» останется предприятия. Выражаясь академично, этот принцип можно называть выделением пропорциональных долей. Доли выделяются пропорционально длинам частей интервала 2) Выделим новый промежуток «400-1000». В него войдёт оставшийся старый «кусок» «400-500» с 2
предприятиями и старый интервал «500-1000» с 5 предприятиями: Итого на промежутке «400-1000» оказалось предприятий. 3) Выделим новый промежуток «1000-3000». В него полностью войдёт старый интервал «1000-2000» с 14
предприятиями и одна треть старого интервала с «2000-5000» с предприятиями: Одна пятая найдена как отношение длины коричневого интервала «5000-6000» к длине интервала
«5000-10000»: 5) И, наконец, в последний новый промежуток «свыше 6000» входят четыре пятых старого интервала «5000-10000» (см. рис. выше) или предприятия, а также 3 предприятия старого интервала «10000-20000» и 1 предприятие интервала «свыше 20000». Итого: предприятий Перегруппировка завершена, новый вариационный ряд построен: И обязательно проконтролируем объем выборки, мало ли что-то потерялось или мы где-то
обсчитались: Следует отметить, что метод выделения долей, строго говоря, не точен, и если в нашем распоряжении есть первичные данные, то, конечно, ориентируемся на них – в результате с высокой вероятностью получатся немного другие частоты по группам. Но для выборочной совокупности годится и долевая перегруппировка, поскольку от выборки к выборке мы всё равно будем получать разные значения и строить похожие, но всё же разные вариационные ряды. Перегруппировка часто применятся для того чтобы сопоставить «родственные» совокупности с разными интервалами: Пример 41 По результатам выборочного исследования двух банок банков получены данные о заработной плате их служащих: И для удобства есть традиционный эксель-шаблон, не ленимся! Если трудно, то можно использовать рисунки с разметкой интервалов (по образцу предыдущего примера); в образце я ограничился аналитическим решением. Расширяем поле деятельности: 6.4. Аналитическая группировка |
|