Ваш репетитор, справочник и друг!

Ваш репетитор, справочник и друг!

Математическая статистика – краткий курс для начинающих



6. Группировка данных


Этот элементарный материал я хотел включить в первую главу, но он там оказался «не в тему», поскольку сам открывает большую тему :)

Рассмотрим некоторую статистическую совокупность, например, множество студентов ВУЗа. Очевидно, данное множество можно исследовать как единое целое – подсчитать общее количество студентов, вычислить их средний возраст, среднюю успеваемость и другие показатели. Благо, статистических данных – море. Но всё это общие характеристики. А хотелось бы деталей. И в таких случаях совокупность целесообразно разделить на группы, то есть выполнить группировку.

Группировка – это разделение статистической совокупности (не важно, генеральной или выборочной) на группы по одному или бОльшему количеству признаков. И разделить её можно по-разному –

6.1. Основные виды группировок

– во-первых, выделить качественно однородные группы. Например, разбить студентов ВУЗа на лиц М и Ж пола и есть ещё ныне модный пункт «не определился» (для кого это важно). Такую группировку называют типологической. Или, как вы любите говорить, «типа логической» :) Кстати, студенты уже по факту разделены на факультеты – и это тоже пример типологической группировки, но уже по другому признаку. Итак:

типологическая группировка – это разделение неоднородной статистической совокупности на качественно однородные группы.

Само собой, полученные группы исследуются по отдельности и сравниваются – как между собой, так и с общими показателями. При этом проводится структурная группировка – это разделение качественно однородной совокупности по какому-либо вариационному признаку. По росту, весу, уровню IQ, скорости движения, периоду полураспада и так далее. Признаков – тьма. 

Да будет свет! – в качестве простейшего условного примера рассмотрим среднюю успеваемость студентов ВУЗа:  (общая средняя). Однако это не слишком информативный показатель.

Гораздо интереснее провести типологическую группировку, например, разделить всех студентов на «физиков» и «лириков», и подсчитать групповые средние: . Ну вот, теперь прекрасно видно, кому в универе жить хорошо :) Или рассчитать групповые средние по факультетам: . И выяснить, почему это на 2-м факультете такая низкая успеваемость по сравнению со средней успеваемостью  по ВУЗу.

Довольно часто грань между типологической и структурной группировкой стирается. Приведу избитый, но показательный пример с банками. Все банки можно разделить на мелкие, средние и крупные (типологическая группировка). Но с другой стороны, эти категории основаны на количественном показателе, мелкие – меньше одного литра, средние – от одного до трёх, и крупные – больше трёх литров. То есть, это одновременно и структурная группировка. Эксперты центробанки гарантируют :)

Помимо перечисленных, существуют и другие виды группировок, в частности, аналитическая группировка и комбинационная группировка. Но о них позже, после практической разминки.

Ранее мы уже неоднократно проводили группировку данных, давайте вспомним пару примеров:

Пример 4

По результатам выборочного исследования рабочих цеха были установлены их квалификационные разряды: 4, 5, 6, 4, 4, 2, 3, 5, 4, 4, 5, 2, 3, 3, 4, 5, 5, 2, 3, 6, 5, 4, 6, 4, 3.

В этой задаче дана однородная совокупность – рабочие цеха, и нами была проведена их структурная группировка по разряду, в результате чего нарисовался дискретный вариационный ряд:

где  – разряды, а  – количество рабочих того или иного разряда

Пример 6

По результатам исследования цены некоторого товара в различных торговых точках города, получены следующие данные (в некоторых денежных единицах):


В этом примере мы тоже провели структурную группировку (товаров по их цене) и получили интервальный вариационный ряд:

где  – количество товаров из того или иного ценового интервала.

И сейчас мы продолжим группировать данные. В предположении того, что студент сможет разделить собак и котов (типологическая группировка), ему обычно предлагают провести структурную и / или аналитическую группировку. Разберём их по порядку.

6.2. Структурная группировка

5.8. Статистические гипотезы (итоги по главе)

| Оглавление |




  © mathprofi.ru - mathter.pro, 2010-2022, сделано в Блокноте.