Ваш репетитор, справочник и друг!
|
6. Группировка данныхЭтот элементарный материал я хотел включить в первую главу, но он там оказался «не в тему», поскольку сам открывает большую тему :) Рассмотрим некоторую статистическую совокупность, например, множество студентов ВУЗа. Очевидно, данное множество можно исследовать как единое целое – подсчитать общее количество студентов, вычислить их средний возраст, среднюю успеваемость и другие показатели. Благо, статистических данных – море. Но всё это общие характеристики. А хотелось бы деталей. И в таких случаях совокупность целесообразно разделить на группы, то есть выполнить группировку. Группировка – это разделение статистической совокупности (не важно, генеральной или выборочной) на группы по одному или бОльшему количеству признаков. И разделить её можно по-разному – 6.1. Основные виды группировок– во-первых, выделить качественно однородные группы. Например, разбить студентов ВУЗа на лиц М и Ж пола и есть ещё ныне модный пункт «не определился» (для кого это важно). Такую группировку называют типологической. Или, как вы любите говорить, «типа логической» :) Кстати, студенты уже по факту разделены на факультеты – и это тоже пример типологической группировки, но уже по другому признаку. Итак: типологическая группировка – это разделение неоднородной статистической совокупности на качественно однородные группы. Само собой, полученные группы исследуются по отдельности и сравниваются – как между собой, так и с общими показателями. При этом проводится структурная группировка – это разделение качественно однородной совокупности по какому-либо вариационному признаку. По росту, весу, уровню IQ, скорости движения, периоду полураспада и так далее. Признаков – тьма. Да будет свет! – в качестве простейшего условного примера рассмотрим среднюю успеваемость студентов ВУЗа: Гораздо интереснее провести типологическую группировку, например, разделить всех студентов на «физиков» и «лириков», и подсчитать групповые средние: Довольно часто грань между типологической и структурной группировкой стирается. Приведу избитый, но показательный пример с банками. Все банки можно разделить на мелкие, средние и крупные (типологическая группировка). Но с другой стороны, эти категории основаны на количественном показателе, мелкие – меньше одного литра, средние – от одного до трёх, и крупные – больше трёх литров. То есть, это одновременно и структурная группировка. Эксперты центробанки гарантируют :) Помимо перечисленных, существуют и другие виды группировок, в частности, аналитическая группировка и комбинационная группировка. Но о них позже, после практической разминки. Ранее мы уже неоднократно проводили группировку данных, давайте вспомним пару примеров: Пример 4 По результатам выборочного исследования рабочих цеха были установлены их квалификационные разряды: 4, 5, 6, 4, 4, 2, 3, 5, 4, 4, 5, 2, 3, 3, 4, 5, 5, 2, 3, 6, 5, 4, 6, 4, 3. Пример 6 По результатам исследования цены некоторого товара в различных торговых точках города, получены следующие данные (в некоторых денежных единицах): И сейчас мы продолжим группировать данные. В предположении того, что студент сможет разделить собак и котов (типологическая группировка), ему обычно предлагают провести структурную и / или аналитическую группировку. Разберём их по порядку.
|
|