Что такое findslide.org?

FindSlide.org - это сайт презентаций, докладов, шаблонов в формате PowerPoint.


Для правообладателей

Обратная связь

Email: Нажмите что бы посмотреть 

Яндекс.Метрика

Презентация на тему Обработка данных статистических наблюдений

Содержание

Обработка данных статистических наблюдений включает:Статистическую сводку;Группировку;Ряды распределения;Кластерный анализ.Обработка данных статистических наблюдений
СТАТИСТИКА I  (теория статистики)Часть 3. Обработка данных статистических наблюденийКафедра Маркетинга и менеджмента (ММ)Бесплатные презентацииhttp://prezentacija.biz/ Обработка данных статистических наблюдений включает:Статистическую сводку;Группировку;Ряды распределения;Кластерный анализ.Обработка данных статистических наблюдений 3.1 Статистическая сводка 3.2 Группировка 3.2 ГруппировкаРавныеНеравныеСпециализированныеПроизвольные прогрессивно возрастающие и убывающие 3.2 Группировка 3.2 ГруппировкаМетод группировки позволяет решить три задачи (разграничение условное, одна группировка может Таблица 1. Типологическая группировка Группировка полиграфических предприятий одного из городов по формам собственности Таблица 2. Структурная группировка Группировка населения России по размеру среднедушевого дохода (условные цифры) Таблица 3. Аналитическая группировка Группировка продолжительности договорных связей книжного магазина и качества продукции 3.2 Группировка Методы определения числа групп, интервалов группировокПосле определения основания группировки следует решить вопрос Таблица 4. Простая статистическая таблица Данные по з/п водителей за сентябрь Таблица 5. Групповая статистическая таблица Данные по з/п водителей за сентябрь в Таблица 6. Комбинационная статистическая таблица Зависимость з\п водителей от квалификации  и процента выполнения задания При составлении таблиц необходимо соблюдать общие правила:таблица должна быть легко 3.3 Ряды распределения Таблица 7. Атрибутивный ряд распределения Распределение строительных организаций РФ по формам собственности Таблица 8. Дискретный вариационный ряд Распределение рабочих предприятия по тарифному разряду Таблица 9. Интервальный вариационный ряд Распределение сотрудников по уровню доходов 1.ПОЛИГОН распределения (разновидность статистических ломаных) – для изображения дискретных вариационных рядов (табл.8). 2. ГИСТОГРАММА частот – для изображения интервальных вариационных рядов (табл.9). 3. КУМУЛЯТА (ОГИВА) – для изображения вариационных рядов (табл.9). Разница только в расположении осей. ОГИВА 3.4 Кластерный анализcluster – означает скопление, группу элементов, обладающих общими свойствами.Кластерный анализ Кластеризация – это процесс разбиения множества объектов на кластеры. Слева изображены объекты Критерий кластеризации в той или иной мере отражает следующие неформальные требования:• внутри Кластер – это множество объектов, близких между собой по некоторой мере сходства. Наиболее доступно для восприятия и понимания в случае количественных признаков так называемое правила объединения или связи Дендрограмма – графическое изображение результатов процесса последовательной кластеризации, которая осуществляется в терминах Пример для двух переменных и шести наблюдений. Рассчитываем расстояния между объектами*: d = [ (2 – 4)2 + (8 Матрица расстояний: Определяем пару объектов, расположенных наиболее близко друг к другу (в наше примере Далее процедура повторяется: к 4 и 5 объектам добавляется объект 6 и возникает новая матрица. Далее, ближайшее расстояние между 1 и 2 объектами, появляется новая группа 1-2. Далее объект 3 присоединяется к группе 1-2, как к ближайшей. Выявились два 4-5 с min расстоянием 2;4-5-6 с min расстоянием 2,23;1-2 с min расстоянием
Слайды презентации

Слайд 2 Обработка данных статистических наблюдений включает:
Статистическую сводку;
Группировку;
Ряды распределения;
Кластерный анализ.

Обработка

Обработка данных статистических наблюдений включает:Статистическую сводку;Группировку;Ряды распределения;Кластерный анализ.Обработка данных статистических наблюдений

данных статистических наблюдений


Слайд 3 3.1 Статистическая сводка

3.1 Статистическая сводка

Слайд 4 3.2 Группировка

3.2 Группировка

Слайд 5 3.2 Группировка
Равные

Неравные



Специализированные


Произвольные
прогрессивно
возрастающие
и убывающие

3.2 ГруппировкаРавныеНеравныеСпециализированныеПроизвольные прогрессивно возрастающие и убывающие

Слайд 6 3.2 Группировка

3.2 Группировка

Слайд 7 3.2 Группировка
Метод группировки позволяет решить три задачи (разграничение

3.2 ГруппировкаМетод группировки позволяет решить три задачи (разграничение условное, одна группировка

условное, одна группировка может решить все задачи):
Разделение всей совокупности

на качественно однородные группы – типологические группировки;
Характеристика структуры явления и структурных сдвигов – структурные группировки;
Изучение взаимосвязей между отдельными признаками изучаемого явления – аналитические группировки.


Слайд 8 Таблица 1. Типологическая группировка Группировка полиграфических предприятий одного из

Таблица 1. Типологическая группировка Группировка полиграфических предприятий одного из городов по формам собственности

городов по формам собственности


Слайд 9 Таблица 2. Структурная группировка Группировка населения России по размеру

Таблица 2. Структурная группировка Группировка населения России по размеру среднедушевого дохода (условные цифры)

среднедушевого дохода (условные цифры)


Слайд 10 Таблица 3. Аналитическая группировка Группировка продолжительности договорных связей книжного

Таблица 3. Аналитическая группировка Группировка продолжительности договорных связей книжного магазина и качества продукции

магазина и качества продукции


Слайд 11 3.2 Группировка

3.2 Группировка

Слайд 12 Методы определения числа групп, интервалов группировок
После определения основания

Методы определения числа групп, интервалов группировокПосле определения основания группировки следует решить

группировки следует решить вопрос о количестве групп, на которые

надо разбить исследуемую совокупность. Число групп зависит от задач исследования, численности совокупности, степени вариации признака.
После определения числа групп следует определить интервалы группировки. Интервал – это значения варьирующего признака, лежащие в определённых границах. Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей – наибольшее значение признака в нём. Величина (ширина) интервала представляет собой разность между верхней и нижней границами интервала.


Слайд 13 Таблица 4. Простая статистическая таблица Данные по з/п водителей

Таблица 4. Простая статистическая таблица Данные по з/п водителей за сентябрь

за сентябрь


Слайд 14 Таблица 5. Групповая статистическая таблица Данные по з/п водителей

Таблица 5. Групповая статистическая таблица Данные по з/п водителей за сентябрь

за сентябрь в зависимости от категории и процента выполнения

задания

Слайд 15 Таблица 6. Комбинационная статистическая таблица Зависимость з\п водителей от

Таблица 6. Комбинационная статистическая таблица Зависимость з\п водителей от квалификации и процента выполнения задания

квалификации и процента выполнения задания


Слайд 16 При составлении таблиц необходимо соблюдать общие

При составлении таблиц необходимо соблюдать общие правила:таблица должна быть легко

правила:


таблица должна быть легко обозримой;
общий заголовок должен кратко выражать

основное содержание;
наличие строк «общих итогов»;
наличие нумерации строк, которые заполняются данными;
соблюдение правила округления чисел.


Слайд 17 3.3 Ряды распределения

3.3 Ряды распределения

Слайд 18 Таблица 7. Атрибутивный ряд распределения Распределение строительных организаций РФ

Таблица 7. Атрибутивный ряд распределения Распределение строительных организаций РФ по формам собственности

по формам собственности


Слайд 19 Таблица 8. Дискретный вариационный ряд Распределение рабочих предприятия по

Таблица 8. Дискретный вариационный ряд Распределение рабочих предприятия по тарифному разряду

тарифному разряду


Слайд 20 Таблица 9. Интервальный вариационный ряд Распределение сотрудников по уровню

Таблица 9. Интервальный вариационный ряд Распределение сотрудников по уровню доходов

доходов


Слайд 21 1.ПОЛИГОН распределения (разновидность статистических ломаных) – для изображения

1.ПОЛИГОН распределения (разновидность статистических ломаных) – для изображения дискретных вариационных рядов (табл.8).

дискретных вариационных рядов (табл.8).


Слайд 22 2. ГИСТОГРАММА частот – для изображения интервальных вариационных

2. ГИСТОГРАММА частот – для изображения интервальных вариационных рядов (табл.9).

рядов (табл.9).


Слайд 23 3. КУМУЛЯТА (ОГИВА) – для изображения вариационных рядов

3. КУМУЛЯТА (ОГИВА) – для изображения вариационных рядов (табл.9). Разница только в расположении осей.

(табл.9). Разница только в расположении осей.


Слайд 25 ОГИВА

ОГИВА

Слайд 26 3.4 Кластерный анализ
cluster – означает скопление, группу элементов,

3.4 Кластерный анализcluster – означает скопление, группу элементов, обладающих общими свойствами.Кластерный

обладающих общими свойствами.
Кластерный анализ — это совокупность методов, позволяющих

классифицировать многомерные наблюдения, каждое из которых описывается набором исходных переменных Х1, Х2, ..., Хm. Целью кластерного анализа является образование групп схожих между собой объектов. В отличие от комбинационных группировок кластерный анализ приводит к разбиению на группы с учетом всех групировочных признаков одновременно.

Слайд 27 Кластеризация – это процесс разбиения множества объектов на

Кластеризация – это процесс разбиения множества объектов на кластеры. Слева изображены

кластеры. Слева изображены объекты до кластеризации, а справа –

после. Каждый кластер имеет свой цвет.

Слайд 28 Критерий кластеризации в той или иной мере отражает

Критерий кластеризации в той или иной мере отражает следующие неформальные требования:•

следующие неформальные требования:

• внутри групп объекты должны быть похожи

близки друг к другу;
• объекты разных групп должны быть далеки друг от друга;
• при прочих равных условиях распределения объектов по группам должны быть равномерными.


Слайд 29 Кластер – это множество объектов, близких между собой

Кластер – это множество объектов, близких между собой по некоторой мере

по некоторой мере сходства. В пространстве переменных кластеры представляют

собой скопления точек (объектов) различной формы.

1.Шарообразная форма

2.Эллипсоидная форма

3.Бананообразная форма

4.Конусообразная форма


Слайд 32 Наиболее доступно для восприятия и понимания в случае

Наиболее доступно для восприятия и понимания в случае количественных признаков так

количественных признаков так называемое «евклидово расстояние» или «евклидова метрика».
 

m
dij = (Σ (Xik – Xjk)2)1/2
k=1
 
dij - расстояние между объектами
Xik - численное значение i-ой переменной для k-того объекта
Xjk - численное значение j-ой переменной для k-того объекта
m – количество переменных, которыми описываются объекты

*Если имеется два количественных признака, то искомое расстояние будет равно длине гипотенузы прямоугольного треугольника, которая соединяет между собой две точки в прямоугольной системе координат.



Слайд 33 правила объединения или связи

правила объединения или связи

Слайд 34 Дендрограмма – графическое изображение результатов процесса последовательной кластеризации,

Дендрограмма – графическое изображение результатов процесса последовательной кластеризации, которая осуществляется в

которая осуществляется в терминах матрицы расстояний. С помощью дендрограммы

можно графически или геометрически изобразить процедуру кластеризации при условии, что эта процедура оперирует только с элементами матрицы расстояний или сходства.

На рисунке показан один из примеров дендрограммы. Он соответствует случаю шести объектов (n=6) и k характеристик (признаков).
Объекты А и С наиболее близки и поэтому объединяются в один кластер на уровне близости, равном 0,9. Объекты D и Е объединяются при уровне 0,8.
Теперь имеем 4 кластера: (А, С), (F), (D, E), (B).
Далее образуются кластеры (А, С, F) и (E, D, B), соответствующие уровню близости, равному 0,7 и 0,6. Окончательно все объекты группируются в один кластер при уровне 0,5.


Слайд 35 Пример для двух переменных и шести наблюдений.

Пример для двух переменных и шести наблюдений.

Слайд 36 Рассчитываем расстояния между объектами*:
d = [ (2 –

Рассчитываем расстояния между объектами*: d = [ (2 – 4)2 +

4)2 + (8 – 10)2 ]1/2 = 81/2 =

2,83
d = [ (2 – 5)2 + (8 – 7)2 ]1/2 = 101/2 = 3,16
d = [ (2 – 12)2 + (8 – 6)2 ]1/2 = 1041/2 = 10,2
d = [ (2 – 14)2 + (8 – 6)2 ]1/2 = 1481/2 = 12,16
d = [ (2 – 15)2 + (8 – 4)2 ]1/2 = 1851/2 = 13,6
d = [ (4 – 5)2 + (10 – 7)2 ]1/2 = 101/2 = 3,16
d = [ (4 – 12)2 + (10 – 6)2 ]1/2 = 801/2 = 8,94
d = [ (4 – 14)2 + (10 – 6)2 ]1/2 = 1161/2 = 10,77
d = [ (4 – 15)2 + (10 – 4)2 ]1/2 = 1571/2 = 12,53
d = [ (5 – 12)2 + (7 – 6)2 ]1/2 = 501/2 = 7,07
d = [ (5 – 14)2 + (7 – 6)2 ]1/2 = 821/2 = 9,05
d = [ (5 – 15)2 + (7 – 4)2 ]1/2 = 1091/2 = 10,44
d = [ (12 – 14)2 + (6 – 6)2 ]1/2 = 41/2 = 2
d = [ (12 – 15)2 + (6 – 4)2 ]1/2 = 131/2 = 3,6
d = [ (14 – 15)2 + (6 – 4)2 ]1/2 = 51/2 = 2,23


Слайд 37 Матрица расстояний:

Матрица расстояний:

Слайд 38 Определяем пару объектов, расположенных наиболее близко друг к

Определяем пару объектов, расположенных наиболее близко друг к другу (в наше

другу (в наше примере это объекты 4 и 5,

расстояние между которыми равно 2), которые объединяются в группу, в новой матрице эта группа представлена отдельной позицией 4-5 с расстояниями, равными минимальным расстояниям 4 и 5 объекта до соседей.

Слайд 39 Далее процедура повторяется: к 4 и 5 объектам

Далее процедура повторяется: к 4 и 5 объектам добавляется объект 6 и возникает новая матрица.

добавляется объект 6 и возникает новая матрица.


Слайд 40 Далее, ближайшее расстояние между 1 и 2 объектами,

Далее, ближайшее расстояние между 1 и 2 объектами, появляется новая группа 1-2.

появляется новая группа 1-2.


Слайд 41 Далее объект 3 присоединяется к группе 1-2, как

Далее объект 3 присоединяется к группе 1-2, как к ближайшей. Выявились

к ближайшей.
Выявились два кластера в данной совокупности объектов,
между

которыми ближайшее расстояние 7,07,
что намного больше, чем расстояния между объектами в группах.

  • Имя файла: obrabotka-dannyh-statisticheskih-nablyudeniy.pptx
  • Количество просмотров: 153
  • Количество скачиваний: 0