Что такое findslide.org?

FindSlide.org - это сайт презентаций, докладов, шаблонов в формате PowerPoint.


Для правообладателей

Обратная связь

Email: Нажмите что бы посмотреть 

Яндекс.Метрика

Презентация на тему Подготовка собранных данных к анализу. Лекция 10

Содержание

Основные используемые понятияПосле окончания полевых работ собранные данные никогда не находятся в виде, приемлемом для анализа. Подготовка данных к анализу состоит из двух этапов: редактирование данных и формирование массива для обработки. Редактирование данных – проверка, коррекция
Подготовка собранных данных к анализуЛекция 10Звоновский, к.с.н. Основные используемые понятияПосле окончания полевых работ собранные данные никогда не находятся в Редактирование данныхПолевое редактирование – редактирование, выполненное в отношении части собранных работ (собранных Редактирование данныхНевыполнение всех или части требований по методу и правилам сбора всех Обработка неудовлетворительных ответов Кодирование открытых вопросовКодирование открытых вопросов – присвоение кода, чаще всего, численного, для Кодирование открытых вопросов Кодирование переменныхКодирование переменной с единственным возможным численным значением – создание одного поля Кодировочная книга (codebook) Кодировальная книга – таблица соответствий между собранными данными и Кодировочная книга (codebook) Перенос данных в электронный массивCAPI/CAWI/CATIВвод с клавиатурыЦифровое сканирование(сканеры специальных кодов)Оптическое сканирование Перенос данных в электронный массивВвод с клавиатурыПри переносе данных из бумажного вида Распределения данных как контроль вводаПолучение и обзор первичных таблиц линейного (частотного) распределения Перекрестные таблицыПерекрестный анализ первичных данных позволяет обнаружить наиболее заметные ошибки, возникшие при сборе данных Проверка гипотезНулевая (null) гипотеза – Hₒ - гипотеза о том, что полученные Проверка гипотезВарианты гипотез:Среднее количество кинотеатров, которые посещают жители города, составляет 3,0Более 10% Проверка гипотезОдносторонний критерий (тест) – проверка нулевой гипотезы, когда альтернативная гипотеза выражена Проверка гипотезПредположим, что мы должны вывести на рынок новый бренд пива, в Перенос данных в электронный массивСформулировать Hₒ и H‚ Выбрать подходящую статистикуВыбрать уровень Проверка гипотезВыбор статистики – выбор способа измерения отклонения измеряемого значения от тестируемого Проверка гипотезВыбор уровня значимости – это выбор при котором может произойти ошибка Проверка гипотезМощность критерия – это вероятность отклонения нулевой гипотезы β (ошибка второго
Слайды презентации

Слайд 2 Основные используемые понятия
После окончания полевых работ собранные данные

Основные используемые понятияПосле окончания полевых работ собранные данные никогда не находятся

никогда не находятся в виде, приемлемом для анализа. Подготовка

данных к анализу состоит из двух этапов: редактирование данных и формирование массива для обработки.
Редактирование данных – проверка, коррекция и фильтрация собранных в результате полевых работ данных, расположенных на бумажных и электронных носителях.
Формирование массива представляет собой доведение массива данных до состояния, в котором возможна обработка первичных данных согласно программе исследования и поставленных в нем целей и задач


Слайд 3 Редактирование данных
Полевое редактирование – редактирование, выполненное в отношении

Редактирование данныхПолевое редактирование – редактирование, выполненное в отношении части собранных работ

части собранных работ (собранных одним интервьюером, на одной территории,

под руководством одного супервайзера)
Офисное редактирование – редактирование, выполненное в отношении всей массы собранных первичных документов
Редактирование чаще всего состоит из двух частей – контроль выполнения полевым персоналом инструкции по сбору данных (методики и правил), а также – проверку полноты заполнения бланков первичных документов.
В современных методах сбора данных в полевой инструмент заложена возможность контроля

Слайд 4 Редактирование данных
Невыполнение всех или части требований по методу

Редактирование данныхНевыполнение всех или части требований по методу и правилам сбора

и правилам сбора всех или части данных может привести

к существенным искажениям результатов и невозможности достичь поставленные цели и задачи исследования. Чаще всего, внесенные искажения невозможно исправить.
Отсутствие части информации в собранных анкетах (бланках интервью и пр.) может быть устранено после окончания полевых работ путем обработки неудовлетворительных ответов.
Неудовлетворительные ответы – зафиксированные или незафиксированные ответы отдельных респондентов, делающие невозможными их обработку вместе с другими единицами наблюдений, а также их перекодирование.

Слайд 5 Обработка неудовлетворительных ответов

Обработка неудовлетворительных ответов

Слайд 6 Кодирование открытых вопросов
Кодирование открытых вопросов – присвоение кода,

Кодирование открытых вопросовКодирование открытых вопросов – присвоение кода, чаще всего, численного,

чаще всего, численного, для представления ответа на конкретный вопрос,

предполагавший только собственную формулировку респондента.
Проблема – респондент может отвечать в любой лексике, так, как он понял вопрос, и так, как он хочет ответить.

Чем Вам понравился главный герой фильма? – Он крутой.
Что Вы не едите за завтрак? – Обед и ужин.
Как Вы оцениваете деятельность Президента? – Я не довольна работой нашего ТСЖ

Слайд 7 Кодирование открытых вопросов

Кодирование открытых вопросов

Слайд 8 Кодирование переменных
Кодирование переменной с единственным возможным численным значением

Кодирование переменныхКодирование переменной с единственным возможным численным значением – создание одного

– создание одного поля одного из цифровых форматов для

данной переменной.
Кодирование переменной с несколькими возможными численными значениями – создание нескольких полей одного из цифровых форматов для данной переменной.
Кодирование переменной с одним или несколькими возможными нечисленными значениями – создание одного или нескольких полей текстового формата для данной переменной.

Слайд 9 Кодировочная книга (codebook)
Кодировальная книга – таблица соответствий

Кодировочная книга (codebook) Кодировальная книга – таблица соответствий между собранными данными

между собранными данными и переменными электронного массива данных. Описывает

правила преобразования информации, имеющейся в полевых документах в коды, используемые при анализе данных.

Корме полевой информации, включает в себя служебные данные – например, номер проекта, номер оператора, время переноса данных и пр.

Слайд 10 Кодировочная книга (codebook)

Кодировочная книга (codebook)

Слайд 11 Перенос данных в электронный массив
CAPI/CAWI/CATI
Ввод с клавиатуры
Цифровое сканирование
(сканеры

Перенос данных в электронный массивCAPI/CAWI/CATIВвод с клавиатурыЦифровое сканирование(сканеры специальных кодов)Оптическое сканирование

специальных кодов)
Оптическое сканирование


Слайд 12 Перенос данных в электронный массив
Ввод с клавиатуры
При переносе

Перенос данных в электронный массивВвод с клавиатурыПри переносе данных из бумажного

данных из бумажного вида в электронный возникают ошибки, связанные

с тем, что этот перенос выполняет человек. При этом чаще всего данных так много, что к переносу привлекается большое число неквалифицированных сотрудников.
Для борьбы с этими ошибками используют несколько техник.
Выборочный контроль введенных данных. Супервайзер сравнивает какую-то долю – обычно 10% - бумажных и электронных вариантов записей. Если число ошибок в этой доле превышает заранее уговоренный уровень, проверяются уже 20% ввода и т.д.
Повторный ввод. Данные переносятся из бумажный формы в электронную дважды, желательно, различными сотрудниками. Для анализа используется объединенный массив.

Слайд 13 Распределения данных как контроль ввода
Получение и обзор первичных

Распределения данных как контроль вводаПолучение и обзор первичных таблиц линейного (частотного)

таблиц линейного (частотного) распределения значений измеряемых переменных позволяют увидеть

возможные ошибки при сборе и переносе данных.

Слайд 14 Перекрестные таблицы
Перекрестный анализ первичных данных позволяет обнаружить наиболее

Перекрестные таблицыПерекрестный анализ первичных данных позволяет обнаружить наиболее заметные ошибки, возникшие при сборе данных

заметные ошибки, возникшие при сборе данных


Слайд 15 Проверка гипотез
Нулевая (null) гипотеза – Hₒ - гипотеза

Проверка гипотезНулевая (null) гипотеза – Hₒ - гипотеза о том, что

о том, что полученные результаты не показывают никакого значимого

различия между группами генеральной совокупности.
Альтернативная гипотеза – H‚ - гипотеза, утверждающая, что существуют значимые различия между отдельными группами генеральной совокупности.
Нулевая гипотеза может отвергнута, но она не может быть принята на основании лишь одной проверки.
Результатов проверки нулевой (пустой) гипотезы может быть два – принята нулевая гипотеза (т.е. различий нет) и принята альтернативная гипотеза (т.е. различия есть)

Слайд 16 Проверка гипотез
Варианты гипотез:
Среднее количество кинотеатров, которые посещают жители

Проверка гипотезВарианты гипотез:Среднее количество кинотеатров, которые посещают жители города, составляет 3,0Более

города, составляет 3,0
Более 10% домохозяйств постоянно делают покупки в

одних и тех же универмагах
Сторонники двух различных кандидатов отличаются по своим социально-демографическим характеристикам
Одна гостиница имеет более привлекательный образ, чем ее ближайший конкурент
Большая осведомленность об авторе книги приводит к более позитивному отношению к его произведениям

Слайд 17 Проверка гипотез
Односторонний критерий (тест) – проверка нулевой гипотезы,

Проверка гипотезОдносторонний критерий (тест) – проверка нулевой гипотезы, когда альтернативная гипотеза

когда альтернативная гипотеза выражена направленно.
Например, мы предполагаем, что

доля рынка, занятая данным сортом пива, превышает 20%.
Значит, Hₒ: ρ ≤ 0,20, а H‚: ρ ≥ 0,20

Двусторонний критерий (тест) – проверка нулевой гипотезы, когда альтернативная гипотеза выражена ненаправленно.
Например, мы предполагаем, что за нашего кандидата проголосует 10% избирателей округа.
Значит, Hₒ: ρ ≠ 0,20, а H‚: ρ = 0,20




Слайд 18 Проверка гипотез
Предположим, что мы должны вывести на рынок

Проверка гипотезПредположим, что мы должны вывести на рынок новый бренд пива,

новый бренд пива, в случае, если в целевой группе

он будет занимать не менее 20%
Тогда Hₒ: ρ ≤ 0,20, а H‚: ρ ≥ 0,20

Мы можем принять верное решение в двух случаях:
Нулевая гипотеза отвергнута, и действительно доля потребителей больше 20%.
Нулевая гипотеза принята, и действительно доля потребителей меньше 20%.
Мы можем совершить ошибку, если
Нулевая гипотеза отвергнута, но в действительности доля потребителей меньше 20% (первого рода)
Нулевая гипотеза принята, и действительно доля потребителей больше 20% (второго рода).



Слайд 19 Перенос данных в электронный массив
Сформулировать Hₒ и H‚

Перенос данных в электронный массивСформулировать Hₒ и H‚ Выбрать подходящую статистикуВыбрать


Выбрать подходящую статистику
Выбрать уровень значимости
Собрать данные и рассчитать проверочную

статистику

Определить вероятность выбранной статистики и сравнить с выбранным значением значимости

Отклонить или принять Hₒ

Сделать вывод и принять решение


Слайд 20 Проверка гипотез
Выбор статистики – выбор способа измерения отклонения

Проверка гипотезВыбор статистики – выбор способа измерения отклонения измеряемого значения от

измеряемого значения от тестируемого уровня.
Если тестируется превышает ли доля

рынка уровень в 10%, значит выбирается способ измерения значимости отличия измеренного значения от 20%.
Чаще всего используются нормальное (z), биноминальное распределение, распределение Стъюдента или хи-квадрат.
В данном случае мы будем использовать z-распределение для доли:
Z = (ρ¯ - ρ) / σ

σ = √ρ(1-ρ) / n
σ = √0,2(1-0,8) / 500= 0,018


Слайд 21 Проверка гипотез
Выбор уровня значимости – это выбор при

Проверка гипотезВыбор уровня значимости – это выбор при котором может произойти

котором может произойти ошибка первого рода.
Традиционно выбирается 95%. Это

позволяет после получения выборочных значений как увеличить, так и уменьшить уровень значимости.
Предположим, что из 500 респондентов, 110 сообщили, что являются потребителями изучаемой марки пива. Тогда
ρ = 0,22

σ = √0,2(1-0,8) / 500= 0,018

Z = (0,22 – 0,20) / 0,018 = 1,111

Площадь под кривой – 0,733
Таким образом, нулевая гипотеза не отвергается.

  • Имя файла: podgotovka-sobrannyh-dannyh-k-analizu-lektsiya-10.pptx
  • Количество просмотров: 172
  • Количество скачиваний: 0