Слайд 2
SPSS является самой распространённой программой для обработки статистической
информации.
Два студента Норман Най (Norman Nie) и Дейл Вент
(Dale Bent), специализировавшиеся в области политологии в 1965 году пытались отыскать в Стенфордском университете Сан-Франциско компьютерную программу, подходящую для анализа статистической информации.
Слайд 3
Вскоре они разочаровались в своих попытках, так как
имеющиеся программы оказывались более или менее непригодными, неудачно построенными
или не обеспечивали наглядность представления обработанной информации. К тому же принципы пользования менялись от программы к программе.
Слайд 4
Так, не долго думая, они решили разработать собственную
программу, со своей концепцией и единым синтаксисом. В их
распоряжении тогда был язык программирования FORTRAN и вычислительная машина типа IBM 7090.
Уже через год была разработана первая версия программы, которая, еще через год, в 1967, могла работать на IBM 360. К этому времени к группе разработчиков присоединился Хэдлай Халл (Hadlai Hull).
IBM 360
Слайд 5
Как известно из истории развития информатики, программы тогда
представляли собой пакеты перфокарт. Как раз на это указывает
и исходное название программы, которое авторы дали своему продукту: SPSS — это аббревиатура от Statistical Package for the Social Science.
В 1970 году работа над программой была продолжена в Чикагском университете, а Норман Най основал соответствующую фирму — к тому моменту уже было произведено шестьдесят инсталляций. Первое руководство для пользователей описывало одиннадцать различных процедур.
Слайд 6
Спустя пять лет SPSS была уже инсталлирована шестьсот
раз, причём под разными операционными системами. С самого начала
версиям программы присваивали соответствующие порядковые номера. В 1975 была разработана уже шестая версия (SPSS6). До 1981 последовали версии 7, 8 и 9.
Командный язык (синтаксис) SPSS в то время был ещё не так хорошо развит, как сейчас, и естественно ориентирован на перфокарты. Поэтому так называемые управляющие карты SPSS состояли из идентификационного поля (столбцы 1-15) и из поля параметров (столбцы 16-80).
Слайд 7
В 1983 году командный язык SPSS был полностью
переработан, синтаксис стал значительно удобней. Что бы отметить этот
факт, программа была переименована в SPSSX, где буква X должна была служить как номером версии в римскими числами, так и сокращением для extended (расширенный).
.
Слайд 8
Так как применение перфокарт к этому моменту уже
стало историей, то программа SPSS и информация, подлежащая обработке,
сохранялись в отдельных файлах на винчестерах больших ЭВМ, которые тогда использовались повсеместно. Год от года постоянно увеличивалось и количество процедур
Слайд 9
С появлением персональных компьютеров была разработана также и
PC-версия SPSS, с 1983 года появилась PC-версия SPSS\PC+. рассчитанная
на MS-DOS. Позже, с момента основания в 1984 году европейского торгового представительства в Горинхеме в Нидерландах, SPSS стал широко применяться и в Европе. В настоящее время это самое распространённое программное обеспечение для статистического анализа во всём мире.
Слайд 10
Для того, чтобы отразить возможность использования программы во
всех областях, имеющих отношение к статистическому анализу, буква X
вновь была удалена из названия марки, а исходной аббревиатуре присвоено новое значение: Superior Performance Software System (система программного обеспечения высшей производительности).
Слайд 11
Если PC версия SPSS/PC+ была чуть усовершенствованной версией
для больших ЭВМ, то SPSS для операционной системой Windows
(SPSS for Windows) стала большим шагом вперёд.
Слайд 12
Эта версия SPSS обладает всеми возможностями версии для
больших ЭВМ. За некоторыми немногочисленными исключениями, программой можно пользоваться
без особых знаний в области прикладного программирования.Вызов необходимых процедур статистического анализа происходит при помощи стандартной техники, применяемой в Windows, то есть с помощью мыши и соответствующих диалоговых окон.
Слайд 13
В сентябре 2012 г. вышла очередная версия пакета
- IBM SPSS Statistics 21, работающая под управлением ОС
Windows, MacOsX и Linux.
Но на данном этапе во многих учебных заведениях пользуются версией SPSS 17.0.
Слайд 14
Основу программы SPSS составляет SPSS Base (базовый модуль),
предоставляющий разнообразные возможности доступа к данным и управления данными.
Он содержит методы анализа, которые применяются чаще всего.
Слайд 15
Традиционно вместе с SPSS Base (базовым модулем) поставляются
ещё два модуля: Advanced Models (продвинутые модели) и Regression
Models (регрессионные модели). Эти три модуля охватывают тот спектр методов анализа, который входил в раннюю версию программы для больших ЭВМ.
Слайд 16
SPSS Base входит в базовую поставку. Он включает
все процедуры ввода, отбора и корректировки данных, а также
большинство предлагаемых в SPSS статистических методов. Наряду с простыми методиками статистического анализа, такими как частотный анализ, расчет статистических характеристик, таблиц сопряженности, корреляций, построения графиков, этот модуль включает t-тесты и большое количество других непараметрических тестов, а также усложненные методы, такие как многомерный линейный регрессионный анализ, дискриминантный анализ, факторный анализ, кластерный анализ, дисперсионный анализ, анализ пригодности (анализ надежности) и многомерное шкалирование.
Слайд 18
Данный модуль включает в себя различные методы регрессионного
анализа, такие как: бинарная и мультиномиальная логистическая регрессия, нелинейная
регрессия и пробит-анализ.
Слайд 19
В этот модуль входят различные методы дисперсионного анализа
(многомерный, с учетом повторных измерений), общая линейная модель, анализ
выживания, включая метод Каплана-Майера и регрессию Кокса, логлинейные, а также логитлоглинсйные модели.
Слайд 20
Модуль Tables служит для создания презентационных таблиц. Здесь
предоставляются более широкие возможности по сравнению со упрощенными частотными
таблицами и таблицами сопряженности, которые строятся в SPSS Base (базовом модуле).
Слайд 21
Amos (Analysis of moment structures — анализ моментных
структур) включает методы анализа с помощью линейных структурных уравнений.
Целью программы является проверка сложных теоретических связей между различными признаками случайного процесса и их описание при помощи подходящих коэффициентов. Проверка проводится в форме причинного анализа и анализа траектории. При этом пользователь в графическом виде должен задать теоретическую модель, в которую вместе с данными непосредственных наблюдений могут быть включены и так называемые скрытые элементы.
Слайд 22
AnswerTree (дерево решений) включает четыре различных метода автоматизированного
деления данных на отдельные группы (сегменты). Деление проводится таким
образом, что частотные распределения целевой (зависимой) переменной в различных сегментах значимо различаются. Типичным примером применения данною метода является создание характерных профилей покупателей при исследовании потребительского рынка. AnswerTree является преемницей программы СНАШ (Chi squared interaction Detector — детектор взаимодействий на основе хи-квадрата).
Слайд 23
Модуль содержит различные методы для анализа категориальных данных,
а именно: анализ соответствий и три различных метода оптимального
шкалирования (анализ однородности, нелинейный анализ главных компонент, нелинейный канонический корреляционный анализ).
Слайд 24
Clementine — это программа для data mining (добычи
знаний), в которой пользователю предлагаются многочисленные подходы к построению
моделей, к примеру, нейронные сети, деревья решений, различные виды регрессионного анализа. Clementine представляет собой "верстак" аналитика, при помощи которого можно визуализировать процесс моделирования, перепроверять модели, сравнивать их между собой. Для удобства пользования программой имеется вспомогательная среда внедрения результатов.
Слайд 25
Совместный анализ применяется при исследовании рынка для изучения
потребительских свойств продуктов на предмет их привлекательности. При этом
опрашиваемые респонденты по своему усмотрению должны расположить предлагаемые наборы потребительских свойств продуктов в порядке предпочтения, на основании которого можно затем вывести так называемые детализированные показатели полезности отдельных категорий каждого потребительских свойства.
Слайд 26
Программа Data Entry предназначена для быстрого составления вопросников,
а также ввода и чистки данных. Заданные на этапе
создания вопросника вопросы и категории ответов потом используются в качестве меток переменных и значений.
Слайд 27
Данный модуль служит для вычисления точного значения вероятности
ошибки (величины р) в условиях ограниченности данных при проверке
по критерию х2 (Chi-Quadrat-Test) и при непараметрических тестах. В случае необходимости для этого также может быть применён метод Монте-Карло (Monte-Carlo).
Слайд 28
При помощи SamplePower может быть определён оптимальный размер
выборки для большинства методов статистического анализа, реализованных в SPSS.
Слайд 29
Программа содержит специальную регрессионную модель для регрессионного анализа
упорядоченных зависимых и независимых переменных.
Слайд 30
Данный модуль служит для анализа и восстановления закономерностей,
которым подчиняются пропущенные значения. Он предоставляет различные варианты замены
недостающих значений.
Слайд 31
Программа содержит специальную регрессионную модель для регрессионного анализа
упорядоченн Модуль Trends содержит различные методы для анализа временных
рядов, такие как: модели ARIMA, экспоненциальное сглаживание, сезонная декомпозиция и спектральный анализ.
Слайд 33
Данные могут быть введены непосредственно в SPSS или
могут быть импортированы из текстовых файлов, файлов формата EXCEL,
ACCESS и т.д. Пусть нашем случае имеется файл данных в формате EXCEL (рис 1.1). Приступим к импорту данных в файл SPSS.
Слайд 34
Рис.1.1. Файл исходных данных в формате EXCEL
Слайд 35
После запуска программы SPSS и появления на экране
пустого файла SPSS, подобного изображенному на Рис. 1.2, выберите
в строке меню Файл-Открыть-Данные и задайте имя EXCEL файла с вашими данными, его тип, после чего нажмите кнопку OPEN (Рис. 1.3).
Слайд 36
Рис. 1.2. Окно редактора данных в SPSS.
Слайд 38
2. В новом диалоговом окне (Рис.1.4) задайте
диапазон ячеек (например, А1:F17). Если в первой строке EXCEL
файла находятся имена переменных, то установить флажок Читать имена переменных из первой строки данных. Щелкните на кнопке ОК.
Слайд 40
3. На экране вы увидите импортированные данные в
формате SPSS (Рис. 1.5).