Перейти на главную страницу
Магистрант
кафедры ботаники
Пинчук Вероника Владимировна
Руководители:
кандидат биологических наук, доцент Тихомиров Валерий Николаевич
старший преподаватель
Шешко Сергей Михайлович
БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
кафедры ботаники
Пинчук Вероника Владимировна
Руководители:
Кандидат биологических наук, доцент Тихомиров Валерий Николаевич
старший преподаватель
Шешко Сергей Михайлович
МИНСК - 2010
Для статистического анализа необходима обработка очень большого объема данных, и часто сводные таблицы данных могут достигать практически необозримых размеров [1].
Многофункциональные пакеты для обработки и анализа данных, такие как Excel, Access, STADIA, STATA, JMR (StatView), SAS (компания SAS Institute), STATGRAPICS, STATISTICA, SPSS и бесчисленное множество других нашли самое широкое распространение в самых разных областях исследований. Одним из самых незаменимых помошников для исследователя, работающего в области статистического анализа данных, является программа SPSS - очень мощный и широко распространенный пакет профессионального компьютерного анализа данных [8].
SPSS - Statical Packege for the Sosial Sciance - статистический пакет для социальных наук – выполнен очень продуманно и на таком высоком уровне, что сразу получил не только широкое распространение, но и признание со стороны статистов естественных наук. Включая огромное количество различных функций и возможностей – его ресурсы практически неисчерпаемы.
За очень короткое время SPSS позволяет сделать разносторонний анализ данных [1, 2, 3].
Так, не долго думая, они решили разработать собственную программу, со своей концепцией и единым синтаксисом. В их распоряжении тогда был язык программирования FORTRAN и вычислительная машина типа IBM 7090. Уже через год была разработана первая версия программы, которая, еще через год, в 1967, могла работать на IBM 360. К этому времени к группе разработчиков присоединился Хэдлай Халл (Hadlai Hull).
Как известно из истории развития информатики, программы тогда представляли собой пакеты перфокарт. Как раз на это указывает и исходное название программы, которое авторы дали своему продукту: SPSS - это аббревиатура от Statistical Package for the Social Science.
В 1970 году работа над программой была продолжена в Чикагском университете, а Норман Най основал соответствующую фирму - к тому моменту уже было произведено шестьдесят инсталляций. Первое руководство для пользователей (издательство McGraw-Hill) описывало одиннадцать различных процедур.
Спустя пять лет проект выделился в отдельную компанию SPSS Inc. Программа SPSS была уже инсталлирована шестьсот раз, причём под разными операционными системами. С самого начала версиям программы присваивали соответствующие порядковые номера. В 1975 была разработана уже шестая версия (SPSS6). До 1981 последовали версии 7, 8 и 9.
Командный язык (синтаксис) SPSS в то время был ещё не так хорошо развит, как сейчас, и естественно ориентирован на перфокарты. Поэтому так называемые управляющие карты SPSS состояли из идентификационного поля (столбцы 1-15) и из поля параметров (столбцы 16-80).
В 1983 году командный язык SPSS был полностью переработан, синтаксис стал значительно удобней. Что бы отметить этот факт, программа была переименована в SPSSX, где буква X должна была служить как номером версии в римскими числами, так и сокращением для extended (расширенный).
Так как применение перфокарт к этому моменту уже стало историей, то программа SPSS и информация, подлежащая обработке, сохранялись в отдельных файлах на винчестерах больших ЭВМ, которые тогда использовались повсеместно. Год от года постоянно увеличивалось и количество процедур.
С появлением персональных компьютеров была разработана также и PC-версия SPSS, с 1983 года появилась PC-версия SPSS\PC+. рассчитанная на MS-DOS. Позже, с момента основания в 1984 году европейского торгового представительства в Горинхеме в Нидерландах, SPSS стал широко применяться и в Европе. В настоящее время это самое распространённое программное обеспечение для статистического анализа во всём мире.
Для того чтобы отразить возможность использования программы во всех областях, имеющих отношение к статистическому анализу, буква X вновь была удалена из названия марки, а исходной аббревиатуре присвоено новое значение: Superior Performance Software System (система программного обеспечения высшей производительности).
Если PC версия SPSS/PC+ была чуть усовершенствованной версией для больших ЭВМ, то SPSS для операционной системой Windows (SPSS for Windows) стала большим шагом вперёд. Во-первых, эта версия SPSS обладает всеми возможностями версии для больших ЭВМ, во-вторых, за некоторыми немногочисленными исключениями, программой можно пользоваться без особых знаний в области прикладного программирования. Вызов необходимых процедур статистического анализа происходит при помощи стандартной техники, применяемой в Windows, то есть с помощью мыши и соответствующих диалоговых окон.
Первая версия SPSS для Windows имевшая порядковый номер 5 (SPSS 5.0 for Windows) вышла в 1992 году. Затем последовали версии 6.0 и 6.1 с некоторыми нововведениями в статистической и графической областях; версия 6.1 была первой статистической программой для Windows, которая использовала 32 битную архитектуру Windows 3.1. Это можно было заметить по более высокой скорости выполнения вычислений. Усовершенствования коснулись также и интерфейса пользователя. В конце концов, была выпущена версия 6.1.3, которая уже могла работать и под Windows 95 и под NT.
В начале 1996 года появилась 7-я версия SPSS, сначала как версия 7.0, а затем 7.5. Наряду с расширением возможностей в сфере статистики, разница между этими двумя версиями заключалась в том, что в версии 7.5 как меню, так и интерфейс программы были выполнены уже не только на английском, но и на других наиболее распространенных языках.
Самым весомым отличием версии 7 по отношению к предыдущим версиям, был абсолютно новый подход к выводу информации на экран. Так, во-первых, получил новые очертания так называемый Viewer (Окно просмотра), и, во-вторых, более приятный внешний вид приобрели таблицы результатов расчётов (мобильные таблицы). Появившаяся технология мобильных таблиц позволяет перестраивать полученные таблицы различным способами.
Если предшественница данной версии - версия 6.1.3 могла работать как под старой Windows 3.1 так и под новой Windows 95 (NT), то SPSS версии 7 могла работать только при наличии Windows 95 (NT).
За версией 7.5 последовала версия 8.0, прогресс которой заключался в усовершенствовании графической оболочки. Возможность составления интерактивных графиков предоставляет рад преимуществ по сравнению с традиционными графиками, которые являются стандартом для многих других пакетов.
Версия 9.0 включала в себя несколько новых статистических методов, в т.ч. многозначную логистическую регрессию, и несколько новых графических возможностей, расширяющих область интерактивных графиков.
Версия 10.0 пакета SPSS for Windows – вышла в сентябре 1999 года. Начиная с версии 10, предел по числу переменных был практически снят, единственный оставшийся «жесткий» предел составляет 2.15 миллиарда переменных. [5]
Версия 12.0 пакета SPSS for Windows - появление возможности русификации окон вывода результатов.
Версия 12.5 пакета SPSS for Windows – русификация основных диалоговых окон.
Версия 13.0 пакета SPSS for Windows более совершенные графические возможности программы.
Версия 14.0 пакета SPSS for Windows – русификация основных диалоговых окон.
Версия 15.0 пакета SPSS for Windows - распространяемая с сентября 2006 года.
Версия 17.0 пакета SPSS for Windows – вышла в 2008 году. Среди основных новшеств SPSS Statistics 17.0: Возможность работать под Windows Vista (а также под Windows XP, Mac OS X и Linux). Усовершенствованный Редактор синтаксиса. Поддерживает 10 языков: английский, русский, французский, немецкий, испанский, итальянский, японский, польский, корейский, китайский. Улучшен Конструктор диаграмм и существенно расширенные возможности визуализации данных. Процедура Оптимальной категоризации (в SPSS Data Preparation).Нейронные сети (в SPSS Neural Networks). Анализ RFM (в SPSS EZ RFM). Процедуры Обобщенная линейная модель и Обобщенные уравнения (в SPSS Advanced Statistics). Процедура анализа методом ближайшего соседа. Поддержка языка скриптов Python. А также другие важные новшества и усовершенствования [11; 9].
Версия 18.0 пакета SPSS for Windows – готовиться к выходу!
SPSS представляет собой набор различных программ обработки данных - эти программы облегчают процесс ввода данных (информации), легко позволяет гибко менять структуру данных, использовать самые современные методы обработки данных (как по отдельности, так и совместно) и получать результаты в удобной и наглядной форме.
Все эти многочисленные программы собраны в единую цельную систему, которая обеспечивает легкость общения пользователя с достаточно сложной, комплексной программой, снабженной исчерпывающей справочной поддержкой.
SPSS - компьютерная программа для статистической обработки данных, один из лидеров рынка в области коммерческих статистических продуктов, предназначенных для проведения прикладных исследований в социальных науках. По мнению некоторых авторов, SPSS "занимает ведущее положение среди программ, предназначенных для статистической обработки информации" [11].
Основным достоинством программного комплекса SPSS, как одного из самых существенных достижений в области компьютеризированного анализа данных, является самый широкий охват существующих статистических методов, который удачно сочетается с большим количеством удобных средств визуализации результатов обработки.
Основные функциональные возможности программы по обработке статистических данных и презентации результатов: кодирование статистических данных; основные определения и понятия из области статистики: шкалы статистических измерений, выборки и распределения, статистическая значимость понятие о зависимых и независимых выборках; процедура проведения частотного анализа данных; первичная обработка и подготовка данных для применения основных статистических методов, вычислительные возможности SPSS; условный отбор данных для повышения эффективности использования процедур статистической обработки; приемы поиска ошибок при вводе информации; статистические характеристики данных и основные типы распределений, которым подчиняются выборки; проведение тестов на наличие нормального распределения; построение таблиц сопряженности и расчет статистических характеристик для них; интерпретация таблиц сопряженности и ее практическое значение; методы анализа множественных вариантов ответов и условия их применения; множественные варианты ответов и частотный анализ; множественные варианты ответов и таблицы сопряженности; проведение сравнения средних значений выборок и интерпретация результатов; проведение непараметрических тестов для выборок, которые не подчиняются нормальному распределению или не относятся к порядковой шкале; виды корреляционного анализа и интерпретация результатов; простая линейная регрессия (пример из маркетинга); многомерная регрессия (пример из маркетинга); нелинейная регрессия (пример из социологии); логистическая регрессия (пример из медицины); порядковая регрессия (пример из психологии поведения); дискриминационный анализ и его практическое применение; надежность результатов дискриминационного анализа с практической точки зрения; факторный анализ и его практическое применение, методы факторизации переменных; пример применения факторизации в маркетинге, социологии и психологии; кластерный анализ, принципы его проведения и практическое применение; иерархический кластерный анализ для двух и более переменных; кластерный анализ для большого объема данных; интерпретация результатов кластерного анализа; примеры проведения кластерного анализа в маркетинге, социологии и экономической географии; анализ пригодности заданий для статистических обследований и опросов; управление выводом таблиц в SPSS; графические презентационные возможности SPSS; экспорт данных и результатов расчетов SPSS в Microsoft Office, преобразование в HTML-формат; программный синтаксис SPSS 10/11; язык сценариев SPSS 10/11; новое в версии SPSS 11; таблица соответствий пунктов меню русской и английской версии SPSS 10 [7].
Модуль Tables служит для создания презентационных таблиц. Здесь предоставляются более широкие возможности по сравнению с упрощенными частотными таблицами и таблицами сопряженности, которые строятся в SPSS Base (базовом модуле).
Для расширения возможностей SPSS предлагаются следующие модули и программы.
Наряду с тремя упомянутыми, существует еще ряд специальных дополнительных модулей и самостоятельных программ, число которых постоянно растёт, так, что пользователям следует постоянно знакомиться с информацией о нововведениях в SPSS.Amos (Analysis of moment structures - анализ моментных структур) включает методы анализа с помощью линейных структурных уравнений. Целью программы является проверка сложных теоретических связей между различными признаками случайного процесса и их описание при помощи подходящих коэффициентов. Проверка проводится в форме причинного анализа и анализа траектории. При этом пользователь в графическом виде должен задать теоретическую модель, в которую вместе с данными непосредственных наблюдений могут быть включены и так называемые скрытые элементы. Программа Amos включена в состав модулей расширения SPSS, как преемник L1SREL (Linear Structural RELationships - линейные структурные взаимоотношения).
Программа Data Entry предназначена для быстрого составления вопросников, а также ввода и чистки данных. Заданные на этапе создания вопросника вопросы и категории ответов потом используются в качестве меток переменных и значений.
При помощи SamplePower может быть определён оптимальный размер выборки для большинства методов статистического анализа, реализованных в SPSS.
Модуль Trends содержит различные методы для анализа временных рядов, такие как: модели ARIMA, экспоненциальное сглаживание, сезонная декомпозиция и спектральный анализ [10].
Процедура сравнения средних значений выборок, на основании которой можно сделать выводы о соотношении средних значений генеральных совокупностей.
КЛАСТЕРНЫЙ АНАЛИЗ – Cluster analysis - процедура, на основе заданного правила объединяющая объекты или переменные в группы, называемые кластерами. Используется как «разведывательный» анализ в самостоятельном использовании не представляющий статистической ценности, однако позволяющий судить и направлении исследования (сокращает время поиска и подбора методов для каждого конкретно взятого случая исследования).
ОПИСАТЕЛЬНАЯ СТАТИСТИКА – Descriptive statistics – это различные вычисляемые показатели, характеризующие распределение значений переменной. Условно разделены на две группы, первая – меры центральной тенденции, вокруг которых «группируются» данные (среднее значение, медиана и мода), вторая группа характеризует изменчивость значений переменной относительно среднего: стандартное отклонение и дисперсия. Диапазон изменчивости характеризуется минимумом, максимумом и размахом. Асимметрия и эксцесс представляют меру отклонения формы распределения от нормального вида. Существуют величины, отражающие погрешности некоторых статистик.
ДИСКРИМИНАНТНЫЙ АНАЛИЗ –DA – процедура создания формулы регрессии, на основе которой производится разбиение объектов на группы, соответствующие категориям зависимой переменной.
Дискриминантный анализ представляет собой альтернативу множественного регрессионного анализа. Для случая, когда зависимая переменная представляет собой не количественную, а номинальную переменную. Дискриминантный анализ, по сути, решает следующие задачи: предсказание значения «зависимой» переменной и определение того, какие «независимые» переменные лучше всего подходят для такого предсказания. Дискриминантный анализ основан на составлении уравнения регрессии, использующего номинальную зависимую переменную. Уравнение регрессии составляется на основе тех объектов, о которых известна групповая принадлежность, что позволяет максимально точно подобрать его коэффициенты. После того как уравнение регрессии получено, его можно использовать для группировки интересующих исследователя объектов, в целях прогнозирования их принадлежности к какому-либо классу.
Команда дискриминантный анализ непроста и требует настройки множества параметров, работа с которыми лежит в области статистики, но также приводится в руководстве пользователя SPSS.
Параметры дискриминантного анализа определяются особенностями данных и задачами исследователя ввиду того, что дискриминантный анализ - сложная статистическая операция.
Для демонстрации дискриминантного анализа приведем пример пошаговой работы с программой, у опытных исследователей этот процесс с помощью программы занимает порядка 10-15 минут, в то время как при расчете всех этик коэффициентов и параметров «вручную» может занять до нескольких недель.
Таблицы исходных данных могут занимать очень большие объемы.
Для дискриминантного анализа меню Analize (Анализ) выбираем команду Classify ► Discriminant (Классификация ► Дискриминантный анализ). На экране появляется диалоговое окно Discriminant Analisis (дискриминантный анализ), рис 2.
В список Independents (Независимые переменные) включается любое число переменных, участвующих в дискриминантном анализе в качестве предикторов.
Переключатели Enter independents together (Вводить независимые переменные вместе) и Use stepwise method (Использовать пошаговый метод) позволяют выбрать один из двух вариантов дискриминантного анализа.
Selection Variable (Переменная отбора) позволяет указать имя переменной и ее уровень. Включает параметр Value (Значение).
Четыре кнопки управления дополнительными параметрами: Statistics, Method, Classify, Save.
За долгие годы существования программа все усложнялась и совершенствовалась, в ожидаемом в скором времени 18 выпуске пользователь получит самый совершенный статистический пакет. Помимо пополнения арсенала статистических возможностей, выйдет долгожданная полная русская версия, что значительно облегчит диалог пользователя и программы.
SPSS · 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 23, 24, 25
SPSS · 6, 10
W
Window · 9
Windows · 8, 9
Windows · 9
д
дискриминантного анализа · 17, 18, 19, 23
Д
Дискриминантный анализ · 17, 19, 20, 21
Всемирно известная поисковая система Google. Позволяет производить простой поиск по ключевым словам, при вводе которых мгновенно предлагается перечень вариаций. Очень удобная опция возможность расширенного поиска по группам (среди книг, фото, аудио или видеофайлов, новостей и т.д.), особым признакам (определение, тип файла) в общей сложности более двадцати специализированных сервисов, а также, собственный почтовый сервис. Легкость написания и запоминания выгодно отличает Google от других поисковых систем. Простота оформления и кайзен (постоянное совершенствование во всем) давно покорила сердца и умы миллионов пользователей по всему миру.
2. http://nigma.ru/
Нигма - интеллектуальная поисковая система - это поисковик научно-прикладной характера: она является своего рода исследовательской лабораторией для студентов и аспирантов МГУ. Имеется коммерческая составляющая проекта - реклама от Яндекс.Директа. Главное - это построение эффективного поиска на основе новых поисковых алгоритмов: в частности, это метод, основанный на кластеризации документов. При поисковом запросе пользователя формируется ряд документов, которые группируются в тематические классы, имеющие определенное описание. Таким образом, пользователь может уточнить условия поиска, убрав из него определенные кластеры (сняв галочки перед их названиями). Использует индексную базу нескольких поисковых машин: Google, Yahoo, MSN, Yandex, Rambler, Altavista, Aport. Также имеется и собственная документальная база. Основную аудиторию поисковой системы составляют студенты. Общая популярность Нигмы среди пользователей Рунета остается на достаточно низком уровне.
Особенно приятный момент – «Безопасный Интернет - детям!»
3. https://www.vak.org.by
Сайт Высшей аттестационной комиссии Республики Беларусь. Совершенно необходим каждому ученому! Содержит максимально полный перечень материалов, касающиеся подготовки научных кадров, присуждения ученых степеней и званий. Для начинающих работу представлены краткие паспорта специальностей и программы-минимумы кандидатских экзаменов по специальности. Важный раздел «Каталог файлов» - в нем представлены доступные для скачивания файлы нормативных документов с приложениями и шаблоны регистрационных документов. Организован поиск по сайту и в сети Интернет.
4. https://ru.wikipedia.org/
Википедия. Свободная интернет энциклопедия. Самая большая коллекция знаний человечества, когда-либо собранных вместе: более 14 миллионов энциклопедических статей на 270 языках, с продолжающимся ростом и ежедневным улучшением самими пользователями (специалистами в своей области). Википедия написана понятным языком, и даже самые сложные тематические статьи хорошо адаптированы для понимания. Важным моментом является возможность пояснения каждого термина. Поиск и словарь удобно дополняют друг друга. Особенно приятный момент – «Вики» (так ее прозвали пользователи) не содержит рекламы! Основатель Википедии Джимми Уэйлс.
«Википедия очень важна для всех. Она является достижением человечества» - Fernando Borba и нельзя сказать лучше!
6. http://herba.msu.ru/russian/index.html
Ботанический сервер московского государственного университета. Содержит перечень ботанических изданий, ботанические подразделения, новости ботанической жизни, ссылки на ботанические ресурсы, библиотеку изображений и прочее. Ресурс доступен на 8-ми языках.
7. https://minpriroda.by/ru
Официальный сайт Министерства природы и охраны окружающей среды Республики Беларусь. На сайте расположена информация о самом Министерстве, об охраняемых и заповедных территориях, памятниках природы, полезные ссылки, справочная информация, красная книга, экологический календарь и экологический бюллетень, актуальные новости, оснащена собственной поисковой системой. Размещена реклама господдержки.
Здесь вы увидите: мою автобиографию, мои хобби, выпускную работу по ОИТ, презентацию магистерской диссертации, граф научных интересов, гостевую книгу и другую, очень любопытную информацию.
Граф научных интересов
Магистранта Пинчук В.В. биологический факультет
Специальность ботаника
Смежные специальности
|
Основная специальность
|
Сопутствующие специальности
|
Реферат на тему «Применение информационных технологий в исследованиях Дифференциальных уранений и их приложений» 4
16 12 2014
4 стр.
Спіс абазначэнняў да выпускной работы
15 10 2014
1 стр.
Основные тенденции развития сми в XX веке и возникновение современных медиакорпораций 6
08 10 2014
1 стр.
Применение ит в исследовании лингвостилистических способов ре(де)конструкции викторианства в романах С. Уотерс
09 10 2014
1 стр.
Появление spss революция в статистическом анализе. История развития. Описание программ
26 09 2014
1 стр.
Использование Сети Интернет при изучении школы «культурного материализма» в американской антропологии 2 пол. XX века 4
11 10 2014
1 стр.
Охватывает более 50% рынка Интернет-услуг в стране и предоставляет Интернет-сервис государственным организациям. На сегодняшний день в Китае, включая Гонконг (Сянган) свыше 100 тыс
26 09 2014
6 стр.
Рефера́т (Referat, от refere — докладывать, сообщать) — письменный доклад или выступление по определённой теме, в которых обобщается информация из одного или нескольких источников.
12 10 2014
1 стр.