Перейти на главную страницу
Задание 1. Выполните простой регрессионный анализ с участием независимой переменной Трев и зависимой переменной Тест 2
Представление результатов 2
Анализ криволинейных зависимостей 2
Оценка криволинейности 2
Задание 2. Выполните проверку зависимости на квадратичность (Quadratic). 3
Представление результатов 3
Задание 3. Создайте новую переменную Трев2 и включите ее в регрессионный анализ в качестве независимой. 4
Представление результатов 4
Терминология, используемая при выводе 4
Имея информацию об одной характеристике объекта, можно пытаться на основе этой информации делать выводы о другой его характеристике, связанной с исходной. Например, зная рост человека, можно попытаться оценить его возможный вес: рост человека 214 см, с определенной вероятностью можно прогнозировать, что его вес человека превысит 91 кг.
Примеры пар связанных между собой величин:
Для выполнения заданий загрузите файл exam.sav. Файл содержит 10-балльную оценку тревожности (нервной возбудимости) 36 студентов и количество решенных ими зачетных тестовых задний (из 20 возможных).
Гипотеза о линейности отношения этих двух переменных говорит о том, что чем выше нервная возбудимость студента, тем выше его результативность (например, потому, что спокойных студентов меньше волнуют их знания, а тревожные студенты проводят больше времени за подготовкой к зачету).
Зависимой переменной (критерий) выступает переменная Тест, независимой (предиктор) – переменная Трев. В задании нужно спрогнозировать значения переменной Тест по известным значениям переменной Трев, используя уравнение регрессии.
Уравнение регрессии формируется на основе общего уравнения, связывающего фактическую успеваемость студента и нервную возбудимость:
Тест истина = константа + коэффициент * Трев + Остаток.
Тест истина – переменная, отражающая реальный результат выполнения тестового задания,
константа – некоторая константа,
коэффициент – регрессионный коэффициент при значении оценки тревожности,
остаток (Residual) – статистики, оценивающие долю дисперсии зависимой переменной, не обусловленную влиянием независимых переменных.
Прогнозируемое значение будет отличаться от истинного значения. Разница показывает, что рассчитываемые результаты экзамена никогда не бывают абсолютно точными, и чтобы получить истинный результат, необходимо ввести в уравнение член, равный разности прогнозируемого и реального значений – Остаток:
Помимо нервной возбудимости, на результаты зачетного тестирования влияют другие факторы, для учета которых выполняется регрессионный анализ, учитывающий и влияние нескольких факторов.
При проведении регрессного анализа с помощью команд подменю Regression (Регрессия) вычисляются величины:
R – коэффициент корреляции, характеризует связь между значениями зависимой и независимой переменных,
р – уровень значимости (определяется для рассчитанного значения множественного коэффициента корреляции R). р < 0,05 – значимая корреляция переменных, и р > 0,05 – вероятность случайности результата слишком высока, в этом случае связь между переменными слабая или не обнаружена.
R2 – коэффициент R2 характеризует долю дисперсии одной переменной, обусловленной воздействием другой переменной.
В-величины (Константа и коэффициент уравнения регрессии) – характеризуют связь между значениями переменных Трев и Тест.
В результате применения линейного регрессионного анализа константа оказалась равной 9,3114, а коэффициент регрессии 0,6751
Для переменных Трев и Тест значение R = 0,546, a R2 = 0,298. Это означает, что 29,8 % дисперсии переменной тест объясняется влиянием независимой переменной Трев.
Уравнение для прогноза результата зачетного тестирования выглядит следующим образом:
Тест истина = Тест прогноз + Остаток
Тест прогноз=9,3114+0,6751*Трев.
С увеличением тревожности результат до определенного момента должен улучшаться, однако слишком тревожные студенты вряд ли способны сконцентрироваться и показать хороший результат. Поэтому наилучших показателей должны добиваться те студенты, чей уровень тревожности является промежуточным.
При регрессионном анализе, вне зависимости от того, является он множественным или простым, соотношение между зависимой и независимой переменными считается линейным.
В задании 1 видна значительная корреляция между, переменными Трев и Тест (R =0,546, р<0,001), но возможная ошибка прогноза велика R2 =0,298 (т.е. только 29,8 % дисперсии переменной Тест объясняется влияние переменной Трев).
Можно предположить, что если изменить вид общего уравнения (например, включить в него квадрат переменной Трев), то прогнозируемые значения будут ближе к реальным.
Для наглядности можно построить диаграмму: вертикальная ось – значения переменной Тест, горизонтальная – переменной Трев. Из графика видно, что зависимость между переменными не является линейной: имеется выраженный максимум, а при движении к краям диаграммы наблюдается убывание значений переменной Тест.
Достоверно установить характер отношений между переменными только графической интерпретацией невозможно. Необходимо применить статистические критерии.
После выполнения анализа криволинейной зависимости результаты будут представлены: таблица Результаты оценки криволинейности и Диаграмма рассеивания оценки криволинейности, по которой можно оценить, насколько близка к линейной или квадратичной зависимость между значениями переменных.
На диаграмму помимо линейной и квадратичной зависимостей нанесен разброс данных файла.
В таблицу Результаты оценки криволинейности включены значения коэффициентов В регрессии (b0, b1, b2), поэтому не сложно составить линейное и квадратичное уравнения регрессии для прогнозируемых значений. Константа и коэффициенты уравнений указаны в последних трех столбцах таблицы результатов таблицы.
Для линейной регрессии уравнение имеет вид
Из таблицы видно, что в случае линейной регрессии величина R2 (столбец квадрат в таблице выводимых результатов) равна 0,298, т. е. 29,8 % дисперсий переменной Тест обусловлено воздействием со стороны переменной Трев.
В тоже время для квадратичной регрессии, которая учитывает и линейную, и криволинейную связи, R2 = 0,675, т. е. она обусловливает 67,5 % дисперсии перемени Тест.
Малый р-уровень для обоих уравнений свидетельствует об очень высокой статистической достоверности полученных результатов.
Вывод: квадратичная регрессия описывает отношения между переменными Тест и Трев более адекватно, чем линейная.
При составлении квадратного уравнения регрессии SPSS вычисляет новую переменную, значения которой равны квадратам соответствующих значений перепой Трев.
Из школьного курса алгебры, квадратичная зависимость графически имеет вид параболы – кривой с двумя ветвями, которые могут быть направлены вверх, если коэффициент при квадратном члене положительный, или вниз, если коэффициент при квадратном члене отрицательный. Поскольку квадратное уравнение имеет не только квадратный, но и положительный линейный член, изображаемый в виде возрастающей наклонной прямой, конец левой ветви параболы расположен ниже, чем конец правой ветви.
Для включения в анализ регрессии квадрата переменной Трев, нужно создать переменную Трев2, содержащую квадраты значений переменной Трев, затем указать ее в качестве независимой переменной. Создание новой переменной начинается с диалогового окна Compute Variable (Вычисление переменной).
Отчеты представлены в виде таблиц:
Значения F-критерия и соответствующие значимости (для F и t) говорят о сильном воздействии на зависимую переменную как обеих независимых переменных, так и каждой переменной в отдельности.
Значения β для нелинейных отношений не ограничиваются диапазоном от -1 до 1. В столбце В таблицы Коэффициенты приведены коэффициенты уравнения регрессии.
Сравните эти коэффициенты с коэффициентами уравнения для квадратичной регрессии.
Задание Выполните простой регрессионный анализ с участием независимой переменной Трев и зависимой переменной Тест 2
06 10 2014
1 стр.
Обобщением линейной регрессионной модели с двумя переменными является многомерная регрессионная модель (или модель множественной регрессии). Уравнение множественной регрессии может
06 10 2014
1 стр.
Рабочая программа дисциплины "Линейная алгебра" предназначена для студентов 1 курса
15 10 2014
1 стр.
Физиологическая возрастная регрессия как основа функциональных состояний, связанных с измененными состояниями сознания
06 10 2014
1 стр.
Регрессия, это инструмент статистики, на субъективность которого информатики могут сваливать все свои ошибки
06 10 2014
1 стр.
Ендеше біз регрессия теңдеуінің параметрлерін бағалау дәлірек мәніне ие боламыз: Теңдеудің оң және сол жақтарын бөлеміз, сонда
23 09 2014
1 стр.
Укажите формулу расчета наращенной суммы, когда применяется простая процентная ставка, дискретно изменяющаяся во времени
06 10 2014
1 стр.
Эконометрика, Математический анализ, Микроэкономика, Макроэкономика, Дифференциальные и разностные уравнения, Дискретные математические модели, Методы оптимальных решений
18 12 2014
1 стр.