ISSN 1991-3087
Рейтинг@Mail.ru Rambler's Top100
Яндекс.Метрика

НА ГЛАВНУЮ

Определение корреляции и регрессии в примерах

 

Юлдашев С. А.,

старший преподаватель,

Исломов Ё. А.,

старший преподаватель,

Садуллаева М. З.,

преподаватель.

Ташкентский институт проектирования строительства и эксплуатации автомобильных дорог.

 

Корреляционный анализ занимается степенью связи между двумя случайными величинами Х и Y.

Корреляционный анализ экспериментальных данных для двух случайных величин заключает в себе следующие основные приемы:

1.                  Вычисление выборочных коэффициентов корреляции.

2.                  Составление корреляционной таблицы.

3.                  Проверка статистической гипотезы значимости связи.

ОПРЕДЕЛЕНИЕ. Корреляционная зависимость между случайными величинами Х и Y называется линейной корреляцией, если обе функции регрессии f(x) и φ(x) являются линейными. В этом случае обе линии регрессии являются прямыми; они называется прямыми регрессии.

Для достаточно полного описания особенностей корреляционной зависимости между величинами недостаточно определить форму этой зависимости и в случае линейной зависимости оценить ее силу по величине коэффициента регрессии. Например, ясно, что корреляционная зависимость возраста Y учеников средней школы от года Х их обучения в школе является, как правило, более тесной, чем аналогичная зависимость возраста студентов высшего учебного заведения от года обучения, поскольку среди студентов одного и того же года обучения в вузе обычно наблюдается больший разброс в возраcте, чем у школьников одного и того же класса.

Для оценки тесноты линейных корреляционных зависимостей между величинами Х и Y по результатам выборочных наблюдений вводится понятие выборочного коэффициента линейной корреляции, определяемого формулой:

 (7)

где σX и σY выборочные средние квадратические отклонения величин Х и Y, которые вычисляются по формулам:

 (8)

Следует отметить, что основной смысл выборочного коэффициента линейной корреляции rB состоит в том, что он представляет собой эмпирическую (т.е. найденную по результатам наблюдений над величинами Х и Y) оценку соответствующего генерального коэффициента линейной корреляции r: r=rB (9)

Принимая во внимание формулы:

видим, что выборочное уравнение линейной регрессии Y на Х имеет вид:

 (10)

где . То же можно сказать о выборочном уравнений линейной регрессии Х на Y:

 (11)

Основные свойства выборочного коэффициента линейной корреляции:

1.                  Коэффициент корреляции двух величин, не связанных линейной корреляционной зависимостью, равен нулю.

2.                  Коэффициент корреляции двух величин, связанных линейной корреляционной зависимостью, равен 1 в случае возрастающей зависимости и -1 в случае убывающей зависимости.

3.                  Абсолютная величина коэффициента корреляции двух величин, связанных линейной корреляционной зависимостью, удовлетворяет неравенству 0<|r|<1. При этом коэффициент корреляции положителен, если корреляционная зависимость возрастающая, и отрицателен, если корреляционная зависимость убывающая.

4.                  Чем ближе |r| к 1, тем теснее прямолинейная корреляция между величинами Y, X.

По своему характеру корреляционная связь может быть прямой и обратной, а по силе – сильной, средней, слабой. Кроме того, связь может отсутствовать или быть полной.

Сила и характер связи между параметрами в таблице 1.

 

Таблица 1.

Сила связи

Характер связи

Прямая (+)

Обратная (-)

Полная

1

-1

Сильная

От 0,7 до 1

От -0,7 до -1

Средняя

От 0,3 до 0,7

От -0,3 до -0,7

Слабая

От 0,3 до 0

От -0,3 до 0

Связь отсутсвует

0

0

 

Пример 4. Изучалась зависимость между двумя величинами Y и Х. Результаты наблюдений приведены в таблице 2 в виде двумерной выборки объема 11.

 

Таблица 2.

X

68

37

50

53

75

66

52

65

74

65

54

Y

114

149

146

141

114

112

124

105

141

120

124

 

Требуется:

1)      Вычислить выборочный коэффициент корреляции;

2)      Оценить характер и силу корреляционной зависимости;

3)      Написать уравнение линейной регрессии Y на Х.

Решение. По известным формулам:

Отсюда, по (7) и (8):

 

Таким образом, следует сделать вывод, что рассматриваемая корреляционная зависимость между величинами Х и Y является по характеру – обратной, по силе – средней.

3) Уравнение линейной регрессии Y на Х:

 

Пример 5. Изучалась зависимость между качеством Y (%) и количеством Х (шт). Результаты наблюдений приведены в виде корреляционной таблицы (таблица 3).

 

Таблица 3.

Y\X

18

22

26

30

ny

70

5

 

 

 

5

75

7

46

1

 

54

80

 

29

72

 

101

85

 

 

29

8

37

90

 

 

 

3

3

nx

12

75

102

11

200

 

Требуется вычислить выборочный коэффициент линейной корреляции зависимости Y от Х.

Решение. Для упрощения вычислений перейдем к новым переменным – условным вариантам (ui, vi), воспользовавшись формулами (*) (§3) при h1=4, h2=5, x0=26, y0=80. Для удобства перепишем данную таблицу в новых обозначениях (таблица 4).

 

Таблица 4.

u\v

-2

-1

0

1

nv

-2

5

 

 

 

5

-1

7

46

1

 

54

0

 

29

72

 

101

1

 

 

29

8

37

2

 

 

 

3

3

nu

12

75

102

11

200

 

Имеем при xi=ui и yj=vj:

Таким образом:

Отсюда, 

Вывод: Корреляционная зависимость между величинами Х и Y - прямая и сильная.

 

Литература

 

1.                  В.Е. Гмурман. Теория вероятностей и математическая статистика. Высшая школа – 2001 г.

2.                  Е.С. Венцель. Теория вероятностей. Высшая школа – 2001 г.

3.                  А.Д. Мышкис. Лекции по высшей математике. Наука – 1973 г.

4.                  В.Г. Дегтяров, И.А. Лапин. Высшая математика. Ленинград – 1980 г.

5.                  Д.Т. Письменный Конспект лекций по высшей математике. Москва – 2010 г.

6.                  В.Е. Гмурман. Руководство к решению задач по теории вероятностей и математической статистике. Высшая школа – 2001 г.

 

Поступила в редакцию 28.10.2016 г.

2006-2019 © Журнал научных публикаций аспирантов и докторантов.
Все материалы, размещенные на данном сайте, охраняются авторским правом. При использовании материалов сайта активная ссылка на первоисточник обязательна.