Головна Головна -> Реферати українською -> Математика -> Коефіцієнт кореляції та детермінації

Коефіцієнт кореляції та детермінації

Назва:
Коефіцієнт кореляції та детермінації
Тип:
Реферат
Мова:
Українська
Розмiр:
44,93 KB
Завантажень:
496
Оцінка:
 
поточна оцінка 3.7


Скачати цю роботу безкоштовно
Пролистати роботу: 1  2 
Побудова кореляційних моделей дає можливість вивчати залежність економічних показників, що не зв’язані між собою функціонально. Кореляційний зв’язок на відміну від функціонального проявляється лише взагалі та в середньому і тільки в масі спостережень.

Кореляційний аналіз вирішує два завдання:

1) визначення форми зв’язку, тобто встановлення математичної формули, яка описує даний зв’язок;

2) вимірювання щільності зв’язку.

У найпростішому випадку вивчається зв’язок між двома показниками, один з яких розглядається як незалежний показник – факторна ознака (х), а інший – як залежна величина, результативна ознака (у). Це є так звана “парна кореляція”. В загальному вигляді вона описується функцією у=ƒ(х).

Попередньо вид математичної функції встановлюється за допомогою якісного аналізу зв’язку між явищами та графічного його зображення у вигляді кореляційного поля.

Кореляційне поле – це сукупність точок у прямокутній системі координат, абсциса кожної з яких відповідає значенню факторної ознаки (х), а ордината – значенню результативної ознаки (у) певної одиниці спостереження. Кількість точок на графіку відповідає кількості одиниць спостереження. Напрямленість кореляційного поля вказує на наявність прямого, зворотного зв’язку між ознаками, або його відсутність, а також на форму лінії регресії (пряма лінія, парабола, гіпербола тощо).

Після того, як визначені невідомі параметри регресійної моделі спробуємо оцінити щільність зв’язку між залежною величиною у і незалежною х. Тобто спробуємо відповісти на запитання, наскільки значним є вплив змінної х на у. Чи є якийсь критерій, який дозволяє кількісно оцінити цей вплив? Найпростішим критерієм, який дає кількісну оцінку зв’язку між двома показниками є коефіцієнт кореляції (для прямолінійного зв’язку). Він розраховується за такою формулою:

Щільність зв’язку між ознаками вимірюється за допомогою коефіцієнта кореляції (для прямолінійного зв’язку) та індексу кореляції (для криволінійного зв’язку).

Коефіцієнт кореляції може бути обчислений також за формулою:

,

де – середній добуток ознак х та у;

– середнє значення ознаки відповідно х і у;

σх – середнє квадратичне відхилення ознаки х; σу – середнє квадратичне відхилення ознаки у.

; ,

Коефіцієнт кореляції на відміну від коефіцієнта коваріації є вже не абсолютною, а відносною мірою зв’язку між двома ознаками, тому він може набувати значення від -1 до +1. Чим ближче значення r до ±1, тим щільніший зв’язок. Знак “+” вказує на прямий, а знак “-“ – на зворотний зв’язок. При r=0 зв’язок відсутній.

Поряд з коефіцієнтом кореляції використовується ще один критерій, за допомогою якого також вимірюється щільність зв’язку між двома або більше показниками та перевіряється адекватність (відповідність) побудованої регресійної моделі реальній дійсності. Тобто дається відповідь на запитання, чи дійсно зміна значення у лінійно залежить саме від зміни значення х, а не відбувається під впливом різних випадкових факторів. Таким критерієм є коефіцієнт детермінації.

Щоб пояснити, що саме являє собою коефіцієнт детермінації та як він пов’язаний з коефіцієнтом кореляції, розглянемо питання про декомпозицію дисперсій.

У статистиці різницю прийнято називати загальним відхиленням. Різницю називають відхиленням, яке можна пояснити, виходячи з регресійної прямої. Різницю називають відхиленням, яке не можна пояснити, виходячи з регресійної прямої, або не пояснюваним відхиленням. Загальне відхилення розкладається на дві складові:

= +

Піднесемо ці різниці до квадрату і просумуємо для всіх одиниць спостереження. Одержимо:

- загальна сума квадратів

- сума квадратів, що пояснює регресію;

- сума квадратів помилок.

Справедливий такий вираз:

= + .

Поділивши цей вираз на п, отримаємо вираз для дисперсій:

+ ,

де

- загальна дисперсія ознаки у;

- дисперсія, що пояснює регресію;

- дисперсія помилок.

Таким чином ми здійснили декомпозицію дисперсії, тобто розклали загальну дисперсію на дві частини: дисперсію, що пояснює регресію, та дисперсію помилок (або дисперсію випадкової величини). Запишемо це у такому вигляді:

.

Поділимо обидві частини на загальну дисперсію і отримаємо:

У цьому виразі перша частина – це частка дисперсії, що пояснюється регресією, а друга – частка помилок в загальній дисперсії.

Частина дисперсії, що пояснює регресію, називається коефіцієнтом детермінації і позначається r2. Коефіцієнт детермінації використовується як критерій адекватності моделі, бо є мірою пояснювальної сили незалежної змінної х.

Коефіцієнт детермінації визначається за формулою:

, або

Коефіцієнт детермінації завжди позитивний і перебуває в межах від нуля до одиниці. Він показує, яка частка коливань результативної ознаки y зумовлена коливанням факторної ознаки х.

Завантажити цю роботу безкоштовно
Пролистати роботу: 1  2 



Реферат на тему: Коефіцієнт кореляції та детермінації

BR.com.ua © 1999-2017 | Реклама на сайті | Умови використання | Зворотній зв'язок