Як знайти коефіцієнт кореляції?
У математичній статистиці кореляцією є статистична та імовірнісна залежність, яка не володіє строгим функціональним характером. Кореляційна залежність з'являється в тому випадку, коли одна з ознак є залежним як від даного другого, так і від ряду інших випадкових факторів. Коефіцієнт кореляції служить математичної мірою залежності двох випадкових величин.
Види коефіцієнтів кореляції можуть бути негативними і позитивними. Розрахунки, що виконуються за допомогою кореляції, не є дуже складними, але вимагають особливої уважності від виконавця при розрахунках. При цих обчисленнях вам обов'язково знадобиться інженерний калькулятор. Перш ніж з'ясувати, як знайти коефіцієнт кореляції, необхідно усвідомити сенс значень коефіцієнтів:
- У тому випадку, коли значення по модулю розташовується ближче до 1, то це прямий показник наявності сильного зв'язку.
- Якщо ж значення розташовується ближче до 0, то це вже означає слабку зв'язок або взагалі її відсутність.
- Коли коефіцієнт кореляції дорівнює 1, тоді мова йде про функціональну зв'язку, що свідчить про можливість опису за допомогою математичної функції зміни двох величин.
Порядок і метод розрахунку коефіцієнта кореляції
Знайти вибірковий коефіцієнт кореляції, можна двома методами:
- ранговий метод, або метод Спірмена,
- метод квадратів, або метод Пірсона.
Ранговий метод
Ранговий метод полягає в наступному алгоритмі дій:
- Потрібно скласти два ряди, що складаються з парних зіставляються ознак. При цьому вводимо наступні позначення: перший ряд - х і другий ряд - у. Перший ряд ознаки необхідно представити в зростаючому або ж порядку спадання. Числові ж значення другого ряду володіємо навпроти значень першого ряду.
- Потім у кожному з рядів порівняння замінюємо порядковим номером (рангом) величину ознаки. Номерами (рангами) позначаються місця показників, або значень, першого і другого рядів. А числовим значенням другої ознаки повинні присвоюватися ранги абсолютно в такому ж порядку, як і при роздачі першої ознаки їх величинам. Необхідно врахувати, що якщо ознака в ряду має однакові величини, то ранги необхідно визначати у вигляді середнього числа із суми порядкових номерів даних величин.
- Далі визначаємо різницю рангів між показниками: (d) = х- у.
- Після цього зводимо в квадрат отриману різницю рангів (d2).
- І в ув'язненні отримуємо суму квадратів різниці, після чого підставляємо всі отримані значення в наступну формулу: Pxy = 1- (6? D2) / N (n2-1).
Метод квадратів
Метод квадратів включає в себе наступний алгоритм:
- Для того щоб знайти коефіцієнт кореляції спочатку необхідно побудувати для кожного з зіставляються ознак варіаційні ряди. Позначаємо перший ряд - х і другий ряд - у. Тепер визначаємо середні значення (М1 і М2) Для кожного варіаційного ряду.
- Далі знаходимо відхилення кожного числового значення (dх і dy) Від середнього значення ряду.
- Перемножуємо отримані відхилення і зводимо кожне відхилення в квадрат, після чого підсумовуємо по кожному ряду.
- Потім необхідно підставити всі отримані раніше значення у формулу і таким чином знайти коефіцієнт кореляції: rxy =? (Dx * dy) / (sqrt (? D2x) *? D2y).
- Якщо є обчислювальна техніка, то розрахунок можна провести за такою формулою, також цю форму розрахунку можна використовувати в програмах, написаних мовою Паскаль: rxy= (N? Xy - /? X *? Y) / (sqrt ([n? X2- ?x2] - [N? Y2- ?y2])).