Tento článek je o základním hledání korelační závislosti v Excelu. Korelaci použiji, když chci posoudit, jestli dvě veličiny mají mezi sebou vztah. Chci například zjistit, jestli:

  • Čerpání lepšího paliva ovlivňuje spotřebu auta
  • Počet prodavačů v prodejně ovlivňuje tržby
  • Počet snědených dortů ovlivňuje objem pasu 🙂

V našem případě chci zjistit, jestli inzerce v rádiu ovlivňuje tržby mé prodejny. A pokud ano, tak ve kterém rádiu ze dvou zkoumaných je tato závislost větší. Mám za jednotlivé měsíce informace o tom, kolik jsem zaplatil za reklamu ve dvou rádiích a o tom, kolik jsem (možná i díky reklamě) utržil.

 korelace_vstupni_data

Jak na to.

Spočítám takzvaný korelační koeficient. Koeficient se počítá pro dvě skupiny dat a nabývá hodnoty od -1 do 1.

  • Pokud je korelační koeficient kolem -1, znamená to, že závislost je silná, ale nepřímá. Například vztah výkonnosti počítače a času, za který počítač zpracuje úlohu. Tedy čím vyšší výkon, tím kratší čas.
  • Pokud je korelační koeficient kolem 0, znamená to, že závislost není skoro žádná. Například výkon počítače a jeho barva.
  • Pokud je korelační koeficient kolem 1, znamená to, že závislost je silná a přímá. Například vztah výkonu počítače a počtu úloh, které vyřeší za hodinu. Čím vyšší výkon, tím více úloh.

Je ale třeba si uvědomit, že korelace neříká, že jeden zkoumaný parametr musí nutně ovlivňovat druhý. Mohou být oba ovlivněné něčím jiným.

Například prodej zmrzliny se vzájemně neovlivňuje s prodejem slunečníků - obojí je vyvolané teplým počasím - ale korelace by se zřejmě objevila. V našem případě, sledování reklamy, použiji funkci CORREL. Do té stačí pouze zadat dvě oblasti s daty, u kterých chci zjistit vzájemné závislosti. Výsledkem je korelační koeficient.

korelace_spocitany_korelacni_koeficient

 
V mém případě vyšel korelační koeficient pro jedno rádio 0,783914584 a pro druhé 0,397223044.
Co to znamená?
Reklama v prvním rádiu zlepšuje mé prodeje více. Možná toto rádio poslouchá vhodná cílová skupina zákazníků a je pro mě zřejmě výhodnější v něm inzerovat.
Nicméně pozitivně se na prodejích projevuje i rádio číslo dva - proto se možná vyplatí inzerovat v obou.

Kritické meze korelačního koeficientu

Když posuzuji, jestli mezi proměnnými závislost existuje nebo ne, musím zohlednit to, jestli mám dostatek dat. To je možné si spočítat nebo najít v tabulce,
Pokud chci pracovat s devadesátipětiprocentní pravděpodobností a mám 31 hodnot, potřebuji korelační koeficient kolem 36%. Obě moje rádia tento limit překročila (i když druhé jen tak tak). Proto si mohu na 95% být jistý tím, že obě rádia pozitivně ovlivňují prodeje v mé prodejně.

1 Komentář

  1. Dobrý den, pokud mám u korelační analýzy 10 hodnot, kolik budu potřebovat korelační koeficient? pokud chci pracovat s 95% pravděpodobností? Jak dospěji k tomuto číslu?

    Děkuji za odpověď

Napsat komentář

Vaše emailová adresa nebude publikována.

smazat formulářOdeslat komentář