Došlo k vyčerpání tweetů a blogových příspěvků, které nedávno mluví o problémech s použitím průměrů v marketingu PPC. Například tu, kde Julie Bacchini tvrdí, že "průměry jsou suky metrické":
I když je pravda, že někdy průměry mohou být velmi zavádějící, problémem s výše uvedeným souborem dat je obrovská variabilita počtu obyvatel a standardní odchylka ve vzorku.
$config[code] not foundV tomto příspěvku chci mluvit o matematice, která se zde zabývá, a uvažovat o hodnotě průměrů, a také reagovat na některé kritiky hlášení o průměrech, které jsem v poslední době viděl v komunitě PPC.
Odchylka, směrodatná odchylka a odchylka koeficientu
Vzorová odchylka je měřítko rozptylu - o kolik se hodnoty v sadě dat pravděpodobně liší od průměrné hodnoty vašeho souboru dat. Vypočítá se tak, že se pro každý datový bod v průměru uvažuje průměr čtverců rozdílů. Rozdělení rozdílů zajišťuje, že negativní a pozitivní odchylky se navzájem neodstraní.
Takže pro klienta 1 stačí vypočítat rozdíl mezi 0,5 procenta a průměrnou změnou o 3,6 procenta, pak čtvercovat toto číslo. Udělej to pro každého klienta, pak si vezmi průměrnost odchylek: to je tvůj vzorek rozptylu.
Vzorek standardní odchylky je jednoduše druhá odmocnina rozptylu.
Jednoduše řečeno, hodnoty v této sadě dat obvykle klesnou o 5,029% od celkového průměru 3,6% (tj. Čísla jsou velmi rozptýlená), což znamená, že z této distribuce nemůžete moc uzavřít.
Zjednodušený způsob, jak odhadnout, zda jsou vaše standardní odchylky "příliš vysoké" (za předpokladu, že hledáte normální distribuci), je vypočítat variační koeficient (nebo relativní směrodatnou odchylku), který je prostě standardní odchylkou dělenou průměrem.
Co to znamená a proč bychom měli zájem? Jedná se o hodnotu vykazování průměrných hodnot. Když WordStream provádí studii s použitím dat klienta, nevypočítáváme pouze průměry z malých datových sad a děláme velké závěry - záleží nám na distribuci dat. Jsou-li čísla přes všechna místa, vymažeme je a snažíme se segmentovat vzorek jiným způsobem (podle odvětví, výdajů atd.), Abychom našli smysluplnější vzorec, ze kterého můžeme s větší jistotou vyvodit závěry.
Dokonce i smysluplné průměry podle definice obsahují hodnoty nad a pod průměrem
Dalším směrem kritiky ze strany protiprůměrného tábora je představu, že průměrník nehovoří o celé populaci. To je samozřejmě pravda, podle definice.
Ano, průměry obsahují datové body, které jsou nad a pod průměrnou hodnotou. Ale to není velký argument pro úplné vyloučení průměrů.
Pokud předpokládáte normální distribuci, předpokládáte, že přibližně 68 procent vašich datových bodů klesne +/- 1 směrodatná odchylka od vašeho průměru, 95% v rámci +/- 2 standardních odchylek a 99,7% v rámci +/- 3 standardních odchylek, jak je ilustrováno tady.
Jak vidíte, jistě existují mimořádné hodnoty, ačkoli pokud máte ve své datové sadě standardní distribuci, nejsou tak běžné, jak byste si mysleli. Pokud jste opatrní matematiky, průměry mohou být pro velkou většinu inzerentů stále velmi užitečné informace.
V PPC marketingu získává Math
Nehodláme házet průměry s vanou. Koneckonců, téměř všechny metriky výkonnosti ve službě AdWords (MP, CPC, průměrná pozice, míry konverze atd.) Jsou uvedeny jako průměrné hodnoty.
Namísto ignorování průměrů využijte sílu matematiky, abyste zjistili, zda průměr, na který se díváte, je smysluplný nebo ne.
Přepracováno povolením. Originál zde.
Průměrná fotografie z programu Shutterstock
Více v: Obsah kanálu pro majitele stránek