Ekonometrian käsitteet / sanasto / termit

Aivan samalla tavoin kuin digimarkkinointi tai analytiikka, myös ekonometria vilisee ammattijargonia, jota ymmärtämättömille ekonometria ei avaudu. Tässä ekonometrian termejä selkokielellä, ja usein esimerkillä höystettynä, jolloin on helpompi ymmärtää, mitä milläkin termillä tarkoitetaan.

Regressioanalyysi

Regressioanalyysi on tilastotieteen menetelmä, jonka avulla pyritään tarkastelemaan jonkin muuttujan riippuvutta valituista selittävistä muuttujista. Regressioanalyysi on ekonometrian yleisin menetelmä. Sen tuloksena saadaan mm. mallin selitysaste, sekä voidaan laskea kunkin selittävän muuttujan yhteys selitettävään muuttujaan. Yksittäisten selittävien muuttujien kulmakertoimien laskenta onkin usein regressioanalyysin päätarkoitus: esimerkiksi kuinka paljon myynti nousee, kun kasvatetaan markkinointipanostuksia yhdellä yksiköllä valittuun kanavaan? Entä jos panostus on nolla, paljonko myynti on silloin (vakion arvo)?

Regressioanalyysia voidaan käyttää lukemattomilla eri aloilla, kuten taloustiede, lääketiede, yhteiskuntatiede. Viime aikoina regressioanalyysi on yleistynyt voimakkaasti markkinointianalytiikassa, jossa se täydentää hyvin esimerkiksi perinteistä Web-analytiikkaa ja markkinoinnin tehokkuuden mittaamista, erityisesti koska se ei ole sidottu vain verkossa tapahtuviin myynteihin ja markkinointitoimiin.

Regressioanalyysia voimme siten hyvin hyödyntää, kun laskemme vaikkapa sanomalehti- tai TV-panostusten yhteyttä kivijalkamyymälöissä tapahtuvaan myyntiin. Asian tutkimiseksi tarvitsemme vain riittävästi dataa: havaintopareja (panostus - myynti) esim. eri viikkoina tai päivinä. Mitä enemmän meillä on dataa, sitä tarkempia arvioita voimme saada. Markkinointipanostusten ekonometrisessä mallintamisessa pyritään usein keräämään kahden vuoden aineisto, jonka pohjalta regressioanalyysi lasketaan.

Korrelaatio, riippuvuus (correlation)

Kahden muuttujan välinen yhteisvaihtelu, eli kun esimerkiksi tuotteen hinta nousee, myynti helposti laskee. Silloin sanotaan, että hinnan ja myyntimäärien välillä on negatiivinen korrelaatio. Kun korrelaatio on positiivinen, toisen muuttujan kasvaessa toinenkin nousee. Esimerkiksi jos markkinointipanostus toimii toivotulla tavalla, myynti kasvaa tietyssä suhteessa, kun panostus kasvaa. Ekonometrian avulla voidaan laskea tai ennustaa, paljonko myynti kasvaa, kun panostusta nostetaan tietyllä määrällä.

On tärkeä muistaa, että vahvakaan korrelaatio kahden muuttujan välillä ei todista syy-seuraus-suhdetta. Esimerkiksi koulutusaste korreloi bruttokansantuotteen kanssa, mutta ei voida olla varmoja, kumpi on syy, kumpi seuraus. Joko korkea koulutustaso voi kohottaa bruttokansantuotetta, tai sitten onkin niin, että kun BKT on korkea, on varaa paremmin kouluttaa väestöä.

Korrelaatiokerroin (coeffecient of correlation)

Kahden muuttujan välistä riippuvuutta voidaan mitata laskemalla niiden välinen korrelaatiokerroin. Pearsonin korrelaatiokerroin on muuttujien mittayksiköistä riippumaton tunnusluku, ja sen suuruuteen ei vaikuta muuttujien järjestys. 

Pearsonin korrelaatiokerroin lasketaan kaavasta, jossa muuttujien välinen kovarianssi jaetaan keskihajontojen tulolla. Silloin saadaan lukuarvoja, jotka vaihtelevat vain -1:n ja +1:n välillä. Eli muuttujien välillä voi olla negatiivinen tai positiivinen korrelaatio, tai korrelaatio voi olla nolla, jolloin muuttujien välillä ei ole suoraviivaista riippuvuutta.

Korrelaatiokertoimen arvo +1 tarkoittaisi sitä, että kaikki havaintopisteet sijaitsevat samalla nousevalla suoralla.

Korrelaatiokertoimen arvo -1 tarkoittaisi, että kaikki havaintopisteet sijaitsevat samalla laskevalla suoralla.

Regressiosuora, Regressiokerroin, kulmakerroin (coeffecient of correlation, slope coefficient)

Regressioanalyysissa lasketaan regressiosuoran kulmakerroin (correlation coefficient) kullekin selittävälle muuttujalle. Kulmakertoimen laskukaava on varsin yksinkertainen, jos selittäviä x-muuttujia on vain yksi: x- ja y-muuttujien kovarianssi jaetaan x-muuttujien varianssilla.

Ko. muuttujan regressiosuora on laskeva suora, jos kulmakerroin selitettävän muuttujan kanssa on negatiivnen, ja puolestaan nouseva suora, jos korrelaatio on positiivinen sekä vaakasuora, jos korrelaatio on nolla.

Regressiokerroin kertoo suoraan, kuinka paljon selitettvän y-muuttujan arvo muuttuu, kun selittävä x-muuttuja kasvaa yhden yksikön. Tätä kutsutaan myös termillä marginaalivaikutus.

Regressiosuoran vakio (intercept) kertoo, missä kohtaa regressiosuora leikkaa y-akselin. Silloin vakiotekijä pyrkii kuvaamaan y:n arvoa silloin, kun x:n arvo on nolla. Mikä on esimerkiksi yrityksen myynti silloin, kun markkinointipanostus kanavaan x on nolla?

Regressioanalyysin hajontakaaviossa edellä mainittu Pearsonin korrelaatiokerroin voidaan esittää etäisyytenä, kuinka lähellä regrerssiosuoraa havainnot ovat.

Regression korrelaatiokerroin, Multiple R

Regressioanalyysin tilastollisessa yhteenvedossa esitetään lisäksi Multiple R, joka käännetään vain korrelaatiokertoimeksi. Tämä korrelaatiokerroin onkin sama kuin Pearsonin korrelaatiokerroin, joka voidaan laskea myös Excelin funktiolla KORRELAATIO, mutta vain silloin, kun tarkasteltavia selittäviä muuttujia on vain yksi. 

Mutta silloin, kun selittäviä muuttujia on useampia, Multiple R kuvastaa selittävien muuttujien yhteistä korrelaatiota selittävän muuttujan kanssa, englanniksi the multiple R is the coefficient of multiple correlation.

Mallin selitysaste, R2, R Squared, coefficent of determination

Lineaarisen regression Multiple R:n neliö R2 (engl. R Squared) on puolestaan regressiomallin selitysaste. Se määritellään varsinaisesti siten, kuinka suuren osan selitettävän muuttujan vaihtelusta regressiomalli yhteensä selittää. Laskukaava on R2 = RSS / TSS, jossa RSS on regressiomallin Sum of Squares eli neliösumma, TSS = Total Sum of Squares, eli kokonaisvaihtelu. TSS saadaan laskukaavasta, jossa lasketaan selitettävän muuttujan havaintoarvojen ja niiden keskiarvon erotuksten neliösumma, tästä siis tuo nimitys neliösumma eli Sum of Squares. TSS:n eli totaalivaihtelun ja mallin selittämän vaihtelun RSS erotus on ESS, eli residuaalien  (jäännöstermien) neliösumma.

Estimointi, estimaattorit, estimaatit

Estimoinnilla tarkoitetaan sitä, että otokseen perustuen pyritään etsimään parasta arviota perusjoukon parametrin oikealle arvolle. Estimaattori on estimoinnissa käytettävä otossuure, estimointikaava, jonka avulla lasketaan havaintoaineistosta lukuja, estimaatteja, joka on estimaattorin arvo.

Estimaattoria kuvaillaan seuraavanlaisilla termillä:

  • estimaattori on harhaton (unbiased), jos estimaattori osuus keskimäärin oikeaan, jolloin sen otosjakauman odotusarvo on estimoitavan parametrin arvo. Harha on odotusarvon poikkeama estimoitavan parametrin arvosta.
  • estimaattori on asymptootteisesti harhaton, kun harha lähestyy nollaa, kun otoskoko kasvaa
  • estimaattori on tehokas (efficient), jos estimaattori on asymptoottisesti harhaton ja sillä on pienin mahdollinen varianssi
  • estimaattori on tarkentuva (consistent), jos estimaattorin varianssi lähestyy asymptoottisesti nollaa, eli otoskoon kasvaessa estimaattorin arvot keskittyvät yhä tiiviimmin parametrin todellisen arvon ympärille

Edellä mainitusta voidaan hyvin päätellä, että pienillä otoskoolla harvoin saadaan tarkkoja estimaattoreita, ja mitä enemmän saadaan havaintopareja usein estimaattorikin tarkentuu. On hyvä muistaa myös se, että kun meillä on havaintoja vain tietyiltä skaalalta x-akselia, regressiosuorankaan ei voida olettaa pätevän havaintoalueen ulkopuolella. Siten jos markkinointipanostukset vaihtelevat vaikka kuukausittain 10.000 euron ja 200.000 euron välillä, emme regressiosuoran avulla pysty välttämättä ennustamaan regressiomallin avulla myyntiä yli 200.000 euron panostuksilla. Uudet havainnot jälleen tarkentavat estimaattoria.

Kovarianssi (covariance) Kovarianssilla tarkoitetaan kahden muuttujan yhteisvaihtelua. Termiä käytetään tilastollisen riippumattomuuden määrittelyssä. Jos kaksi satunnaismuuttujaa on toisistaan riippumattomia, niiden yhteisvaihtelu eli kovarianssi on nolla.

PNS (OLS), Pienimmän neliösumman menetelmä, Ordinary Least Squares

PNS eli englanniksi OLS on yleisimmin regressioanalyysissa käytetty estimaattori erityisesti ekonometriassa. Tämä johtuu siitä, että kun tietyt lineaarisen regressioanalyysin edellytykset täyttyvät, OLS on ei ole ainoastaan yksi, vaan paras (tehokkain) harhaton estimaattori.  Tämä perustuu Gauss Markovin teoreemaan, jonka mukaan tiettyjen edellytysten täyttyessä OLS tuottaa Best Linear Unbiased Estimator = BLUE. "Parhaalla" viitataan tässä alhaisimpaan varianssiin verrattuna muihin harhattomiin estimaattoreihin.

Keskivirhe (Standard error)

Regressioanalyysin selittävän muuttujan keskivirhe (standard error) raportoidaan jokaiselle analyysiin mukaan otetulle tekijälle sekä koko mallille erikseen. Keskivirhe mittaa sitä, kuinka kaukana saadut havainnot keskimäärin olivat mallin regressiosuorasta. Mitä pienempi ero, sitä parempi.

Keskihajonta (standard deviation)

Keskihajonta eli standardipoikkeama on tärkein hajontaluku. Se mittaa havaintoarvojen hajaantumista keskiarvon ympärillä. Kahdella muuttujalla voi olla täysin sama keskiarvo, mutta niiden hajonta voi olla täysin erilainen. Siksi keskiluvun rinnalla esitetään usein myös hajontaluku.

Keskihajonnan neliö on nimeltään varianssi.

T-testi, testisuure, p-arvo, F-testi

Regressioanalyysissa jokaisen selittävän muuttujan kulmakertoimen tilastollinen merkitsevyys lasketaan. Studentin T-testin testisuureen t-arvo saadaan suoraan jakamalla kulmakerroin keskivirheellä (Coefficient of correlation/ Standard error), ja t-jakaumien taulukosta tai Excelistä saadaan kriittinen raja-arvo, jonka testisuureen pitää alittaa, jotta muuttujan kerrointa voidaan pitää nollaa suurempana tilastollisten kriteerien mukaan. SIten saamme todennäköisyydet sille, että kerroin on nollaa suurempi esimerkiksi 99 % varmuudella, jolloin mahdollisuus siihen, että tulos selittyy pelkällä sattumalla on enää 1%.

T-testin lisäksi on käytettävissä p-arvo, joka lasketaan myös jokaiselle selittävälle muuttujalle. Mitä pienempi p-arvo, sitä enemmän tukea saadaan nollahypoteesia vastaan, jonka mukaan kerroin onkin nolla. P-arvon avulla saadaan siis tilastollinen varmuus, esim. 95% ja 99% varmuus sille, että kerroin ei ole nolla. Suuri p-arvo hälyttää vastaavasti siitä, että kerroin ei ehkä olekaan merkittävä eikä sitä välttämättä kannata ottaa lainkaan regressiomalliin mukaan.

Koko regressiomallille, esimerkiksi 10 eri muuttujan mallille, saadaan vielä F-testin avulla tilastollinen testi, joka kertoo, pystytäänkö regressioanalyysissa mukana olevilla muuttujilla selittämään riippuvan muuttujan vaihtelua. Nollahypoteesina on, että kaikkien muuttujien vaikutus on nolla, jolloin sitä ei ole vaikea kumota. Voikin joskus käydä niin, että yhdenkään muuttujan regressiokerroin ei ole tilastollisesti merkitsevä, mutta koko mallin F-testin tulos on. Silloin siis yksikään muuttuja yksin ei ole tilastollisesti merkitsevä, mutta mallin muuttujat yhdessä pystyvät silti selittämään y-arvon vaihtelua.

Varianssi (variance)

Varianssi on tilastollista hajontaa mittaava termi. Se ilmoittaa, miten suuria keskimäärin ovat neliöidyt poikkeamat keskiarvosta.

Kun varianssi on pieni, muuttujien arvot keskittyvät odotusarvon ympärille tiiviisti. Vastaavasti jos arvot ovat hajallaan odotusarvon ympärillä, varianssin arvo on suuri.

Vapausasteet (degrees of freedom)

Regressioanalyysin tulosteissa näkyy vapausasteiden (degrees of freedom) määrä regressiomallille, residuaaleille ja yhteenlaskettu vapausasteiden määrä. Vapausasteiden määrä sisältyy moniin laskukaavoihin, ml. merkitsevyystestien testisuureiden ja keskihajonnan laskentaan. Vapausasteiden kokonaismäärä on havaintojen määrä miinus 1. Regressimallien vapausasteiden määrä on sama kuin malliin mukaan otettujen selittävien muuttujien määrä.

Virhetermi, jäännöstermi (error term/disturbance, residual)

Virhetermiä ja jäännöstermiä eli englanniksi error term / residual käsitellään monessa opetusmateriaalissakin täysin synonyymeinä, vaikkakin tarkalleen ottaen teorian populaatioregressiomallissa on virhetermi ε (disturbance/error term), jolle on listattu useita oletuksia, joita sen tulisi täyttää. Virhetermi on määritelmällisesti havaintoarvon poikkeama todellisesta (siis koko populaatiosta lasketusta) parametrin arvosta: "An error term in statistics is a value which represents how observed data differs from actual population data." Regressiomallissa voitaisiin vastaavasti puhua ennustevirheestä ε, joka on siis muuten deterministisen, suoraan kaavasta johdettavan mallin virheosa.

Käytännön estimoinnissa, kun kyse on otoksen parametrien arvojen estimoinnista, meillä ei ole aina edes tietoa todellisesta parametrin arvosta, ja siksi usein virhetermin sijasta puhutaankin jäännöstermistä (residual), joka mitataan sillä, kuinka paljon havaintoarvo poikkeaa regressiomallin perusteella esim. lineaarisen regressiosuoran ennustetusta arvosta - todellista arvoa kun ei aina tiedetä. Jäännöstermi on ikään kuin estimaatti todellisesta virhetermistä: havaitun arvon ja selitettävän muuttujan y sovitteesta (fit) (joka on saatu regressiomallin kaavasta) laskettu erotus.

Näitä teoreettisia eroja sekoittaa tietenkin sitten se, että käytännön regressioanalyyseissa hyvin usein sekä x:n että y:n arvot tunnetaan, esimerkiksi markkinointipanostus-myyntiluvut tai asunnon neliöt ja muut hintaan arvioidut asunnon hintaan vaikuttavat tekijät sekä toteutunut asunnon myyntihinta, jolloin selitettävän muuttujan y arvot todellakin tiedetään ja ne ovat faktoja, eivätkä mitään pelkkiä kaavasta laskettuja ennustearvoja.

Kuvaavaa on, että suomenkielisessä Wikipediassa virhetermi ja residuaali selitetään synonyymeina, englanninkielisessä Wikipediassa niiden välillä on "hienon hieno, mutta tärkeä ero"!

Odotusarvo (expectation), Satunnaismuuttujat (random variable)

Odotusarvoksi kutsutaan satunnaisilmiön tuottamien lukujen odotettavissa olevaa arvoa. Numeerisia lukuarvoja tuottavia satunnaisilmiöitä kutsutaan satunnaismuuttujiksi. 

Matemaattisesti määritellään erikseen diskreetti ja jatkuva satunnaismuuttuja.

Diskreetistä satunnaismuuttujasta esimerkkinä voi olla kuusitahoinen arpakuutio, jonka kaikkien pistelukujen todennäköisyys on sama. Matemaattisen kaavan mukaan arpakuutiota heittämällä pelaaja voi laskea odotusarvoksi etenevänsä noin 3,5 askelta heittokierrosta kohti. Tämä luku lasketaan siis kaavalla, jossa on mukana mahdollisten arvojen joukko ja niiden esiintymistodennäköisyys.

Jatkuva satunnaismuuttuja on satunnaismuuttuja, joka voi saada vain ei-negatiivisia arvoja, joiden jakaumaa voidaan kuvata todennäköisyys- eli tiheysfunktiolla. Esimerkkinä pilkkikilpailussa saatujen kalojen painot. Jatkuvan satunnaismuuttujan mahdollisia arvoja on ääretön määrä, eikä eri muuttujien todennäköisyyksiä voi luetella, vaan ne on lausuttava lausekkeen muodossa. 

Jatkuvat satunnaismuuttujat liittyvät usein laskelmiin, joissa käsitellään jatkuvia suureita, kuten paino, pituus, pinta-ala, aika, nopeus, lämpötila, rahamäärä tai korko. Siten esimerkiksi verkkokaupan päivittäinen myyntiluku olisi tyypillinen jatkuva satunnaismuuttuja.

Stokastinen prosessi

Stokastisella prosessilla tarkoitetaan matemaattisia prosesseja, joilla pyritään kuvaamaan todellisuuden prosesseja, jotka etenevät ajassa sattumanvaraisesti. Esimerkkinä vaikkapa lämpötilan satunnaiset heilahtelut mittausasemalla. Vaikka meillä olisi kuinka paljon mittaushistoriaa menneistä lämpötiloista eri vuosina, kehityksen ennustaminen tarkasti ei satunnaisuuden takia ole mahdollista. Satunnaismuuttujaa kutsutaankin stokastiseksi muuttujaksi.

Stationaarinen aikasarja

Stationaariseksi kutsutaan sellaista aikasarjaa, jossa sen tilastolliset ominaisuudet (kuten keskiarvo, varianssi) eivät muutu systemaattisesti ajan kuluessa. Useimmat aikasarja-analyysin menetelmät vaativat normaalijakautuneen ja stationaarisen aikasarjan, ja siksi usein tehdään aikasarjaan muunnoksia ennen analyysiä: esimerkiksi lasketaan logaritmi- tai neliöjuurimuunnokset.

Deterministinen osa aikasarjaa

Aikasarja voidaan jakaa kahteen pääkomponenttiin: deterministinen osa ja satunnaisvaihtelu. Determinististä osaa edustavat esimerkiksi trendit,  kausivaihtelut vuoden sisällä, suhdannevaihtelut.

Aikasarjaan usein sovellettava regressiomalli on AR eli Autoregressive, jossa aikasarjan edelliset havainnot ovat mallin selittäjinä.

Yksikköjuuri (Unit root)

Stokastisen ja deterministisen trendin erottaa yksikköjuuri (unit root). Stokastisessa trendissä on yksi tai useampi yksikköjuuri, ja jos yksikköjuurta ei ole, prosessia voidaan mallintaa deterministenä trendinä.

Dickey-Fullerin testillä voidaan testata yksikköjuuren olemassaolo. Nollahypoteesina on, että yksikköjuuri on olemassa, jolloin kyse on stokastisesta trendistä. Vaihtoehtoinen hypoteesi on, että aikasarja on stationaarinen.

 

 

 

 

 

 


Regressioanalyysin edellytykset tai rajoitteet

Regressioanalyysin käyttö on viime vuosina yleistynyt tilastollisena analyysimenetelmänä voimakkaasti, mutta samalla on huomattu, että sitä käytetään surutta silloinkin, kun sen edellytykset eivät täyty. Idea on tietysti se, että näiden edellytysten pitää täyttyä, jotta regressioanalyysista saataisiin luotettavia tuloksia. Käydään seuraavassa läpi lineaarisen regressioanalyysin edellytykset. Yksinkertaisuuden vuoksi käsitellään tässä yhden muuttujan mallia, vaikka selittäviä muuttujia voi tietysti regressioanalyysissa olla yksi tai useampia.

1) Lineaarisuus

2) Virhetermien vaihtelu eli varianssi säilyy vakiona = homoskedastisuus (jonka vastakohta on heteroskedastisuus, jolloin virhetermien varianssi vaihtelee)

3) Selittävä muuttuja ei saa korreloida virhetermin kanssa; endogeenisyysongelma

4) Virhetermien riippumattomuus toisistaan; ei autokorrelaatiota

5) Virhetermien normaalijakautuneisuus

6) Ei täydellistä multikollineaarisuutta

Toisinaan rajoitteena mainitaan lisäksy joskus poikkeavat havainnot eli englanniksi outliers - edellytykseksi niitä on kuitenkaan turha listata, koska ei poikkeavilta havainnoilta voi oikeassa elämässä täysin välttyä. Parasta tietysti olisi, jos vahvasti poikkeavia havaintoja ei olisi lainkaan, ja jos niitä ilmenee, on syytä tutkia, ettei ole ainakaan koodaus- tai mittausvirheestä kyse. Jos poikkeamat ovat todellisia, kannattaa alkaa miettiä, onko jokin selittävä tekijä, joka selittää poikkeaman, ja lisätä se malliin. Esimerkkinä asuntojen myyntihinnoissa voidaan havaita suuria poikkeamia ennusteesta, ja löytää selittävä tekijä - esimerkiksi merinäköala tai tulossa oleva putkiremontti - joka selittääkin suuret poikkeamat ennustettuun hintaan nähden.

Virhetermi tarkoittaa siis teoreettisesti regressiomallin selittämättä jäänyttä osaa, jonka suuruutta ei voi tietää. Estimoitaessa jäännöstermi lasketaan selitettävän muuttujan y:n havaitun arvon ja sen mallin perusteella ennustetun arvon, sovitteen erotuksena. Hyvässä mallissa jäännöstermi on pieni ja täysin satunnainen.

Miten edellytysten toteutumista mitataan?

Mistä sitten voidaan analysoida, täyttyvätkö nämä lineaarisen regressioanalyysin edellytykset? 

1) Lineaarisuuden tarkastelu

Regressiomalleja on toki muitakin kuin lineaarisia, mutta lineaarisesta mallista puhutaan silloin, kun y- ja x-muuttujien välillä on lineaarinen eli suoraviivainen yhteys. Tämä ilmenee tietysti helposti graafisesta hajontakuviosta (scatter plot), josta voidaan tarkastella, sijaitsevatko havaintoparit kuviossa lineaarisella trendillä, joka voi olla nouseva tai laskeva. 

Toiseksi voidaan tarkastella esim. Excelin regressioanalyysin jäännöstermikuviota (residual plot). Siinä vaaka-akselilla selittävä muuttuja, pystyakselilla virhetermi eli y:n ja sen ennusteen erotus. Jäännösten tulisi olla symmetrisesti x-akselin molemmin puolin, ilman havaittavaa trendiä tai rakennetta.

Mallin selitysaste R - mitä lähempänä se on ykköstä, sitä tarkemmin lineaarista suoraa havainnot seuraavat.

2) Homoskedastisuus, jäännöstermien varianssi, onko vakio

Regressioanalyysin yhtenä oletuksena on, että jäännöstermien varianssin tulisi olla likimain vakio kaikilla selittävän muuttujan arvoilla. Vastakkaisessa tilanteessa eli heteroskedastisuudessa havaitaan, että jäännöstermien vaihtelun voimakkuus muuttuu x-asteikon eri arvoilla, eli esimerkiksi suuremmilla x:n arvoilla jäännöstermien vaihtelu alkaa voimistua.

Tietenkin voidaan grafiikasta jo tarkastella jäännöstermikuviosta, säilyykö jäännöstermien vaihtelu vakiona. Lisäksi on tarjolla käytetystä ohjelmistosta riippuen erilaisia testejä, joiden avulla voidaan testata varianssia, onko se vakio:

  • F-testi kahden varianssin eron testaamiseen, eli esim. puolitetaan jäännökset kahteen osaan ja verrataan onko eroja
  • Levenen testi useamman kuin kahden varianssin testaamiseen
  • BP-testi eli Breusch-Pagan testi
  • White test
  • Brown-Forsythe test

Testien ideana on tietenkin saada testiarvo, jota verrataan kriittiseen arvoon, ja sen perusteella hyväksytään tai hylätään nollahypoteesi, ja saadaan vahvaa näyttöä homoskedastisuudelle. Todennäköisyyttä voidaan testata eri merkitsevyystasoilla, jolloin saadaan mitattua esim. 1% tai 5% varmuus sille, että tulos ei johdu sattumasta. Jos käytössä on pelkästään Excel, niin F-testille on funktio FTEST (suomenkielisessä FTESTI). 

3) Selittävä muuttuja ei saa korreloida virhetermin kanssa, eksogeenisyys

Jos selittävä muuttuja mallissa korreloi virhetermin kanssa, meillä on ns. endogeenisyysongelma. Silloin pienimmän neliosumman estimointiemenetelmällä ei saada luotettavia estimaatteja mallin parametreistä, vaan estimaattori on harhainen (biased) ja tarkentumaton (incosistent). Yleisimmät tilanteet, jolloin endogenisyyttä esiintyy, ovat puuttuvat selittävät muuttujat, mittausvirheet selittävissä muuttujissa ja samanaikaisuusharha (esimerkiksi hallitus päättää lisätä poliisivoimia, kun rikollisuus on kasvussa, jolloin molemmat kasvavat samanaikaisesti, sekä rikollisuus että poliisivoimien määrä).

Endogeenisyyttä voidaan testata esimerkiksi (Durbin-Wu-)Hausmanin testillä, joka vertailee OLS- ja IV-estimaattoreita, ja niiden regressiokertoimia sekä keskivirheitä. Nollahypoteesina on, että OLS on harhaton (unbiased) ja tarkentuva (consistent). Vastakkaisessa tapauksessa, eli kun endogeenisyyttä esiintyy, onkin suositeltavaa käyttää estimointiin instrumenttimuuttujamenetelmää (IV), eikä pienimmän neliösumman menetelmää (PNS eli englanniksi OLS), joka tuottaisi harhaisia tuloksia.

4) Virhetermien riippumattomuus

Virhetermit eivät regressioanalyysissa saisi korreloida keskenään, mutta esimerkiksi aikasarja-analyyseissa, jos vaikka tutkitaan työttömyysasteen kehitystä vuodesta toiseen, virhetermit korreloivat joskus vahvasti. Silloin puhutaan autokorrelaatiosta, eli aikasarjassa seuraava arvo on ennustettavissa edellisten arvojen avulla.

Autokorrelaatiota voidaan testata jälleen ohjelmistosta riippuen eri testeillä, kuten:

  • Durbin-Watson test (jonka testisuureen saa laskettua myös Excelillä, mutta p-luvun vertailutaulukkoa tarvitaan merkitsevyyden määrittelyyn, ja taulukkoarvoja ei ole Excelissä)
  • Runs test (Waldin-Wolfowitz), pystyy laskemaan Excelillä, vaikkakin kaavat ovat mutkikkaat

Durbin-Watsonin testin voi helpoimmin tehdä suoraan esim. SPSS-ohjelmistolla tai XLSTAT-lisäosalla, jonka voi ladata Exceliin.

5) Virhetermien normaalijakautuneisuus

Virhetemien normaalijakautuneisuusoletusta ei välttämättä aina mainita regressioanalyysin edellytyksenä, sillä useimmin käytetty estimointimenetelmä, PNS eli pienimmän neliösumman menetelmä (engl. OLS = Ordinary Least Squares), ei edellytä virhetermien normaalijakaumaa. 

Jälleen käytetystä tilasto-ohjelmistosta riippuen meillä on käytettävissä testejä, jotka mittaavat, ovatko virhetermien poikkeamat normaalijakaumasta tilastollisesti merkitseviä vai eivät.

6) Multikollineaarisuus

Regressioanalyysissä on aivan luonnollista, että selittävät muuttujat korreloivat keskenään. Joskus niiden keskinäinen korrelaatio voi olla kuitenkin niin suurta, esim. niiden välinen korrelaatiokerroin on yli 0.9, että tämä alkaa haitata regressioanalyysin tulosten tarkkuutta. Siksi voidaankin lisätä vielä viidenneksi regressioanalyysin edellytykseksi se, ettei selittävien muutujien välillä ole ainakaan täydellistä multikollineaarisuutta, jolloin yksi selittävä muuttuja voitaisiin laskea toisen avulla.

Multikollineaarisuuden mittaamiseen on kehitetty erilaisia mittareita, jotka ilmaisevat mahdollisen ongelman vakavuuden, kuten VIF-mittari, joka on käytettävissä esim. SPSS-ohjelmistossa. VIF-arvo ei saisi ylittää 10:tä.

Miten korjata edellytysongelmia?

Jos edellä mainitut regressioanalyysin edellytykset eivät toteudu, vaan jokin niistä estää luotettavan analyysin toteuttamisen, tämä ei vielä välttämättä tarkoita sitä, että pitäisi luopua kokonaan regressioanalyysista. Sillä regressioanalyysi tarjoaa useita tapoja ottaa rajoitteet huomioon, ja "korjata" niiden vaikutukset. Voimme vaihtaa estimointimenetelmää, tai käyttää erilaisia tekniikoita tai korjata esimerkiksi lineaarisuusoletusta muuttujien muunnoksilla. Mutta palataan näihin seuraavassa blogissamme!

 


Ekonometria yleistyy yritysmaailmassa

Wikipedia kuvailee ekonometrian tilastotieteen menetelmien soveltamiseksi, kun tutkitaan taloudellisia ilmiöitä. Ekonometriaa koulutetaan korkeakouluissa useassa eri tiedekunnassa kauppatieteistä matemaattiseen ja maatalous-, ympäristö- ja elintarviketalouden kandiohjelmissa. Tämä tietysti viittaa siihen, että ekonometrian menetelmien avulla voidaan tutkia monenlaisia asioita, kun etsitään vastauksia esim. tekijöistä, jotka vaikuttavat talouden tilaan, hintoihin (esim. asuntojen hinnan muodostumiseen), markkinoinnin tehokkuuteen, rahoitukseen, kansantalouteen jne.

Ekonometria analysoi riippuvuuksia

Ekonometrian yleisin menetelmä on regressioanalyysi, jonka avulla voidaan selvittää eri asioiden välisiä riippuvuuksia. Syy-seuraussuhteistahan riippuvuus eli korrelaatio ei aina kerro - klassiset esimerkit kertovat jäätelönsyönnin ja hukkumiskuolemien vahvasta korrelaatiosta, vaikka edellinen ei ole jälkimmäisen syy. Yhtä lailla kouluesimerkeissä voidaan analysoida korkeakoulutettujen osuutta väestöstä ja analysoida sen yhteyttä bruttokansantuotteeseen eri maissa, mutta vaikka korrelaatio voi olla selkeä, ei voida varmuudella sanoa johtuuko korkea BKT korkeakoulutettujen määrästä, vai olisiko sittenkin niin päin, että kun maassa on korkea bruttokansantuote, on varaa kouluttaa väestöä paremmin...

Ekonometrian avulla saadaan kuitenkin tuloksiksi tilastollisella varmuudella laskettuja prosenttiosuuksia, korrelaatiokertoimia ja voidaan testata erilaisia hypoteeseja, ja tilastomatematiikan varmuudella hyväksyä tai hylätä jokin oletus tai väittämä. Kun ekonometrisen mallinnuksen lopputuloksena saadaan matemaattinen kaava, sen avulla voidaan tietysti ennustaa myös tulevaa, eikä ainoastaan selittää historiadatan avulla eri asioiden riippuvuuksia.

Usein riittää, kun riittävän varmasti voidaan poissulkea turhia investointeja

Markkinoinnin puolella klassinen klisee on, että puolet markkinoinnista menee hukkaan, mutta emme tiedä, kumpi puoli. Entä jos analysoidaan myynti- ja markkinointipanostusdataa aikasarjana, ja tutkitaankin ekonometrian avulla, mikä on minkäkin panostuksen selitysosuus myynnistä.

Silloin voi melkeinpä olla hyödyllisintä tieto, että jokin asia tai tietty markkinointikanava ei lainkaan korreloi myynnin kanssa, tai korrelaatio on hyvin alhainen. Tietenkin mainosväki silloin vielä selittää, että mainonnan vaikutus on pitkäkestoista, ja vaikutus ei näy lyhyen aikavälin mittauksissa. Mutta kyllä yritysjohto olisi varmasti kiitollinen siitä, että joku laskee tilastomatemaattisella varmuudella, että 99 % todennäköisyydellä jokin markkinointitoimenpide ei vaikuta myyntiin millään tavalla - tuskinpa suurempaa spekulointia silloin toimenpidesuosituksiin tarvitaan.

Econometrics_sales-price

Mihin ekonometriaa hyödynnetään?

Liiketaloudessa ekonometriasta on hyötyä paitsi markkinoinnin tehokkuuden mittauksissa, myös hinnoittelussa (yllä esimerkissä graafi, jossa myyntiluvut eri hinnoilla, ekonometrisen mallin avulla voidaan ennustaa myynti eri hintavaihtoehdoilla), rahoitusalalla, sijoittamisessa tai investointipäätöksiä tehtäessä. Ekonometrian kursseilla on spekuloitu myös sitä, miksi ekonometria yleistyy voimakkaasti juuri nyt, kun sen menetelmät ovat olleet tilastotieteen oppikirjoissa sata vuotta.

Ainakin yksi selittävä tekijä tähän on se, miten kaikilla yrityksillä ja yhteisöillä on nykyisin yhä enemmän ja yhä tarkempaa dataa esim. kuluttajakäyttäytymisestä ja ostopoluista, mm. analytiikan ja digimarkkinoinnin ansiosta. Toisaalta tietokoneet ovat monin verroin aiempaa tehokkaampia, ja samalla koneoppiminen ja älyteknologia edistyvät ja tuovat lisätehoa datan analysointiin ja sitä kautta avulla toiminnan ohjaamiseen kohti ennalta määriteltyjä tavoitteita.

- Ismo Tenkanen

 

 


Mittaatko markkinointipanostustesi tehoa oikein?

Vanha markkinointialan vitsi on, että puolet markkinointipanostuksista menee hukkaan, mutta emme tiedä kumpi puoli. Mutta kuinka moni edes mittaa tänä päivänä markkinointipanostusten toimivuutta aidoilla liiketoimintaan liittyvillä mittareilla, eikä pelkästään mediamittauksen huomioarvo- ja tavoittavuusluvuin? Tiesitkö, että kaikkien markkinointipanostusten korrelaatio samoin kuin selitysaste myyntiin, sivustoliikenteeseen tai myymäläliikenteeseen on helposti mitattavissa? Tiesitkö, että businessanalytiikka on jo ekonomiopiskelijoiden suosituimpia koulutusohjelmia - seuraava sukupolvi ei enää ohjaa päätöksentekoa mutulla vaan tutkitulla datalla? Onko oman yrityksesi päätöksenteko vielä mutun varassa?

Mittaa oikeita asioita

Tärkeintä on, että markkinointikampanjoilla on tavoite, ja että niiden toteutumista mitataan. Edelleen kuulee usein sanottavan, että "ei kampanjaa voida mitata", koska se on brändikampanja, tai "vaikutukset ovat pitkäkestoisia, eivätkä näy heti". Kuinka moni yritys sallii tänä päivänä, että käytetään kympppitonneja, tai jopa satoja tonneja kampanjoihin, jotka eivät korreloi myyntiin tai edes kävijäliikenteeseen (asiakkaan Web-sivustolla tai myymälässä) millään tavalla?

Brändin rakentaminen on edelleen tärkeää, mutta toivottavaa on, että brändikampanjatkin paitsi kasvattaisivat tuotteen tai yrityksen tunnettuutta, myös vaikuttaisivat myyntiin, myymäläiikenteeseen tai edes mielikuviin brändistä ja sitä kautta tulevaisuuden ostopäätöksiin. Liian usein näkee yhä mainoskampanjoita, joissa saattaa olla hauska ja mieleenpainuva tarina - mutta juuri kukaan ei muista edes tuoteryhmää - brändistä puhumattakaan, mitä mainostettiin. Silloin kampanjan eurot eivät sada ainakaan omaan laariin - pahimmassa tapauksessa ne menevät suoraan kilpailijoille.

Kaikki selitykset siitä, miten kampanjan tehoa ei voida mitata, ovat tekosyitä. Nykyisen dataohjaavan päätöksenteon aikakautena kaikkea voidaan mitata. Esteenä ei ole se, että kampanja oli brändikampanja, tuotteen myynti tapahtuu jälleenmyyjien kautta tai verkon ulkopuolella, mainos oli offline-medioissa (TV, printti, radio, ulkomainonta) tai että kampanjassa oli mukana useita eri kanavia ja medioita. Jokaisen median, jokaisen eri kanavan vaikutus myyntiin voidaan mitata.

Forbes_marketing

Matemaattista tarkkuutta mittaamiseen

 Ekonometria on taloudellisten asioiden mittaamista tilastomatemaattisin menetelmin. Nämä menetelmät ovat olleet tilastotieteen kirjoissa jo yli sata vuotta, mutta se, että niitä on alettu yhä enemmän ottaa vasta viime vuosina käyttöön, perustuu yksinkertaisiin asioihin:

  • nykyään saadaan yhä enemmän ja yhä tarkempaa dataa asiakkaiden kuluttajakäyttäytymisestä, ostopoluista ja ostotransaktiota edeltäneistä vaiheista; vrt. kanta-asiakasohjelmat, tunnistautumismekanismit verkossa, mobiilissa, kivijalkamyymälöissä
  • mallinnukset voivat olla yhä mutkikkaampia, muuttujia yhä enemmän, ja ne ovat silti mallinnettavissa yhtälöihin, jotka avaavat eri muuttujien korrelaatiot ja selitysasteet myyntiin
  • tietokonekapasiteetti, ohjelmistot ja älyteknologia mahdollistavat yhä pidemmälle vietyjä matemaattisia malleja ja laskukaavojen laskentoja silmänräpäyksessä
  • businessanalytiikan ja markkina-analytiikan koulutus yliopistoissa ja ammattikorkeakouluissa yleistyy, alalle valmistuu jatkuvasti uusia osaajia, jotka ovat hankkineet tietotaitonsa alan korkeakouluissa. Tälle porukalle tulosten mittaaminen, analysointi ja soveltaminen käytännön päätöksentekoon on itsestään selvää.

Datasta päätöksentekoon ja toiminnan ohjaukseen

Toinen vanha markkinointialan klisee on, että data, jota ei oteta käyttöön ja jonka perusteella ei tehdä mitään toimenpiteitä, on hyödytöntä. On aivan sama, kuinka paljon dataa kertyy yritykselle, ja kuinka detaljeihin sillä päästään, jos dataa ei käytetä mihinkään. Markkinointianalytiikan tarkoitus ei ole suinkaan vain tuottaa lisää dataa, vaan johtaa sen avulla toimintaa: tuottaa konkreettiset toimenpidesuositukset, tulkinnat välittömään päätöksentekoon.

Päätöksenteko on monin verroin helpompaa, kun meillä on mitattua dataa markkinoinnin tuloksista ja tehokkuudesta. Haluaisitko sinä matemaattisten metodien avulla:

  • Selvittää kaikkien markkinointikanavien korrelaation myyntiin, sivustoliikenteeseen tai myymäläliikenteeseen?
  • Laskea eri kanavien selitysasteen myynnistä? Entä kaikkien markkinointipanostustesi ja eri kanavien (ml. maksuttomat kanavat) yhteenlasketun selitysasteen myynnistä?
  • Liittää myynnin mallinnukseen myös muita tekijöitä, joiden uskotaan vaikuttavan myyntiin: esim. kilpailijoiden toimenpiteet, hinnoittelumuutokset, tarjouskampanjat, medianäkyvyyden tai jopa säätilan tai lämpöasteet?
  • Tietää, mikä on minkäkin lasketun tuloksen tilastollinen varmuus - prosenttiosuus, joka kertoo sen, ettei tulos johdu pelkästään satunnaisvaihtelusta? Millaista varmuutta sinä vaadit päätöksenteolle - riittääkö 95 %, 98 % tai 99 % luottamustaso?

Kun mutu ei riitä ja sukupolvi vaihtuu

 Päätöksenteossa ja markkinoinnissa on valtava murros edessä. Ei pelkästään kanavat ja viestimet ole digitalisoituneet, vaan myös päätöksenteko on dramaattisesti muuttumassa. Vanhan liiton mutu ja "näin on aina ennenkin tehty" -selitykset eivät enää yritysmaailmassa toimi, kun uusi sukupolvi on korkeakouluopinnoissaan jo orientoitunut "data driven" -maailmaan, jossa kaikki päätöksenteko perustuukin tutkittuun dataan, analytiikkaan ja tilastomatemaattiseen päätöksentekoon.

Perstuntumalla ei enää tehdäkään päätöksiä, kun tulee sukupolvi, joka on mitannut, analysoinut ja laskenut todennäköisyydet, ja ohjaa toimintaa mitattujen tulosten perusteella. Erityisesti A/B-testaaminen ja eri vaihtoehtojen lakkaamaton vertailu lennossa, myös kesken kampanjoiden, on jatkossa arkipäivää. Ohjelmistot ja tekoäly ohjaavat ja auttavat, mutta jonkun pitää osata silti rakentaa kampanjat, valita A/B-testattavat elementit ja ideoida myös luovat ratkaisut, kohderyhmät, kanavavaihtoehdot, joiden toimivuutta ja tuloksellisuutta lähdetään testaamaan.

Automaatiosta ei ole kyse. Ihmiset rakentavat edelleen mallinnukset, ideoivat luovat ratkaisut, kanavat, kohdeyleisöt, mutta ei satunnaisesti ja mutulla, vaan testaamalla ja mittaamalla sekä analysoimalla mittaustulokset. Optimointi on hieno sana, ja siinä auttaa myös tekoäly, mutta käytännössä optimointi edellyttää jo vertailua, mallinnuksia, vaihtoehtoja, joista heikosti toimivia ja liian kalliita voidaan ohjelmistojen ja tekoälynkin avulla lähteä karsimaan ja ohjaamaan panostuksia yhä kustannustehokkaampaan tekemiseen.

Siirry "data driven" -aikakauteen

Mikä on oman yrityksesi tila? Elääkö se vielä mutu-päätösten ja "näin on ennenkin tehty" -logiikan kivikautta - vai onko se jo siirtynyt tiedolla ja tutkimusdatalla johtamisen aikakauteen? A/B-testataanko eri vaihtoehtoja, vai uskotaanko yrityksessä sokeasti siihen, mikä on toiminut aiempinakin vuosikymmeninä?

Ota yhteyttä Econometrics Finlandiin, ja autamme alkuun. Mikään ei ole sen kalliimpaa, kuin uskoa mutuun ja olla mittaamatta ja analysoimatta eri ratkaisujen toimivuutta ja kustannustehokkuutta.

- Ismo Tenkanen 

 

 

 


Ohjelmallinen ostaminen parantaa mainostajan kontrollia mainontaan

Ohjelmallista ostamista on jälleen kommentoitu MarMaissa ja monissa perinteisissä medioissa. Aihetta on lähes yksinomaan käsitelty isoissa kotimaissa medioissa negatiivisena asiana. On peloteltu klikkiroboteilla ja feikkisivuilla, jonne mainokset päätyvät, sekä täysin kontrollomattomalla mediaympäristöllä. "Ties mihin ympäristöön - jopa pornokuvien rinnalle - mainoksesi päätyvät". MARK:in seminaarissa aiheesta esitelmöi yhden suurimman suomalaisen mediatalon johtaja, joka Powerpointillaan näytti tyhjää säkkiä: "ohjelmallisessa ostamisessa ette tiedä, minne mainoksenne päätyvät, vaan se on sokko-ostamista".

Tässä välissä oli ihan pakko avata oma suu, ja kertoa, että tämä ei pidä lainkaan paikkansa. Kun käynnistää ohjelmallisen ostamisen kampanjan, jo seuraavana päivänä on täydellinen listaus myös sivustoista tai blogeista, joissa mainos on esiintynyt vähintäänkin yhden kerran. Siis silloinkin, kun niitä sivustoja ei ole ennalta millään tavalla määritelty tai rajoitettu, missä medioissa halutaan mainosten näkyvän. Tästä listasta alkaa sitten karsinta ja optimointi: saavutettujen tulosten mukaan. Mutta toki voidaan ennalta valita medioita, vaikka ihan medianimikkeiden mukaan ja ottaa haluttaessa mukaan vain tunnettuja kotimaisia medioita, jos niin halutaan.

Markkinoinnin automaatiosta ei ole kyse

Suomen Markkinointiliiton Ohjelmallisen ostamisen seminaarissa yleisön (mainostajien) keskuudessa vallitsi suuri hämmennys, ja esitettiin ääneenkiin kysymys, että onko ohjelmallinen ostaminen sama asia kuin markkinoinnin automaatio.

Vastaus on, että nämä ovat kaksi täysin eri asiaa, vaikka yhtäläisyyksiäkin on. Markkinoinnin automaatiolla tarkoitetaan tietysti laajemmassa mielessä kaikkia toimenpiteitä, joissa esim. verkkokaupassa tai verkkosivustolla käynyttä lähestytään jollain markkinointiviestillä, ja on ennalta päätetty, minkälaisella triggerillä ja mekanismilla potentiaalista asiakasta lähestytään, jos hän on vaikkapa sijoittanut tuotteita ostoskoriin, mutta poistunut tilaamatta. Tai ostanut kirjailija X:n tuotantoa aiempina vuosina asiakastietokannan mukaan. Tai ladannut sivustolta jo 10 eri sivua tai viettänyt siellä yli 5 minuuttia. Voidaan tilanteesta riippuen lähettää sähköpostia, tekstiviesti - tai esittää display-mainontaa medioissa, joissa kävijä sattuu vierailemaan lähipäivinä.

Juuri tällainen remarketing, uudelleenmarkkinointi verkkomedioissa on ollut myös ohjelmallisen ostamisen lähtökohtia, ja silloin ideana on tietenkin, että ei suinkaan  odotella, että kävijä saapuu vain yhteen tai muutamaan ennalta valittuun mediaan aivan sattumalta - vaan pyritään tavoittamaan kävijä tuhansissa tai jopa sadoissa tuhansissa eri medioissa, joissa potentiaaliset asiakkaat sattuvat vierailemaan. Eli selvällä suomen kielellä pääidea ohjelmallisessa ostamisessa on kohderyhmän aiempi selainkäyttäytyminen ja millaista kohderyhmää halutaan tavoittaa - eikä enää se, missä yksittäisissä mediasivustoissa kohdeyleisö toivon mukaan kampanjapäivinä vierailee.

Kontrolli mainostajalle - ei enää medioille

Vielä viitisen vuotta sitten lähes kaikki display-mainonta verkkomedioihin ostettiin ottamalla yhteys mediamyyjiin, jotka edustivat eri medioita. Neuvoteltiin hinta, ja buukattiin sitten ennalta sovittu määrä mainosnäyttöjä tai pahimmassa tapauksessa aikapohjainen kampanja johonkin mediaan. Voiko olla pahempaa sokko-ostamista kuin aikapohjainen kampanja ennalta valittuun mediaan: kukaan ei voi ennalta tietää, keitä tavoitetaan, kuinka monta kontaktia tavoitetaan, ja saadaanko markkinointipanostuksella yhtään mitään aikaan? Rahat on ennalta korvamerkitty ko. medialle, ja juuri mitään ei ole tehtävissä, jos kampanja ei toimikaan toivotulla tavalla!

Myös silloin, kun kiinteässä ostotavassa sovittiin ennalta mainosnäyttöjen määrä miljoonissa, kontrolli siitä, millä yksittäisellä verkkomedian sivulla tai mediaverkossa kymmenien tai satojen sivustojen yksittäisellä satililla mediatalolta ostetussa kampanjassa mainos esitetään, oli usein yksinomaan mediatalolla. Jopa tilanteessa, että asiakas on analytiikan kautta todennut, että media X ei tuota toivotunlaisia kontakteja ja tuloksia, mediatalon mediamyyjä saattoi tylysti todeta asiakkaalle ja tätä edustavalle mediatoimistolle: "ei meillä ole valtuuksia karsia yksittäisiä medioita kampanjasta"!

Nyt kun ohjelmallisessa ostamisessa ostajalla - mainostajalla itsellään tai hänen toimistollaan - on täydellinen kontrolli siihen, missä mainoksia esitetään - kotimainen media väittää, että se on "sokko-ostamista". Kyllä, useimmiten ohjelmallisen ostamisen kampanjaan EI valita ennalta medioita - koska ei tiedetä etukäteen, missä medioissa haluttu kohderyhmä vierailee, vaan valitaan kohdennuskriteereitä - esim. kävijä on aiemmin vertaillut asiakkaan omilla sivuilla tai tietyn aihepiirin mediasivustoilla - esim. matkailu, autoala, työpaikkasivustot jne. - ja halutaan tavoittaa hänet mediariippumattomasti.

Guardian_tokmanni

Kuva yllä: kotimainen mainostaja www.theguardian.comin sivuilla - mainos näkyy vain suomalaiselle käyttäjälle, joka on vieraillut asiakkaan sivuilla tai sen tietyssä osiossa. 

Sivustojen kontrolli black list'ien ja white list'ien avulla

Vaikka ohjelmallisen ostamisen kampanja rakennetaankin pääosin kohdennuskriteerien, ei medianimikkeiden kautta, mikään ei estä myös listaamasta mediasivustoja, joissa mainosten halutaan näkyvän ("white list") tai ei missään tapauksessa haluta esiintyvän ("black list"). Olen ollut toteuttamassa ison eläkevakuutusyhtiön kampanjaa, jossa asiakas halusi listata 20 johtavaa kotimaista b2b-mediaa, joissa mainokset ainoastaan näkyivät - ja näihin kaikkiin päästiin ohjelmallisen ostamisen kautta. Ja murto-osalla siitä hinnasta, jota kampanja olisi maksanut mediataloista kiinteästi ostettuna!

Tämän lisäksi mediaympäristöä kontrolloidaan lukuisten eri kriteerien avulla, joilla voidaan karsia esim. mainosten näkyminen ei-toivotussa, vaikkapa polittiisessa ympäristössä, uhkapelisivuilla jne jne. Silti usein tulee tilanteita, että mainostaja itse törmää mainokseen vaikkapa tunnetun kotimaisen mediatalon ei-niin-toivotulla sivustolla, ja haluaa median pois kampanjastaan. Tämä onnistuu minuutissa yhdellä painalluksella eli lisäämällä ko. media black listalle!

Kampanjan optimointi moninkertaistaa mainostajan kustannustehokkuuden

Ohjelmallisen ostamisen kampanjassa avainasia on, että kampanjaa optimoidaan lennossa, saavutettujen tulosten mukaisesti. Asiakas tietysti itse asettaa kriteerit, tavoitellaanko näkyvyyttä, klikkejä ja liikennettä sivustolle, vai konversioita itse kohdesivulla - esimerkiksi tilauksia tai yhteydenottopyyntöjä. Mikä parasta, näistä kaikista saadaan täydelliset listaukset, ja ryhmiteltynä:

  • eri kohdennuskriteerien mukaan
  • eri sivustojen /URL:ien/mobiiliapplikaatioiden mukaan
  • eri luovien ratkaisujen /mainossisältöjen mukaan

Optimointi tarkoittaa käytännössä sen karsintaa, mikä on osoittautunut toimimattomaksi - joko ei ole saatu haluttuja tuloksia, tai ne ovat tulleet liian kalliiksi. Mikään ei estä keskeyttämästä koko kampanjaa - tai poistamasta siitä mitä tahansa sivustoja, kohdennuksia tai huonosti toimivia luovia ratkaisuja.

Ei ihme, että suurimmat mainostajat panostavat yhä enemmän ohjelmalliseen ostamiseen. Isoimmat ovat jo rekrynneet ohjelmalliseen ostamiseen ammattilaisia, ja ottaneet ohjelmallisen ostamisen ohjelmistot talon sisäiseen käyttöön, eivätkä enää ulkoista asiaa toimistoille. Tässä ei ole mitään uutta - samoin kävi aikanaan hakumainonnalle, kun sen tehokkuus ja potentiaali ymmärrettiin isojen mainostajien keskuudessa.

Mihin ohjelmallisen mainonnan pelottelu ja vastustus perustuu?

Jos ohjelmallinen ostaminen siis nimenomaisesti antaa kontrollin display-mainonnasta mainostajalle itselleen ja helposti tuplaa tai moninkertaistaa - asiakkaiden omienkin kommenttejen mukaisesti - mainonnan tehokkuuden, niin miksi sitä niin voimallisesti vastustetaan kotimaisessa medioissa ja luodaan jatkuvalla syötöllä kauhutarinoita?

Vastaus on yksinkertainen ja kotimaisen median kannalta ikävä: koska ohjelmallinen ostaminen ohjaa mainontaa yhä enemmän Suomen rajojen ulkopuolelle ja isoihin kv. medioihin. Kun kohderyhmä tavoitetaan eBay'sta, Allmusic.com:ista, The Guardian.com:ista, Washington Postista tai Financial Timesista, niin tokihan siinä kotimaisen mediatalon siivu digimarkkinointipanostuksista ohenee kovaa vauhtia. Ja kun niitä potentiaalisia sivustoja, missä suomalaisenkin kohdeyleisön voi tavoittaa, on loputtomasti maailmalla, niin kotimainen media saa yhä pienemmän osan mainosrahoista.

Onhan tässä kauhutarinaa kotimaiselle medialle kerrakseen, ymmärrettävästi. Mutta ei nyt sekoiteta faktoja fiktioon.

- Ismo Tenkanen


Analytiikan perusasiat kuntoon uudelle sivustolle

Perustin uuden yrityksen heinäkuussa, ja elokuussa yritys rekisteröitiin kaupparekisteriin osakeyhtiöksi. Perustamistietojen syöttöä seuraavana aamuna olikin sitten jo uuden email-osoitteen sähköposti täynnä vakuutusyhtiöiden, markkinointitoimistojen ja tilitoimistojen tarjouksia. Ja saman tien alkoi puhelin soida myös huijarifirmoilta, jotka totta kai "tarkistivat yhteystietoja" milloin mihinkin "puhelinluetteloonsa", joka on vain netissä, mutta johon on liki välttämätöntä liittyä, siirtääkseen rahaa heidän tililleen, ja saadakseen vastineeksi "näkyvyyttä" nettikatalogissa, jossa käy kolme kävijää kuukaudessa ja nekin vain huijattuja asiakkaita...

Verkkosivut kuntoon siihen erikoistuneelta toimistolta

Nettikatalogihuijareiden vipuun en toki mennyt, mutta kotisivut päätin tilata yritykseltä, joka oli oikein erikoistunut pienyritysten nettisivujen rakentamiseen järkevällä hinnalla. Toki olen viitisen nettisivustoa koodannut vuosikymmenen saatossa ihan html-editorin avulla, mutta saittien ulkoasuista on alkanut kuulua enemmän kuin rivien välistä kommentteja, että ne edustavat esihistoriallista aikaa ja kaipaisivat graafikon silmää. Niinpä päätin tilata sivut firmalta, jonka referensseissä näkyi hyvin ammattimaisia yrityssaitteja WordPressillä toteutettuna.

Kuusi viikkoahan siinä meni toimeksiannosta julkistamiseen tältäkin toimistolta. Markkinointianalyytikkona ja hakukonespesialistina mielenkiinnolla seurasin, missä mallissa sivusto on, kun toimiston mielestä se on julkaisuvalmis ja syötetty liveksi nettiin.

Kaikki analytiikan perusasiat puuttuvat toimistojen julkaisemilta sivuilta

Ei ollut toki suuri yllätys, että kaikki perusasiat loistivat poissaolollaan toimiston julkistamilta sivuilta. Kun on toistakymmentä vuotta katsellut erilaisten markkinointiviestinnän ja digitoimistojen työskentelyä myös itse toimistoissa, kylmä fakta vain on, että suomalaisten toimistojen osaamiseen ei yleensä kuulu - eikä asiakkaalle ainakaan aktiivisesti tarjota - analytiikan kuntoon saattamista, ja sen hakunäkyvyyden kanssa on myös vähän niin ja näin. Jotenkin tulee itselle mieleen se Simpsons-episodi, jossa Homer Simpson perustaa nettisivun, jossa pyörii jokin tanssiva Jeesus, ja sitten Homer jää pyörittelemään peukaloitaan ja odottelemaan, että joku kävijä eksysisi sivustolle. Nettisivuja ammatikseen toteuttavalle toimistolle ei aina välähdä mieleen, että:

- yrittäjällä on tarkoitus, että sivut löytyisivät verkosta ja sen hakukoneista
- yrittäjällä on sivustolla kenties jokin muukin tarkoitus tai tavoite kuin saada sivut julkistettua
- yrittäjä saattaisi olla kiinnostunut tiedosta, onko joku muukin eksynyt sivustolle, ja mitä kautta tämä päätyi sivustolle ja mitä sisältöä hän luki
- yrittäjä saattaisi olla kiinnostunut tiedosta, päätyikö sivuston kävijä johonkin tavoitetapahtumaan sivuilla vierailtuaan?

Kun on omia kollegoita ollut henkilöinä, jotka asiakkaille myyvät verkkosivustoja tai verkkokauppoja, niin vakioselityshän sille, että analytiikkapuolta tai hakunäkyvyyttä ei hoideta automaattisesti kuntoon, on, että "asiakas ei tilannut niitä". Aivan, mutta tarjottiinko niitä, sillä koko ajan itse törmään yritysasiakkaisiin, joilla sivusto on mainostoimiston tai digitoimiston tekemä, ja ollut verkossa jo kuukausia tai jopa vuosia, ja kenelläkään ei ole mitään tietoa siitä, käykö sivustolla kukaan tai mihin sivustolla vierailu olisi johtanut. Toki jos sivustolla on jokin yhteydenottolomake, ja siihen ei ole tullut kuin SPAMmia, voi päätellä, että sivusto ei ole ainakaan nettilomakkeen täyttöön houkutellut, mutta tärkeä tieto tähänkin olisi se, kuinka moni on löytänyt sivuston esimerkiksi hakukoneiden kautta, ja jos on, niin millä avainsanoilla. Eli näkyykö yritys hakukoneissa relevanteilla avainsanoilla ja jos ei näy, pitäisikö asialle tehdä jotain?

Nämä asiat ensiksi kuntoon

Kaikki seuraavat asiat olisi hyvä hoitaa kuntoon niin nopeasti kuin mahdollista, heti kun sivusto on julkaistu. Jos asiaa ei osata hoitaa asiakasyrityksessä, eikä toimistossa, joka sivuston perusti, niin apua saa vaikkapa allekirjoittaneelta.

1) Sivustomittaus kuntoon

Toki jo sivuston ylläpidon lokianalyyseista saa perustilastoja eri tiedostojen latauskerroista, mutta ilmainen Google Analytics kannattaa kytkeä päälle heti kun sivusto julkaistaan. Google Analytics -tilin voi perustaa kuka tahansa, joka perustaa ilmaisen Google-tilin, jonka avulla saa pääsyn myös lukuisiin muihin Googlen palveluihin ja ilmaisiin ohjelmistoihin. Google Analytics -tilin perustettuaan saa ohjelmasta koodinpätkän, joka lisätään kaikille sivuille.

Eri julkaisujärjestelmissä koodin lisääminen tapahtuu eri tavalla, mutta yleisimmissä julkaisujärjestelmissä on joko valmiit palikat tai helposti ladattavissa olevat lisäosat (add-ons) analytiikkakoodien lisäämiseen, niin ettei tarvitse enää sivu kerrallaan käydä html-koodia editoimassa, kuten ennen vanhaan. Google Tag Manager on tietysti nopea tapa lisätä Analytics-koodi, joskin on aika selvää, että jos sivustolle on asentamatta Analytics, ei sinne ole asennettu myöskään GTM-koodeja, eli jommasta kummasta on aloitettava.

Google Analytics tarjoaa kattavasti dataa sekä suosituimmista sivuista ja kävijöiden määristä että myös liikenteen lähteistä, eli esimerkiksi siitä, kuinka moni tuli sivustolle suoraan kirjoittamalla web-osoitteen selaimen osoitekenttään, kuinka moni hakukoneista, kuinka moni somelinkkien kautta jne. Analyticsissa on nykyisin myös Real Time -seuranta, eli näkee välittömästi, että mittaus käynnistyy ja dataa kertyy, eikä tarvitse odotella raporttien päivittymistä.

2) Tavoiteseuranta määriteltävä

Analytiikoille tuttu juttu on, että esim. Google Analytics -kursseille saapuvasta kymmenestä asiakkasta yhdeksällä on tavoiteseuranta määrittelemättä. Tämä tarkoittaa sitä, että Google ei voi tietää, mikä on sivuston ja asiakkaan tavoite, ja kaikkien, jotka asentavat Google Analytics -mittauksen, pitäisi itse määritellä tavoitteet. Jos tavoitteita ei ole määritelty, analytiikan tavoiteseuranta näyttää tyhjää tai nollaa.

Tavoitteet kannattaa määritellä, on kyse sitten mistä tahansa toimialasta, ja silloinkin vaikka et myisi sivustolla yhtään mitaan, vaan ainoastaan haluat jakaa tietoa erilaisten mediasivustojen ja blogien tapaan. Jos kyse on sitten liiketoiminnasta, jonka tavoitteena on saavuttaa uusia asiakkuuksia, ja käyttää verkkosivustoa yrityksen tunnettuuden parantamiseen, tiedon levittämiseen yrityksen tarjonnasta ja yhteydenottopyynnön jättämiseen - tai peräti tilaukseen suoraan verkkopalvelusta, tavoitemäärittely on sitäkin tärkeämpää. Tyypillisiä tavoitteita, joita voi olla useita, ovat esimerkiksi:

- tilaus tai ostotapahtuma verkosta (esim. verkkokauppa)
- yhteydenottopyyntö
- email-osoitteen klikkaaminen
- vierailu yhteystiedot-sivulla
- uutiskirjeen tilaaminen
- hinnaston lataaminen, muun dokumentin, esim. pdf-tiedoston lataaminen
- sivustolle upotetun videon katselu
- lomakkeen lähettäminen, muun painikkeen painaminen, linkin klikkaaminen sivuston ulkopuolelle
- vierailu missä tahansa valitussa osiossa tai yksittäisellä sivulla, joka määritellään tavoitteeksi
- vierailun minimikesto tai ladattujen sivujen määrä

Huomaa, että lähes kaikki yllämainituista eivät lähde itsekseen käyntiin Google Analyticsissa, vaan vaativat esim. Event Tracking -tapahtumien koodauksen ja määrittelyn, jotta esimerkiksi button-nappien tai linkkien klikkaukset tai lomakkeiden lähettämiset alkavat näkyä analytiikassa - ja jonka jälkeen niistä voi määrittää tavoitteen, joiden toteutumisia seurataan. Event Tracking -seurannan koodaaminen ja määrittely vaativat jo hieman edistyneempää analytiikkaosaamista, mutta näihinkin löytyy googlaamalla helposti apua sekä Googlelta itseltään että 3. osapuolen sivustoilta, jos on intoa käydä asioita itse opettelemaan. Jos ei ole, ota yhteyttä ja tulemme apuun!

Alla kuvassa esimerkki yhteydenotto-lomakkeen Lähetä-buttonia klikanneiden seurannasta Google Analyticsista reaaliaikaisena:

Yhteydenotto_ga

Kun tavoitteet on määritelty, ei pelkästään pääse seuramaan niiden kertymistä ja määriä, vaan pääasia on, että voi analysoida, mitkä sisällöt sivustolla ja eri liikenteen lähteet ja kanavat parhaiten ohjaavat haluttuihin tavoitteisiin!

3) Orgaanisen haun seuranta ja Google Search Consolen käynnistys

Google Analytics tarjoaa tietoa siitä, kuinka moni saapuu sivustolle hakukoneiden kautta, mutta nykyisin avainsanoista, joiden kautta kävijä on saapunut hakukoneen ilmaisesta hakutuloksesta, GA ei juurikaan anna tietoa. Tarkkaan tietoon siitä, miten sivusto on esiintynyt Googlen ilmaisissa eli orgaanisissa hakutuloksissa, pääsee kuitenkin Google Search Consolen avulla, joka aiemmin tunnettiin nimellä Google Webmaster Tools. Sekin on ilmainen Googlen palvelu, jonka avulla näkee jopa niiden avainsanojen määrän, joiden yhteydessä sivusto on esiintynyt hakutuloksissa, myös silloin, vaikka kukaan ei olisi klikannut yrityksen hakutulosta ko. avainsanasta!

Search Console paljastaa myös sijoitukset Googlen hakutuloksissa eri avainsanoilla, ja tarjoaa siten oivallisen työkalun hakukoneoptimoinnin kehittämiseen, kun halutaan alkaa parantaa yrityksen sijoittumista ilmaisissa hakutuloksissa. Search Consolen tiedot voi kytkeä myös Google Analyticsiin näkyville hakutulosten osalta.

4) Hakunäkyvyyden seuranta ja sen parantaminen, hakukoneoptimointi

Usein jopa 70-80 % sivuston liikenteestä saavutetaan ilmaisten hakutulosten kautta, joten asian seuranta ja hakunäkyvyyden kehittäminen on avainasia kaikille, joilla on tavoitteena saavuttaa verkkopalvelun kautta omia tärkeitä kohdeyleisöjään. Hakukoneoptimointia ei juurikaan kannata edes käynnistää, ennen kuin on kuitenkin hoidettu edeltävät kolme tekijää kuntoon, eli mittaus, tavoitemäärittelyt ja orgaanisen haun seuranta.

Hakukoneoptimointa varten on lisäksi verkossa lukuisia ohjelmistoja, joiden avulla voi - lisenssimaksut maksettuaan - alkaa analysoida oman sivuston hakunäkyvyyttä, kilpailijoiden hakunäkyvyyttä, ja alkaa seurata hakunäkyvyyden kehittymistä esimerkiksi tarkkaan valitulla avainsanalistalla.

5) Muu markkinointi, oma media, sosiaalinen media, maksettu media

Ja vasta kun edellä mainitut neljä perusasiaa ovat hoidossa, kannattaa aloittaa liikenteen aktiivinen ohjaus muilla keinoin omalle sivustolle. Email-markkinointi, orgaaninen hakunäkyvyys, omat sosiaalisen median kanavat edustavat "ilmaisia" (toki työtä nekin vaativat) kanavia, mutta lisäksi voidaan seurata analytiikan avulla muuta ansaitun median näkyvyyttä (muiden sivustojen kautta linkkiä pitkin saapuvat), sekä tietenkin kaikkea maksettua mainontaa, miten ne ohjaavat liikennettä sivustolle ja kuinka hyvin ne generoivat liidejä tai uusia asiakkaita.

Maksetusta mainonnasta suosittelisin ensimmäisinä hakumainontaa, Facebook-mainontaa ja remarketing-mainontaa niille, jotka ovat jo sivustolla ehtineet aiemmin vierailla.

Ota yhteyttä, niin kerromme mielellämme lisää kaikesta näistä, samoin kuin digitaalisen markkinoinnin ja myös offline-markkinoinnin eri keinoista.

- Ismo Tenkanen
P.S. Unohdin kertoa, miten kävi nettisivujen rakentamiseen erikoistuneen firman kohdalla hakunäkyvyydelle, kun uusi sivustoni julkistettiin. Joka sivulla oli "noindex"-merkintä sivukoodissa, joka ohjaa hakukonerobotteja ohittamaan sivun indekseistään. Se oli firmalta unohtunut päälle, kun sivuston rakennusvaiheessa tuo "noindex" on tarkoituksella ollut päällä. Eli sivustoni oli hakukoneille 100 % näkymätön, kunnes poistin tuon WordPressin asetuksista...

 

 

 


Uusi mittaamisen kulttuuri tulee nuoren sukupolven mukana

Markkinointiviestinnän tehtävissä jo 90-luvulta asti päivittäin työskennelleenä on ollut erittäin mukava huomata, miten nuori sukupolvi Suomessa eroaa merkittävästi meistä vanhemmista. Ainakin kolmessa asiassa tämän päivän nuoret ja työelämään vasta siirtyvät ovat ison harppauksen aiempia sukupolvia edellä. Digitalisaatio on tietysti luonnollista, jos on koko ikänsä elänyt Internet- ja mobiiliaikaa, kun me vanhemmat toistuvasti muistelemme aikoja, jolloin vielä runsaat 15 vuotta sitten lausahdettiin, että "vaatteita ei ainakaan koskaan kukaan osta verkosta" tai "et kai tosissasi usko, että joku ostaisi lentolipun netistä"... 2000-luvun alussa vierailin pankin markkinointitutkimusyksikössä, jossa asiakkaani ääneen ihmetteli, uskallanko tosiaan "maksaa netissä ostotapahtuman"?

Toinen asia, jossa nuoret elävät ihan eri planeetalla kuin me 60-70-luvun kasvatit, on kansainvälisyys. Startup-yrittäjät, nuoret verkkokauppiaat eivät enää lähtökohtaisesti perustakaan yrityksiään vain kotimaan markkinoille, vaan ymmärtävät, että ulkomailta voi saada liikevaihtoa ihan eri lukemia kuin Suomessa yksin. Tässä me suomalaiset olemme ikävä kyllä laskeutuneet puusta aika paljon esim. pohjoismaisia kollegojamme perässä, mutta on hienoa nähdä nuorten startup-yrittäjien ymmärtävän bisnekset jo globaaleina.

Mittaamisen kulttuuri tulee vain nuoren sukupolven kautta

Kolmas asia, jonka itse uskon tulevan ja kasvavan vain nuoren sukupolven kautta, on mittaamisen kulttuuri, joka on ollut Suomessa todella matalalla tasolla markkinointiviestinnässä aiemmat vuosikymmenet. Mutta kun markkinointipäättäjäksi valitaan nuori digisukupolven ihminen, tämä lähtökohtaisesti mittaa markkinoinnin tuloksia, ja ohjaa toimintaa mitattujen tulosten perusteella. Tämä voi kuulostaa hölmöltä, mutta niin ei ole kovinkaan kauaa markkinointialalla tehty. Aiemmin riitti pelkkä "mutu", ja "näin on aina ennenkin tehty", joita lausahduksia kuulee edelleen vanhemman polven markkinointiviestinnän konkareilta.

Jokainen analyytikko on kuullut sataan kertaan kaikki ne tekosyyt, miksi "kaikkea ei voi mitata", "kampanjan vaikutukset tulevat pitkäkestoisina, eikä niitä voi nähdä mittaamalla", ja "sinä et ymmärrä mitään brändinrakentamisesta", heti kun aletaan kysellä tulosten mittaamisen perään.

Ajat ovat kuitenkin nopeasti muuttumassa. On enemmän kuin kiehtovaa kuulla, että business-analytiikka on Aalto-yliopiston kauppatieteellisellä puolella toiseksi suosituin koulutusohjelma, ja että ekonometrian kursseja ei enää upotetakaan vain tilastotieteen tai insinooritieteiden koulutuksiin, vaan ne ovat myös kauppatieteen puolella: nuorille kauppatieteilijöille on itsestään selvää, että analytiikka, mittaaminen, datalla ohjaaminen kuuluvat liikkeenjohtoon, ei vain jonnekin IT- ja insinööriosastolle. Mainostoimistossa 10 vuotta töitä tehneenä kuvaavaa oli, että IT-osastoa kutsuttiin mainosvelhojen jargonissa "ATK- ja tulostusyksiköksi", ja analytiikkaa "insinöörimittaamiseksi". Luovien gurujen työn jälkeä ei sopinut mitata, sillä luovuus ei ollut mitattavissa. "Tuloksia" nautittiin pokaalien muodossa mainosmaailman gaaloissa ja juhlatilaisuuksissa. Mitä asiakas sai palkitusta menestyskampanjasta? "Et sä voi sitä mitata", sai kuulla.

Kaikkea voi mitata

Sukupolvet vaihtuvat kuitenkin myös asiakaspäässä, ja nuoremmat markkinointipäättäjät ja nykyinen yritysjohto eivät enää tee kampanjoita erikseen, siten, että toisilla kampanjoilla pelkästään rakennetaan pitkäkestoisesti brändiä, ja aivan toisilla kampanjoilla buustataan myyntiä. Ja vaikka kuinka rakennetaan brändiä, kuten toki pitääkin, niin brändinkin tilaa ja tuote -ja yritysmielikuvia sekä voi että tulee mitata.

Kampanjalla pitää olla tavoitteet, ja niitä pitää mitata, olivat ne tavoitteet ihan mitä tahansa. Liki kaikki selitykset, miksi ei mitata, ovat tekosyitä, jotka perustuvat yrityksen mittauskulttuurin puuttumiseen, ja jopa sen pelkoon. Jos vuosikymmeniä yrityksessä työskennellyt markkinointipäättäjä vastustaa viimeiseen asti kaikkea analytiikkaa ja mittaamista, hänellä on tietysti erittäin hyvä syy tähän vastustukseen. "Entä jos se osoittaa, että olen tehnyt työni huonosti"? Entä jos analyysi osoittaa, että olen vuosikausia käyttänyt rahaa johonkin, joka ei ole tuottanut juuri mitään mitattavia tuloksia?

"Asiat eivät ole niin yksioikoisia"

 Yksi selitys, miksi mittaamista ja analytiikkaa ei haluta, kuuluu, että ihmiset ovat niin erilaisia, ostopolut pitkiä ja mutkikkaita, että "asiat eivät ole niin yksioikoisia", että ne mittaamalla kampanjan tehoa voisivat ilmentyä. Totta on, että perinteiset kampanjamittaukset ovat usein sellaisenaan liian pelkistettyjä, ja mittavat vain yhden median tai yhden kampanjan markkinointiviestiä, ja sen vaikutusta myyntiin turhan yksioikoisesti ja suoraan, niin kuin ihminen olisi helposti ohjattavissa mainoksesta ostoon asti. Tämä on kuitenkin tämän päivän markkinointianalytiikassa otettu huomioon, että ostopolut ovat mutkikkaita, ja ostopäätökseen vaikuttavia tekijöitä lukuisia. Ja päätökseen vaikuttavat lukuisat eri asiat, eivät pelkästään markkinointi.

Ostopolkua voidaan kuitenkin analysoida, ja kaiken ei todellakaan tarvitse tapahtua verkossa. Ei mainonnan, eikä oston. Siitä huolimatta tänä päivänä voidaan laskea eri kampanjoiden - ja myös markkinoinnin ulkopuolisten tekijöiden - korrelaatio myyntiin, olivat ne ostopolut kuinka mutkikkaita tahansa, ja tapahtuivat asiat verkossa tai verkon ulkopuolella. Ja vaikka kuinka ihminen altistuu yhdenkin päivän aikana sadoille markkinointiviesteille niin netissä kuin offiline.

Dataa on yhä enemmän, mutta vain tulkintojen ja toimenpidesuositusten kautta siitä on hyötyä

 Vanha tuttu analytiikan klisee on, että data sellaisenaan ei hyödytä ketään - jos sen perusteella ei osata tehdä toimenpiteitä ja ohjata liiketoimintaa. Se, miksi datan hyödyntäminen ja liiketoiminnan ohjaaminen datan ja analytiikan avulla kuitenkin etenevät lähivuosina nopeasti, perustuu moneen asiaan. Ensinnäkin, dataa on yhä enemmän, kaikilla yrityksillä, ja sitä saadaan yhä monipuolisemmin ja perusteellisemmin. Mutta sitä myös onneksi hyödynnetään ja analysoidaan yhä useammin. Vielä 1990-luvulla ja 2000-luvun alussa analytiikka oli lähinnä Web-analytiikkaa ja nettilatausten klikkistriimin seurantaa - jonka raportit lojuivat jossain IT-osaston pöydillä, ilman, että sitä markkinoinnissa ja yritysjohdossa millään tavalla hyödynnettiin.

Analytiikka kehittyi kuitenkin kymmenessä vuodessa Web-analytiikasta markkinointianalytiikkaan ja business-analytiikkaan, jonka avulla voidaan analysoida lukemattomien eri tekijöiden yhteyksiä myyntiin, ei pelkästään nettiklikkien, vaan aivan minkä tahansa asioiden vaikutuksia toisiinsa. Eli yhtä lailla TV-kampanjan vaikutusta myyntiin kivijalassa, tai kilpailjan toimenpiteiden tai media-artikkelin vaikutus myyntiin.

Tällaisia asioita analysoidaan ekonometrian avulla, ja sen menetelmät ovat olleet tilastotieteen kirjoissa sata vuotta. Miksi niitä ei ole aiemmin samalla tavoin hyödynnetty ja otettu käyttöön? No, muistetaanpa se, että vielä 70-luvulla yliopistojen ATK oli reikäkorttiaikakaudella, ja ensimmäisillä 80-luvun alun mikrotietokoneilla oli 20 kilotavua "keskusmuistia". Näinä aikoina regressioanalyysia laskettiin kynän ja paperin ja laskutikkujen avulla. Mikä tahansa muu kuin yhden muuttujan lineaarinen regressioanalyysi olisi vaatinut melkeinpä matemaatikon paikalle tuhertamaan monimutkaisia kaavoja, joiden laskentaan olisi työtunnit ja vuorokaudet kuluneet. Nyt sama onnistuu ekonometrian peruskurssilla Excelin avulla minuuteissa. Ohjelmistot ja tekoäly kehittyvät sellaisella vauhdilla, että esimerkiksi optimointiohjelmistot ohjaavat kohta digitaalisia kampanjoita kohti KPI-tavoitteita liki itsekseen. Mutta jonkun pitää niillekin syöttää tavoitteet ja ymmärtää, mitä tavoitteita kohti optimoidaan.

Teknologian, tietokoneiden ja ohjelmistojen kehitys eivät siis riitä - tarvitaan myös analyytikkoja ja osaajia, jotka ymmärtävät, mitä voidaan mitata, miten lukuja analysoidaan, ja miten tuloksia voidaan optimoida kohti haluttuja tavoitteita. Onneksi tähänkin on tulossa suuri muutos, sillä analytiikkakoulutuksia on yhä useammassa yliopistossa ja ammattikorkeakoulussa - osaajia tarvitaan. Mutta muutos näkyy pian kaikissa yrityksissä, sillä "data driven marketing" on tullut tai tulossa osaksi jokaisen markkinoijan arkea.

- Ismo Tenkanen

 

 

 


Econometrics - mitä se on?

Digikanavien osalta Web-analytiikka on jo pitkään tarjonnut mahdollisuuden analysoida eri liikenteen lähteiden ja kanavien toimivuutta ja kustannustehokkuutta mainostajan näkökulmasta. Mutta miten päästään analysoimaan offline-mainonnan - kuten TV-mainonta, radiomainonta, printtimainonta - yhteyksiä myyntilukuihin (myös verkon ulkopuolella) ja saittiliikenteeseen? Juuri tähän tarjoaa Econometrics ratkaisun.

Econometrics-dashboard

Ekonometriset mallinnukset mediatoimistoissa

Kansainvälisessä mediatoimistossa seitsemän vuotta työskenneltyäni tiesin hyvin, että globaalit toimistot pyysivät isoilta mainostajilta myyntilukuja ja markkinointipanostuslukuja, ja näiden pohjalta tehtiin sitten laskelmia, miten eri mediapanostukset korreloivat myyntiin, Luvut lähetettiin analytiikkaan erikoistuneelle yksikölle, ja parissa päivässä saatiin luvut, jotka kertoivat eri kanavien korrelaatiot myyntiin, ja näiden pohjalta laadittiin sitten asiakkaalle vuositason suositukset, mihin kanaviin ja kanavakombinaatioihin kannattaisi jatkossa panostaa enemmän.

Toisaalta olin markkinointialan tapahtumissa ja seminaareissa ollut kuuntelemassa useampaan kertaan case-esimerkkejä isojen mainostajien ekonometrisistä mallinnuksista, joiksi kutsuttiin matemaattisia mallinnuksia, joilla pyrittiin laskemaan eri tekijöiden osuutta myyntiluvuista: mukana mallinnuksissa olivat paitsi edellä jo mainitut markkinointipanostukset eri kanaviin, myös esimerkiksi säätila tai lämpöasteet, kilpailijoiden markkinointipanostukset ynnä muut tekijät, joiden oli havaittu osaltaan vaikuttavan suoraan myyntiin.

Mihin tilastotieteen metodiin ekonometriset mallinnukset rakentuvat? Jo pelkästään Wikipedian selitys termille Econometrics on varsin valaiseva. Lyhyesti ja yksinkertaisesti "Econometrics" on tilastollisten menetelmien soveltamista talouslukujen välisten riippuvuussuhteiden selvittämiseen. Ekonometrian perustyökaluksi Wikipediassa mainitaan lineaarinen regressioanalyysi. Yksinkertainen lineaarinen regressioanalyysi onnistuu nykyisin jopa Excelistä Analytiikka-lisäosan avulla, mutta järeämpien maksullisten ohjelmistojen ja älyteknologian avulla onnistuvat nykyisin hyvinkin mutkikkaat monimuuttujaiset ja myös epälineaariset mallinnukset.

Regressioanalyysi markkinointipanostusten ja myynnin riippuvuuden laskentaan

Regressioanalyysilla voidaan tutkia minkä tahansa kahden tai useamman muuttujan riippuvuutta. Usein kouluesimerkit regressioanalyysista liittyvät esim. koulutuksen ja palkkatason yhteyteen, tai terveysasioihin, kun analysoidaan onko jollain asialla yhteyttä sairastumiseen (kuten tupakointimäärä - keuhkosyöpä) jne. Mediatoimistoissa on vuosikausia pyritty analysoimaan eri markkinointipanostusten kustannustehokkuutta, ja miten erilaisilla panostuksilla eri mediakanaviin saadaan aikaan myyntiä, jolloin regressioanalyysin vähäinen hyödyntäminen toimialalla on suorastaan yllättävää. 

Digimarkkinoinnin puolella on kuitenkin jo 2000-luvun alusta asti analysoitu hyvinkin tarkkaan Web-analytiikan avulla eri liikenteen lähteiden konvertoitumista haluttuihin tavoitetapahtumiin, kuten myyntitransaktio, yhteydenottopyyntö tai vaikkapa vierailu hinnastossa tai yhteystiedot-sivulla. Aluksi lukuja tulkittiin turhankin yksioikoisesti ja tehtiin hätäisiä päätelmiä eri kanavien toimivuudesta, mutta Web-analytiikka on edellisen 10 vuoden aikana kehittynyt nopeasti, ja nyt attribuutiomallinnusten ja tekoälyyn perustuvien ohjelmistojen avulla voidaan tehdä hyvinkin edistyksellisiä laskelmia myös monikanavaisen markkina-analytiikan osalta. Eli suomeksi sanottuna pystytään huomiomaan ostopolun eri vaiheet ja ymmärretään se, että eri kanavat ovat ostopolun eri vaiheessa mukana.

Regressioanalyysi täydentää analytiikka erityisesti offline-myynnin ja offline-panostusten osalta

Web-analytiikan avulla on kuitenkin haastavaa päätellä verkon ulkopuolisten markkinointipanostusten toimivuutta, samoin kun digikanavien vaikutusta offline-myyntiin. Tietenkin jos on kyse satojen tuhansien eurojen TV-kampanjasta tai monimediakampanjasta, voidaan olettaa, että kampanjan alkaessa sekä liikenne asiakkaan sivustolla että myynti kiihtyvät. Erilaisin dashboardein ja grafiikoin on helppo todentaa, että kampanjan käynnistyessä sekä saittiliikenne että myynti lähtevät nousuun, ja vastaavasti kampanjan päättyessä vastaavat luvut putoavat.

Mutta kuinka suuri osa todetusta kasvusta oli minkäkin kanavan ansiota - etenkin, jos kyse on ollut monimediakampanjasta, jossa on samaan aikaan tai lähes samoina päivinä käynnissä useampia erilaisia mediakampanjoita esim. televisiossa, radiossa, netissä ja printissä? Juuri tällaisiin asioihin regressioanalyysillä voidaan menestyksekkäästi etsiä vastauksia. Regressioanalyysilla voidaan tutkia minkä tahansa muuttujien keskinäistä riippuvuutta, parhaina esimerkkeinä markkinoinnin osalta:

  • markkinointipanostukset eri kanaviin selittävinä muuttujina
  • muut mahdolliset myyntiin vaikuttavat tekijät, esim. lämpötila, kilpailijoiden panostukset, ilmainen näkyvyys mediassa, kausivaihtelut jne.

    Vastaavasti riippuvina (selitettävinä) muuttujina, joihin selittävien muuttujien yhteyttä analysoidaan:
  • myyntiluvut  (sekä verkossa että verkon ulkopuolella!)
  • myymäläkävijäliikenne 
  • sivustoliikenne tai liikenne tietystä lähteestä (suora tulo, orgaaninen haku, maksettu haku)

Minkälaisia tuloksia ja ennusteita analyysin avulla saadaan?

Monimuuttujaisen regressioanalyysin avulla pyritään rakentamaan malli, jolle saadaan laskettua selitysaste, kuinka monta prosenttia esim. myyntiluvuista malliin valitut eri tekijät yhteensä selittävät. Pelkkien markkinointipanostusten avulla harvoin päästään kovin korkeisiin selitysasteisiin, mutta ottamalla esim. normaalit sesonkivaihtelut ja hyvin tiedossa olevat myyntiin keskeisesti vaikuttavat muuttujat mukaan analysiin, saavutetaan jo 80-90 % selitysasteita. Sadan prosentin selitysastetta ei ole realistista saavuttaa, koska aina satunnaiset ja tuntemattomiksi jäävät tekijät selittävät osan ihmisten ostokäyttäytymisestä.

Koko mallin selitysaste ei kuitenkaan ole käytännössä analyysin avainasia, vaan tietenkin yritysjohtoa ja markkinointijohtoa kiinnostaa eniten yksittäisten selittävien muuttujien korrelaatiokertoimet myyntilukujen kanssa. Näille saadaan kullekin laskettua myös tilastollinen merkitsevyys, eli kuinka luotettava on laskettu tulos, esim. 95 %, 99 % varmuudella tulos ei johdu sattumasta.

Alla esimerkissä on laskettu Excelissä yhden muuttujan lineaarisen regressioanalyysin avulla korrelaatio erään mainostajan maksetun haun panostusten ja myyntieurojen välillä. Korrelaatiokertoimen (alla taulukossa Multiple R, käännetty "Kerroin R") arvo voi vaihdella miinus yhdestä plus yhteen, eli mitä lähempänä ollaan ykköstä, sitä tiiviimmin muuttujien luvut liikkuvat samaan suuntaan, mutta syy-seuraussuhdetta korrelaatio ei todista. Jos esim. yritys on päättänyt, että aina kiinteästi sama %-osuus myynnistä sijoitetaan viikoittain tai kuukausittain johonkin markkinointikanavaan, korrelaatio panostusten ja myynnin välillä on automaattisesti korkea, eikä tarkoita sitä, että ko. panostus selittäisi myynnin kasvun. Vaihtelemalla panostusta kuukausittain on kuitenkin helppo testata, kasvaako myynti panostuksen myötä ja missä suhteessa. Regressioanalyysi laskee tälle suhteelle kaavan ja sitä kautta ennusteen.

Lineaarinen regressioanalyysi tuottaa tulokseksi mallin ja yksinkertaisen laskentakaavan, jonka avulla voidaan yrittää ennustaa, minkälaisella yhtälöllä myyntitulot kasvaisivat erilaisin panostuksin. Esimerkissä myyntitulot toteutuisivat lineaarisen mallin mukaan yhtälöllä "Myynti = 1.3492 * panostus + 1526,90 euroa". Viimeksi mainittu vakio 1.526,90 euroa kertoo siis myynnin keskimäärin silloin, kun panostukset ovat nolla. 1.3492 on regressio- eli kulmakerroin, siis kuinka jyrkästi myynti kasvaisi markkinointipanostuksia lisättäessä. Tämä on markkinoinnin kustannustehokkuuden kannalta äärimmäisen tärkeä luku. Nythän kaavasta voidaan laskea, että esimerkiksi kymppitonnin mainospanostuksella saataisiin runsaan 15.000 euron myynti - ei siis vielä mikään huikea ROAS (Return of Ad Spend).

Käytännössä hakumainonnan osalta lineaarinen malli ei toteudu, koska valitulle avainsanajoukolle tulee ennen pitkää maksimi, jonka jälkeen lisäliikennettä ei kampanjaan valituilla avainsanoilla saada - koska niitä ei haeta enempää. Ja jos avainsanajoukkoa laajennetaan, uusien avainsanojen konversio ei välttämättä ole samaa tasoa kuin aiempien, jolloin todennäköistä on, että kannattavuus laskee, eli kulmakerroin ei pysy kaavan mukaisena.

Excel-taulukosta kannattaa huomata Microsoftin kömpelöt käännösvirheet: R Square on menty kääntämään "Korrelaatiokertoimeksi", vaikka kyse on Selitysasteesta. Oikea korrelaatiokerroin on tunnusluvuissa ylimpänä, ja se on jostain syystä nimetty "Kerroin R". Korrelaatiokerroin on esimerkissä 0.8869 eli hyvin korkea, ja selitysaste on esimerkissä 78,67 % eli varsin hyvä - jos se olisi täydet 100 %, malli olisi kelvoton. Jälkimmäinen luku siis kertoo, kuinka suuren osan vastemuuttujan vaihtelusta regressiomalli selittää. Vastaavasti "Tarkistettu korrelaatiokerroin" on puuta heinää käännöksenä, sillä kyse on "Adjusted R Square:sta", jonka oikea käännös olisi "korjattu selitysaste". Ko. luku oikaisee sen, että jokainen malliin lisättävä uusi muuttuja lisää varsinaista selitysastetta, vaikka näin ei olisi todellisuudessa. Korjattu selitysaste siis heikkenee, jos malliin lisätään muuttujia, jotka eivät selitä vastemuuttujan vaihtelua.

Korrelaatio_esimerkki

Korrelaatiokertoimista toimenpidesuosituksiin

Korrelaatio- tai regressioanalyysien kritiikissä aina muistutetaan, että korrelaatio, kahden asian todettu riippuvuussuhde ei aina tarkoita sitä, että toinen on syy ja toinen seuraus. Kaikki muistavat klassiset esimerkit vaikkapa jäätelönsyönnin ja hukkumiskuolemien välillä. Jäätelönsyönti ei kuitenkaan johda hukkumisalttiuteen, vaan vahvan korrelaation selittääkin väliintuleva muuttuja - lämpötila, kun molemmat asiat lisääntyvät helteellä.

Yhtä lailla regressioanalyysi voisi vahvistaa markkinointipäättäjien konservatiivista, vuosikausia jatkunutta vakiintunutta käytäntöä panostaa siihen, mihin "aina ennenkin on panostettu". Konkreettisena ja todellisena esimerkkinä huonekaluala, jossa huonekalujen vähittäiskauppiaat vuosikymmeniä satsasivat koko sivun tai aukeaman kokoisiin sanomalehtimainoksiin. Vaikka sanomalehtien tavoittavuus romahti ja ihmisten ostokäyttäytyminen oli siirtynyt osin nettiin, mitään ei muutettu, koska "aina ennenkin on luotettu sanomalehtimainontaan". Syöttämällä Exceliin markkinointipanostukset ja myyntiluvut vuorokausitasolla saataisiin kiistämättä vahva korrelaatio sanomalehti-ilmoittelun ja myynnin välille: lauantaisin jos on viikoittain sanomalehti-ilmoitus, juuri silloin kauppa täyttyy asiakkaista ja kuukauden myyntipiikit osuvat samoin aina lauantaille.

Businessanalytiikan avulla pitää kuitenkin osata haastaa myös konservatiiviset toimintamallit ja "aina ennenkin on tehty näin" -logiikka. Olennainen kysymys esimerkin tapauksessa on tietenkin se, että mitä tapahtuu, jos yhtenä lauantaina sanomalehti-ilmoitusta ei olekaan? Entä jos sama panostus käytetäänkin torstaina tai perjantaina? Entä jos sama panostus käytetään muihin kanaviin? Vasta kun analysiin saadaan riittävän monta havaintoa erilaisista kombinaatioista, voidaan tehdä luotettavia päätelmiä siitä, mikä on aidosti eri kanavien rooli ja yhteys myymäläkävijöihin, saittikävijöihin asiakkaan web-sivuilla ja ennen muuta myyntilukuihin. Jos mitään variaatiota toimenpiteissä ei ole, syy-seuraus-suhteet ovat mutun varassa. A/B-testaamista tarvitaan siis muuallakin kuin verkkokaupassa!

Eri selittävien muuttujien lisääminen analyysiin, uusien selittävien asioiden löytäminen, ja lukujen tulkinnat eivät tule mistään matemaattisesta kaavasta, vaan nämä juuri ovat analyytikon ammattiosaamista. Kuten mikä tahansa analytiikka, pelkät numerot ja tilastot eivät johda mihinkään. Väärin tulkittuna tilastot voivat myös johtaa vääränlaisiin päätelmiin. Esimerkin tapauksessa analyysissä pitäisi huomioida kunkin viikonpäivän keskimyynti silloin, kun mainospanostuksia ei ole - ja laskea ilmoittelun tuoma lisämyynti vasta tämän ylittävältä osalta. Lauantaina kun tyypillisesti hoidetaan huonekaluostokset silloinkin, kun mitään kampanjaa ei ole.

Parhaimmillaan analytiikka alan ammattilaisen tulkitsemana on kuitenkin loistava työkalu johtaa liiketoimintaa, karsia liian kallista tai tehotonta toimintaa tai panostuksia, ja siirtää panostuksia kustannustehokkaampiin kanaviin.

Mainostoimistoissa työskentelevät jaksavat myös lakkaamatta muistuttaa luovan ratkaisun avainroolista - ja he ovat tässä aivan oikeassa. Tämänkin osalta A/B-testaus olisi äärimmäisen tärkeää, sillä sama viestikärki ei aina tehoakaan kaikkiin ihmisiin, ja osaa asiakkaista voisi puhutella eri viesti. Esimerkiksi ohjelmallinen ostaminen tarjoaa nykyisin loistavat työkalut analysoida ja optimoida lukuisia eri muuttujia: eri tuotteet, eri luovat ratkaisut, eri kohderyhmät, eri kanavat - kaikkien yhteys eri tavoitteisiin (mainosklikki, sivustovierailu, konversiopiste sivustolla, ostotapahtuma) voidaan mitata ja analysoida. On aivan takuuvarmaa, että analysoimalla tuloksia ja optimoimalla kampanjoita tulosten mukaisesti saavutetaan todella merkittäviä kustannustehokkuuden kasvuja. Mikään ei ole kalliimpaa kuin jättää mittaus ja analyysi tekemättä, ja luottamalla "näin on ennenkin tehty" -mutuun!

Analytiikka on jatkuvasti yhä keskeisemmässä roolissa markkinoinnissa, ja analytiikan käyttö lisääntyy nopeasti. Ekonometriasta on Aalto-yliopistossa nykyisin oma kurssinsa. Hyvä niin, sillä alan osaajat ovat vielä harvassa!

- Ismo Tenkanen

 

 

 

 

 

 

 

 


TNS Metrix vaihtui FIAM:iin

TNS Metrix perustettiin vuonna 2004, kun TNS Gallupin kilpaileva yritys Nielsen oli ottanut aiemman verkkomedioiden valuuttamittauksen (Nielsen SiteCensus ja sen edeltäjä RedSheriff) haltuunsa. Kotimaiset mediat Sanomien johdolla eivät tykänneet ajatuksesta, että Suomen verkkomediamittausta johdettaisiin ulkomailta, kun Nielsen pyrki hallinnoimaan Suomen tilejä Tukholmasta käsin, ja ruotsalaisin voimin. Vastavetona Nielsenille muutamassa kuukaudessa koodattiin kilpaileva verkkomedioiden suoramittaus TNS Metrix, johon liittyivät kaikki kotimaiset verkkomediat ja muutama ulkomainenkin kuten Microsoftin MSN.

TNS Metrix ehti olla Suomen verkkomedian kävijämittauksen valuuttamittari reilusti yli 10 vuotta - parhaimmillaan sitä käytti yli 200 sivustoa, vaikka rinnalle oli ilmaantunut monin verroin järeämpiä pelureita Google Analyticsista alkaen. Evästepohjainen mittaus on ajan myötä kohdannut yhä rajumpia haasteita, kun älypuhelimet, tabletit ja muut mobiilit sekä applikaatiot ovat tulleet desktop-laitteiden rinnalle, ja samaa sivustoa voidaan päivän aikana käyttää kolmeltakin eri päätelaitteelta ja erilaisista sovelluksista. TNS Metrix oli kuitenkin tutkimustalon ylläpitämä ja hallinnoima mittaus, jolla saatiin tuomaroitua verkkomedioiden kävijäluvut jonkinlaiseen suuruusjärjestykseen, ja medioiden keskinäinen kauneuskilpailu siitä, kuka on suurin ja kaunein, yhdelle sivustolle julkiseksi.

Paneeli suoramittauksen rinnalle

Eväste- ja verkkoliikenne-pohjaisen mittauksen jatkuvasti kasvavissa ongelmissa yhä useampi mediatalo alkoi toivoa paneelipohjaista tutkimusta. TNS Metrixin suurin kritiikki esim. mainostaja- ja mediatoimistopuolella oli jatkuvasti ulkomaisten valtamedioiden, kuten Google, Facebook, Amazon, MSN puuttuminen listoilta, etenkin kun niihin ohjautui kotimaisesta verkkomainonnasta yhä suurempi siivu.

ComScore aloitti Suomessa kymmenkunta vuotta sitten, ja sen toivottiin ratkaisevan monet TNS Metrixin ongelmat, mutta erilaiset päätelaitteet, paneelikoon pienuus ja sitä kautta datan epätarkkuus nousivat paneelimittauksen ongelmiksi. Käytännössä mediatoimistoissa äkkiä nähtiin, että ilman suoramittausta ei paneelilukuihin ollut mitään luottamista, vaan tarvittiin hybridiä, joka yhdistäisi paneelidatan kaikesta Internet-käytöstä ja sivustoihin tageilla kytketyn suoramittauksen, jolla paneelin vinoumia voitiin korjailla. Selvällä suomen kielellä ComScoren datasta voitiin luottaa vain lukuihin, joissa paneelilukuja oltiin kalibroitu tagitetyn sivustomittauksen tiedoilla. Ja ne sivustot, jotka eivät olleet tagittaneet ComScoren koodeilla sivujaan, eivät olleet datassa uskottavilla luvuilla. Näin kävi mm. lukemattomille verkkokaupoille, vaikka niiden kävijämääriä, päällekkäisyyksiä ja tavoittavuuksia eri mediakombinaatioilla olisi ollut erityisen mielenkiintoista seurata paneelipohjaisesta datasta.

FIAM korvaa TNS Metrixin julkisen tilaston

ComScoren politiikkana ei ole ollut julkistaa avoimesti lukujaan, mutta Suomen isot verkkomediat halusivat TNS Metrixin korvaavaksi tilastoksi julkisen listauksen kotimaisista verkkomedioista ja niiden kuukausitavoittavuuksista. Tätä tehtävää varten on perustettu ja vihdoin saatu avattua FIAM:n listaus suurimmista kotimaisista verkkomedioista.

Vaikka data perustuu nyt ComScoren hybrididataan - eli data on paneelimittauksen ja saittimittauksen kombinaatio, niin ulkomaisia sivustoja ei ole kelpuutettu mukaan. Listaus on todellakin kuin TNS Metrixin kopio kaikkine sen vikoineen: mainostajalle kaikkein tärkeimmät mediat puuttuvat ja niiden tilalla on korkeintaan mediatalojen vuosikertomuksia palvelevia "verkostokombinaatioita", joiden luvuilla kukaan mainostaja ei tee yhtään mitään. Käsi sydämelle: kuinka moni Sanomien vuosikertomusta laativan sisäpiirin ulkopuolelta tarvitsee esimerkiksi tietoa, mikä on Nelonen Media -nimisen organisaation hallinnoimien yhdeksän domainin kuukausittainen nettotavoittavuus? Siis: Nelonen Media muodostuu sivustoista Ruutu.fi, Nelonen.fi, Radiosuomipop.fi, Radiorock.fi, Radioaalto.fi, Hitmix.fi, Loop.fi, Radioaalto.fi, Supla.fi.

Samanlaista tuubaa lista on täynnänsä, sillä myös listan "suurimmat verkkomediat" ovat oikeasti mainosverkkoja, eivät yksittäisiä sivustoja. Lista ei oikeasti minusta palvele edes verkkomedioiden sisäistä kauneuskilpailua, sillä lista ei paljasta, kumpi on suurimpi sivusto, Iltasanomat.fi vai Iltalehti.fi, koska Iltasanomat.fi-domainin tavoittavuutta ei paljasteta, vaan Iltasanomien tavoittavuuslukuun on rengastettu kymmenkunta muuta domainia, joita Iltasanomat mielestään pitää osana omaa mediaan. Moni mainostaja voisi olla eri mieltä. Ainakin silloin, jos omat mainokset päätyvät 3. osapuolen mittausdatan perusteella johonkin ihan muuhun domainiin, kuin mitä mediatoimisto tai mainostaja on mielestään ostanut, ja jossa IS:n logokin hukkuu aivan eri näköiseen look & feeliin. Katsokaapa malliksi Supersää, jota myydään osana Iltasanomia. Sivustolla kävijöiden luvut siis kirjautuvat FIAM:in listalla Ilta-Sanomien tavoittavuuslukuihin, vaikka saitin kävijöillä ei lienee harmaata hajua siitä, että ovat vierailleet IS:n hallinnoimalla sivustolla.

Aivan yhtä perusteltuja ja relevantteja media/mainosverkostoja olisivat FIAM:in listalle vaikkapa Fonecta Mediat (yli 50 sivustoa), Alma Median omistuksessa olevat mediat (varmaankin toistasataa sivustoa), Microsoft AdExchange -mainosverkko, City Digitalin sivustot ja DoubleClick AdExchange -mainosverkko (by Google). Entä sitten, jos MSN, Yahoo, Google tai muu ulkomainen taho päättää jonain päivänä perustaa sivuston, jossa on sekä Suomessa tunnetun mediatalon logo että kv. pelurin logo - hyväksytäänkö sekin listalle? Tämä ei ole kuvitteellinen case, sillä tällaisia on ollut ja on edelleen olemassa, esim. Microsoftin Urheilusivuston Formula-osion sisällön tuottaa tällä hetkellä MTV, ja sivustolta löytyy sekä MSN:n että MTV:n logo. Miksi tämä ei voisi olla FIAM:in listalla, samoilla argumenteilla kuin Ilta-Sanomien myymä mainosverkko, joka on FIAM:in listan suurin "mainosmedia"?

Msn-mtv

Tarvitaanko FIAM:ia mihinkään?

Verkkomedia on pian Suomessakin suurin mainosmedia, ja siinä pyörivät isot mainosrahat, joten varmasti jonkinlainen mediavaluutta toimialalle tarvitaan. On ymmärrettävää, että jos leikin ja kauneuskilpailun maksavat yksin kotimaiset meditalot, ne eivät halua listoilleen Facebookeja eikä Googleja. FIAM:in takana ovat jo kaikki suurimmat kotimaiset mediatalot, ja niiden resursseilla ja hybridimittauksella olisi mahdollista luoda aito valuuttamittaus, jossa olisivat rinta rinnan Google, Facebook, Iltasanomat ja Iltalehti. En tiedä, halutaanko sellaista.

Mediatoimistonäkökulmasta FIAM:in tarjoama listaus ja ComScoren data eivät ole enää tapa toteuttaa mediasuunnittelua. Lähtökohtana eivät ole enää demografiset brutto- ja nettopeitot, joista pyritään laskemaan muutaman kampanjaan poimitun median kokonaistavoittavuus. Kun ohjelmallisella ostamisella toteutettu kampanja pyöräytetään perjantaina käyntiin, mediatoimistolla on maanantaina 6-8000 riviä dataa URLeista tai applikaatioista, joissa mainos on näytetty vähintäänkin yhden kerran. Tästä lähdetään karsimaan medioita, ei poimimaan muutamaa mediaa.

Mediasuunnittelijalle ja mainostajalle avainasia karsinnassa ei olekaan enää median CPM-hinta tai kustannus per 1000 uniikkia kävijää, vaan CPA-hinta eli hankintakustannus per konversiopiste. Konversioksi käy ostotapahtuma, liidi tai vierailu mainostajan yhteydenottosivuilla tai hinnastossa. Mainostaja ostaa siis kampanjalleen tuloksia ja tehoja, ei pelkästään medianäkyvyyttä. Ja parhaat tulokset saakin mainoksia kohdentamalla, ei niitä satunnaisesti levittämällä.

Jos tämä halutaan tiivistää yhteen lauseeseen, mainostaja ja mediatoimisto eivät enää osta mediaa vaan yleisöjä.

- Ismo Tenkanen

 

 

 


Vauhtia verkkokauppaan Amazonin kautta

Suomi lienee maailmankaikkeuden ainoa kansa, jossa verkkokauppa lähtökohtaisesti aloitetaan "varmuuden vuoksi" pelkällä kotimaan kaupalla. Sehän on helppoa: tehdään sivusto vain suomen kielellä, valitaan maksutavoiksi postiennakko ja kotimaan pankit ja toimitetaan tavarat Postin tai Matkahuollon kuljetuksilla. Ei taatusti tule ulkomaan tilauksia häiriöksi.

En voi sen sijaan kuvitella ruotsalaista, norjalaista tai tanskalaista, joka aloittaisi verkkokaupan ajattelemalla vain kotimaan kauppaa. Kun asuu jo itsekin lähempänä Euroopan suuria maita, halutaan lähtökohtaisesti asiakkaita myös muualta Euroopasta, jollei saman tien ympäri maailmaa. Kun kerran maailmanlaajuisessa verkossa ollaan, miksi pitäytyä yhden pienen maan rajojen sisälle? 

Jokaiselle verkkokauppiaalle uuden kaupan arki alkaa siitä, kun käynnistää verkkokaupan, ja huomaa, että kävijäliikenne on kovin vähäistä, ja niistäkin harvoista, jotka kauppaan eksyvät, vain yksi tai kaksi sadasta päätyy ostoon. Liikenteen ostaminen rahalla on helppoa vaikkapa Googlen avulla, mutta uuden asiakkaan hankintakustannus on helposti kymppejä tai satasia, jolloin pitää myydä hyvin arvokkaita tuotteita, jotta panostus tulisi heti plusmerkkisenä takaisin. Uutiskirjeen tilaajien ja Facebook-tykkääjien kerryttäminen nollasta vie aikansa. Entäs jos menisi myymään suoraan sinne, jossa asiakkaita on jo miljoonittain?

Nopein tie kv. kauppaan Amazonin kautta

Englannin Amazoniin pääsi itsekin myymään siinä vaiheessa, kun Amazon ei enää vaatinut Marketplace-myyjiltään pankkitiliä Englannissa, vaan IBAN-pankkitilinumero riitti suomalaisiltakin yrityksiltä. Tänä päivänä 25 punnan kuukausimaksulla voi kirjautua ammattimaiseksi Amazon-kauppiaaksi, ja samalla kuukausimaksulla Amazon-inventaarionsa voi monistaa jo viiteen eri maahan, eli Englannin Amazonin ohella tuotteet siirtyvät napin painalluksella (ja automaattisella valuuttakurssimuutoksella) eurohintaan myyntiin Saksan, Ranskan, Italian ja Espanjan Amazoneihin. Ja toisin kuin esim. eBayssa, Amazoniin tavaran syöttäminen myyntiin ei maksa mitään - Amazonin komissio (tuoteryhmäkohtainen, usein n. 15 % kokonaishinnasta ml. postikulut)  ja ns. closing fee per tuote maksetaan vain jos ja kun tavara menee kaupaksi. Milloin tahansa tuotteen voi myös poistaa myynnistä, jos viimeinen kopio meneekin kaupaksi omassa verkkokaupassa.

Edelleenkään en keksi yhtään järkevää syytä, miksi ei kokeilisi ulkomaan kauppaa Amazonissa, jos on jo kerännyt verkkokauppaansa ison määrän tavaraa, jolle haluaa vilkkaampaa kiertoa. Kilpailu Amazonissa on toki erittäin kovaa, ja jos myy tuotteita, joita saa ympäri maailmaa, niin samaa tuotetta voi olla kauppaamassa kymmeniä muita Amazon Marketplace -kauppiaita. Siksi onkin enemmän kuin suositeltavaa, että itsellä on myynnissä tavaroita, joita ei ihan joka kaupasta saa, ja pystyy itse tuottamaan tai ostamaan niitä kilpailukykyiseen hintaan. Suomen korkea ALV 24 % ei asiaa ainakaan helpota, sehän pitää tilittää täysmääräisenä myös EU-kuluttajille myytäessä.

Toimitus Amazonin kautta - Fulfilled by Amazon

Heti kun kirjautuu Amazon-kauppiaaksi, Amazon alkaa houkutella kauppiaitaan toimittamaan tavarat suoraan Amazonin täyttökeskukseen (Fulfillment Center), joita on ympäri Eurooppaa. Verkkokauppias, joka haluaa pitää piuhat omissa käsissään, ja toimittaa kaikki tuotteet asiakkailleen itse, tai uskoo oman verkkokaupan kasvuun paremmin kuin Amazon-myyntiin, keksii mielessään monia syitä, miksi tuotteet on parempi toimittaa itse. Yksi todellinen syy voi olla se, että tuotevarastoa on vielä niin niukalti, ettei sitä halua pirstoa useampaan varastoon eri maihin, ja entä jos tuleekin tilaus omasta verkkokaupasta tuotteelle, jonka viimeisen kopion lähetin juuri Amazonin varastoon?

Varaston kasvaessa mahdollisuus kokeilla Amazonin FBA-palvelua (Fulfilled by Amazon) alkaa kuitenkin houkutella yhä enemmän. Amazonin sivuilla markkinoidaan FBA-palveluja , ja kerrotaan Amazonin toimitusten eduista. Amazonin sivuilla on myös laskuri vertailuun siitä, mitkä ovat kauppiaan kustannukset, kun toimittaa tuotteen itse kuluttajalle versus siihen, että Amazon lähettää tuotteen. Näissä pitää muistaa, että:
- tuotteen lähettäminen Amazonin varastoonkin maksaa jotain
- kun Amazon postittaa tuotteen, se maksaa myös pakkausmateriaalit
- työllä, jonka kauppias tai hänen työntekijänsä itse käyttää postittamiseen, on toki myös oma hintansa
- asiakaspalvelun ja palautusriesat hoitaa Amazon, jos tuote on Amazonin lähettämä

Amazon_calculator


Käytännössä tuosta laskurista on helppo nähdä, että kiinteät kustannukset yhden tuotteen toimittamisesta asiakkaalle kasvavat turhan suuriksi, jos myy alle kympin tuotteita. Etenkin cross border -maksut muihin Euroopan maihin nostavat Amazonin palkkiot äkkiä 50 prosenttiin myyntihinnasta, jolloin edes kolminkertainen kate ei jätä juuri mitään kauppiaalle. Joku totesikin jo Facebookin Amazon-kauppiaitten keskustelussa, että ostohinta tai tuotteen valmistuskustannus pitää Amazonissa pystyä kertomaan 3,5:llä, jotta Amazon-myynti kannattaa. Ihan joka verkkokauppa ei tuollaiseen katekertoimeen pysty. Cross border -maksut välttää kokonaan tai osittain sallimalla Amazonin pilkkoa yhteen Euroopan maahan toimitettu inventaario useampaan EU-maahan, mutta samalla pitää rekiströityä ALV-verovelvolliseksi kuhunkin maahan, jossa tuotteita aikoo varastoida.

Amazon_fba

Yllä kuva Amazonin markkinointimateriaalista European Fulfillment -verkosta, jossa varasto sijoitetaan vain yhteen maahan, josta toimitukset muihin EU:n Amazon-maihin.

Tärkein unohtui - kasvu!

Kaikissa näissä laskureissa ja hintavertailuissa unohtuu helposti tärkein asia: myynnin määrä ei suinkaan ole vakio, myykö tuotteen itse Amazonin marketplace -kauppiaana - vai toimittaako tuotteet Amazon eli Fulfilled by Amazon. Tähän ajatusharhaan itsekin olin ratkennut, kun etukäteen laskin, miten pystyn toimittamaan tuotteen hyvin itsekin kustannustehokkaasti. Aktiivisena Marketplace-kauppiaana ja Amazonin marketplace -kauppialta yli 10 vuotta tilanneena olin myös täysin sokaistunut siihen, kuinka harva oikeasti viitsii Amazonissa tilata yhtään mitään Marketplace-myyjiltä, jotka sijaitsevat tuhansien kilometrien päässä, ja joiden toimitukset kestävät 3-4 viikkoa postissa? Pieni gallup-kierros omassa kaveripiirissäkin jo paljastaa, että hyvin harva. Tai mietipä keskivertoamerikkalaista kuluttajaa, kuinka moni haluaa tilata tuotteen muutaman taalan säästääkseen jostain jääkarhujen maasta Finland EU, jos sen saa 2-3 päivässä kotiinsa Amazonin itsensä toimittamana?

Näissä laskureissa unohtuu helposti myös mahdollisuus siihen, että tuotteen VOI hinnoitella kalliimmaksi, jos sen toimittaa Amazonin varastoon. Fakta kun on, että Amazon-asiakas on valmis maksamaan tuotteesta muutaman punnan tai euron enemmän, jos se tulee suoraan Amazonilta, sen saa Amazon Prime-palvelussa postikuluitta (Primeen pääsee mukaan heti kun liittyy FBA-toimituksiin) tai tuotteen saa edullisena pikatoimituksena (Expedited delivery) sovittuna toimituspäivänä. Tarkistin juuri, että edellisen 30 päivän FBA-tilauksista peräti yli puolet (!) oli tilannut lähetyksen pikatoimituksena. Syy tilata Amazonista on siis usein juuri se, että halutaan tuote mahdollisimman pian - hinta on toissijainen. 

Juuri siksi FBA-toimituksessa olevat tuotteet menevät kaupaksi silloinkin, kun ne eivät ole se halvin vaihtoehto eri myyjien välillä. Selvällä suomen kielellä siis hintaa voi surutta nostaa, kun tuotteen toimittaa Amazonin jakeluun!

Ihan oma asiansa erikseen on vielä se, miten Amazon avoimesti ja häpeilemättä suosii FBA-myyjiä. Jokaisen tuotteen kohdalla on ns. "Buying Box", eli Amazon asettaa jonkin eri myyjien hinnoista ostolaatikkoon, josta klikkaamalla pääsee suoraan tilaukseen. Pienet indie -marketplace-kauppiaat eivät käytännössä pääse tuohon Buying Boxiin lainkaan, elleivät ole jo keränneet tuhansia positiivisia ostoarvioita liki 100-prosenttisella positiviisella palautteella. Buying Boxiin pääsee sen sijaan heittämällä, jos on toimittanut tuotteen Amazonin varastoon myyntiin, vaikka olisi kuinka monta Marketplace-kauppiasta tarjoamassa samaa tuotetta jopa kolmas- tai neljäsosahinnalla, mutta haluavat toimittaa tuotteet itse. Jälleen kerran: tämä mahdollistaa, että FBA-varastoon tavaransa toimittanut kauppias voi hinnoitella tuotteen kalliimmaksi, ja silti se menee herkemmin kaupaksi, kuin edullisemmat itsenäisten toimittajien tuotteet!

Se, mikä on ero itsenäisesti tuotteensa toimittavien verkkokauppiaiden ja FBA-jakeluun toimittavien verkkokauppojen välillä, riippuu tietysti lukemattomista muuttujista, mutta lyhyenkin kokeilun perusteella voi havaita, että oma Amazon-myynti vähintäänkin 4-5-kertaistuu FBA-jakelun ansiosta. Sekä kasvun mahdollisuus että ennen muuta mahdollisuus hinnoitella tuotteensa kalliimmiksi ovat kuitenkin ne kaksi asiaa, joiden perusteella FBA:ta voi varauksetta suositella, jos verkkokaupan varastossa on tuotteita, joille haluaa ripeämpää kiertoa. Edelleen on siis kauppiaalla vapaa mahdollisuus päättää, kuinka pienen tai suuren osan inventaariostaan lähettää FBA-jakeluun ja minkä osan haluaa pitää itsellään.

Ota reippaasti yhteyttä, jos haluat kuulla Amazon-kokemuksista lisää. Kerron mielelläni lisätietoja.

- Ismo Tenkanen