TNS Metrix vaihtui FIAM:iin
Uusi mittaamisen kulttuuri tulee nuoren sukupolven mukana

Econometrics - mitä se on?

Digikanavien osalta Web-analytiikka on jo pitkään tarjonnut mahdollisuuden analysoida eri liikenteen lähteiden ja kanavien toimivuutta ja kustannustehokkuutta mainostajan näkökulmasta. Mutta miten päästään analysoimaan offline-mainonnan - kuten TV-mainonta, radiomainonta, printtimainonta - yhteyksiä myyntilukuihin (myös verkon ulkopuolella) ja saittiliikenteeseen? Juuri tähän tarjoaa Econometrics ratkaisun.

Econometrics-dashboard

Ekonometriset mallinnukset mediatoimistoissa

Kansainvälisessä mediatoimistossa seitsemän vuotta työskenneltyäni tiesin hyvin, että globaalit toimistot pyysivät isoilta mainostajilta myyntilukuja ja markkinointipanostuslukuja, ja näiden pohjalta tehtiin sitten laskelmia, miten eri mediapanostukset korreloivat myyntiin, Luvut lähetettiin analytiikkaan erikoistuneelle yksikölle, ja parissa päivässä saatiin luvut, jotka kertoivat eri kanavien korrelaatiot myyntiin, ja näiden pohjalta laadittiin sitten asiakkaalle vuositason suositukset, mihin kanaviin ja kanavakombinaatioihin kannattaisi jatkossa panostaa enemmän.

Toisaalta olin markkinointialan tapahtumissa ja seminaareissa ollut kuuntelemassa useampaan kertaan case-esimerkkejä isojen mainostajien ekonometrisistä mallinnuksista, joiksi kutsuttiin matemaattisia mallinnuksia, joilla pyrittiin laskemaan eri tekijöiden osuutta myyntiluvuista: mukana mallinnuksissa olivat paitsi edellä jo mainitut markkinointipanostukset eri kanaviin, myös esimerkiksi säätila tai lämpöasteet, kilpailijoiden markkinointipanostukset ynnä muut tekijät, joiden oli havaittu osaltaan vaikuttavan suoraan myyntiin.

Mihin tilastotieteen metodiin ekonometriset mallinnukset rakentuvat? Jo pelkästään Wikipedian selitys termille Econometrics on varsin valaiseva. Lyhyesti ja yksinkertaisesti "Econometrics" on tilastollisten menetelmien soveltamista talouslukujen välisten riippuvuussuhteiden selvittämiseen. Ekonometrian perustyökaluksi Wikipediassa mainitaan lineaarinen regressioanalyysi. Yksinkertainen lineaarinen regressioanalyysi onnistuu nykyisin jopa Excelistä Analytiikka-lisäosan avulla, mutta järeämpien maksullisten ohjelmistojen ja älyteknologian avulla onnistuvat nykyisin hyvinkin mutkikkaat monimuuttujaiset ja myös epälineaariset mallinnukset.

Regressioanalyysi markkinointipanostusten ja myynnin riippuvuuden laskentaan

Regressioanalyysilla voidaan tutkia minkä tahansa kahden tai useamman muuttujan riippuvuutta. Usein kouluesimerkit regressioanalyysista liittyvät esim. koulutuksen ja palkkatason yhteyteen, tai terveysasioihin, kun analysoidaan onko jollain asialla yhteyttä sairastumiseen (kuten tupakointimäärä - keuhkosyöpä) jne. Mediatoimistoissa on vuosikausia pyritty analysoimaan eri markkinointipanostusten kustannustehokkuutta, ja miten erilaisilla panostuksilla eri mediakanaviin saadaan aikaan myyntiä, jolloin regressioanalyysin vähäinen hyödyntäminen toimialalla on suorastaan yllättävää. 

Digimarkkinoinnin puolella on kuitenkin jo 2000-luvun alusta asti analysoitu hyvinkin tarkkaan Web-analytiikan avulla eri liikenteen lähteiden konvertoitumista haluttuihin tavoitetapahtumiin, kuten myyntitransaktio, yhteydenottopyyntö tai vaikkapa vierailu hinnastossa tai yhteystiedot-sivulla. Aluksi lukuja tulkittiin turhankin yksioikoisesti ja tehtiin hätäisiä päätelmiä eri kanavien toimivuudesta, mutta Web-analytiikka on edellisen 10 vuoden aikana kehittynyt nopeasti, ja nyt attribuutiomallinnusten ja tekoälyyn perustuvien ohjelmistojen avulla voidaan tehdä hyvinkin edistyksellisiä laskelmia myös monikanavaisen markkina-analytiikan osalta. Eli suomeksi sanottuna pystytään huomiomaan ostopolun eri vaiheet ja ymmärretään se, että eri kanavat ovat ostopolun eri vaiheessa mukana.

Regressioanalyysi täydentää analytiikka erityisesti offline-myynnin ja offline-panostusten osalta

Web-analytiikan avulla on kuitenkin haastavaa päätellä verkon ulkopuolisten markkinointipanostusten toimivuutta, samoin kun digikanavien vaikutusta offline-myyntiin. Tietenkin jos on kyse satojen tuhansien eurojen TV-kampanjasta tai monimediakampanjasta, voidaan olettaa, että kampanjan alkaessa sekä liikenne asiakkaan sivustolla että myynti kiihtyvät. Erilaisin dashboardein ja grafiikoin on helppo todentaa, että kampanjan käynnistyessä sekä saittiliikenne että myynti lähtevät nousuun, ja vastaavasti kampanjan päättyessä vastaavat luvut putoavat.

Mutta kuinka suuri osa todetusta kasvusta oli minkäkin kanavan ansiota - etenkin, jos kyse on ollut monimediakampanjasta, jossa on samaan aikaan tai lähes samoina päivinä käynnissä useampia erilaisia mediakampanjoita esim. televisiossa, radiossa, netissä ja printissä? Juuri tällaisiin asioihin regressioanalyysillä voidaan menestyksekkäästi etsiä vastauksia. Regressioanalyysilla voidaan tutkia minkä tahansa muuttujien keskinäistä riippuvuutta, parhaina esimerkkeinä markkinoinnin osalta:

  • markkinointipanostukset eri kanaviin selittävinä muuttujina
  • muut mahdolliset myyntiin vaikuttavat tekijät, esim. lämpötila, kilpailijoiden panostukset, ilmainen näkyvyys mediassa, kausivaihtelut jne.

    Vastaavasti riippuvina (selitettävinä) muuttujina, joihin selittävien muuttujien yhteyttä analysoidaan:
  • myyntiluvut  (sekä verkossa että verkon ulkopuolella!)
  • myymäläkävijäliikenne 
  • sivustoliikenne tai liikenne tietystä lähteestä (suora tulo, orgaaninen haku, maksettu haku)

Minkälaisia tuloksia ja ennusteita analyysin avulla saadaan?

Monimuuttujaisen regressioanalyysin avulla pyritään rakentamaan malli, jolle saadaan laskettua selitysaste, kuinka monta prosenttia esim. myyntiluvuista malliin valitut eri tekijät yhteensä selittävät. Pelkkien markkinointipanostusten avulla harvoin päästään kovin korkeisiin selitysasteisiin, mutta ottamalla esim. normaalit sesonkivaihtelut ja hyvin tiedossa olevat myyntiin keskeisesti vaikuttavat muuttujat mukaan analysiin, saavutetaan jo 80-90 % selitysasteita. Sadan prosentin selitysastetta ei ole realistista saavuttaa, koska aina satunnaiset ja tuntemattomiksi jäävät tekijät selittävät osan ihmisten ostokäyttäytymisestä.

Koko mallin selitysaste ei kuitenkaan ole käytännössä analyysin avainasia, vaan tietenkin yritysjohtoa ja markkinointijohtoa kiinnostaa eniten yksittäisten selittävien muuttujien korrelaatiokertoimet myyntilukujen kanssa. Näille saadaan kullekin laskettua myös tilastollinen merkitsevyys, eli kuinka luotettava on laskettu tulos, esim. 95 %, 99 % varmuudella tulos ei johdu sattumasta.

Alla esimerkissä on laskettu Excelissä yhden muuttujan lineaarisen regressioanalyysin avulla korrelaatio erään mainostajan maksetun haun panostusten ja myyntieurojen välillä. Korrelaatiokertoimen (alla taulukossa Multiple R, käännetty "Kerroin R") arvo voi vaihdella miinus yhdestä plus yhteen, eli mitä lähempänä ollaan ykköstä, sitä tiiviimmin muuttujien luvut liikkuvat samaan suuntaan, mutta syy-seuraussuhdetta korrelaatio ei todista. Jos esim. yritys on päättänyt, että aina kiinteästi sama %-osuus myynnistä sijoitetaan viikoittain tai kuukausittain johonkin markkinointikanavaan, korrelaatio panostusten ja myynnin välillä on automaattisesti korkea, eikä tarkoita sitä, että ko. panostus selittäisi myynnin kasvun. Vaihtelemalla panostusta kuukausittain on kuitenkin helppo testata, kasvaako myynti panostuksen myötä ja missä suhteessa. Regressioanalyysi laskee tälle suhteelle kaavan ja sitä kautta ennusteen.

Lineaarinen regressioanalyysi tuottaa tulokseksi mallin ja yksinkertaisen laskentakaavan, jonka avulla voidaan yrittää ennustaa, minkälaisella yhtälöllä myyntitulot kasvaisivat erilaisin panostuksin. Esimerkissä myyntitulot toteutuisivat lineaarisen mallin mukaan yhtälöllä "Myynti = 1.3492 * panostus + 1526,90 euroa". Viimeksi mainittu vakio 1.526,90 euroa kertoo siis myynnin keskimäärin silloin, kun panostukset ovat nolla. 1.3492 on regressio- eli kulmakerroin, siis kuinka jyrkästi myynti kasvaisi markkinointipanostuksia lisättäessä. Tämä on markkinoinnin kustannustehokkuuden kannalta äärimmäisen tärkeä luku. Nythän kaavasta voidaan laskea, että esimerkiksi kymppitonnin mainospanostuksella saataisiin runsaan 15.000 euron myynti - ei siis vielä mikään huikea ROAS (Return of Ad Spend).

Käytännössä hakumainonnan osalta lineaarinen malli ei toteudu, koska valitulle avainsanajoukolle tulee ennen pitkää maksimi, jonka jälkeen lisäliikennettä ei kampanjaan valituilla avainsanoilla saada - koska niitä ei haeta enempää. Ja jos avainsanajoukkoa laajennetaan, uusien avainsanojen konversio ei välttämättä ole samaa tasoa kuin aiempien, jolloin todennäköistä on, että kannattavuus laskee, eli kulmakerroin ei pysy kaavan mukaisena.

Excel-taulukosta kannattaa huomata Microsoftin kömpelöt käännösvirheet: R Square on menty kääntämään "Korrelaatiokertoimeksi", vaikka kyse on Selitysasteesta. Oikea korrelaatiokerroin on tunnusluvuissa ylimpänä, ja se on jostain syystä nimetty "Kerroin R". Korrelaatiokerroin on esimerkissä 0.8869 eli hyvin korkea, ja selitysaste on esimerkissä 78,67 % eli varsin hyvä - jos se olisi täydet 100 %, malli olisi kelvoton. Jälkimmäinen luku siis kertoo, kuinka suuren osan vastemuuttujan vaihtelusta regressiomalli selittää. Vastaavasti "Tarkistettu korrelaatiokerroin" on puuta heinää käännöksenä, sillä kyse on "Adjusted R Square:sta", jonka oikea käännös olisi "korjattu selitysaste". Ko. luku oikaisee sen, että jokainen malliin lisättävä uusi muuttuja lisää varsinaista selitysastetta, vaikka näin ei olisi todellisuudessa. Korjattu selitysaste siis heikkenee, jos malliin lisätään muuttujia, jotka eivät selitä vastemuuttujan vaihtelua.

Korrelaatio_esimerkki

Korrelaatiokertoimista toimenpidesuosituksiin

Korrelaatio- tai regressioanalyysien kritiikissä aina muistutetaan, että korrelaatio, kahden asian todettu riippuvuussuhde ei aina tarkoita sitä, että toinen on syy ja toinen seuraus. Kaikki muistavat klassiset esimerkit vaikkapa jäätelönsyönnin ja hukkumiskuolemien välillä. Jäätelönsyönti ei kuitenkaan johda hukkumisalttiuteen, vaan vahvan korrelaation selittääkin väliintuleva muuttuja - lämpötila, kun molemmat asiat lisääntyvät helteellä.

Yhtä lailla regressioanalyysi voisi vahvistaa markkinointipäättäjien konservatiivista, vuosikausia jatkunutta vakiintunutta käytäntöä panostaa siihen, mihin "aina ennenkin on panostettu". Konkreettisena ja todellisena esimerkkinä huonekaluala, jossa huonekalujen vähittäiskauppiaat vuosikymmeniä satsasivat koko sivun tai aukeaman kokoisiin sanomalehtimainoksiin. Vaikka sanomalehtien tavoittavuus romahti ja ihmisten ostokäyttäytyminen oli siirtynyt osin nettiin, mitään ei muutettu, koska "aina ennenkin on luotettu sanomalehtimainontaan". Syöttämällä Exceliin markkinointipanostukset ja myyntiluvut vuorokausitasolla saataisiin kiistämättä vahva korrelaatio sanomalehti-ilmoittelun ja myynnin välille: lauantaisin jos on viikoittain sanomalehti-ilmoitus, juuri silloin kauppa täyttyy asiakkaista ja kuukauden myyntipiikit osuvat samoin aina lauantaille.

Businessanalytiikan avulla pitää kuitenkin osata haastaa myös konservatiiviset toimintamallit ja "aina ennenkin on tehty näin" -logiikka. Olennainen kysymys esimerkin tapauksessa on tietenkin se, että mitä tapahtuu, jos yhtenä lauantaina sanomalehti-ilmoitusta ei olekaan? Entä jos sama panostus käytetäänkin torstaina tai perjantaina? Entä jos sama panostus käytetään muihin kanaviin? Vasta kun analysiin saadaan riittävän monta havaintoa erilaisista kombinaatioista, voidaan tehdä luotettavia päätelmiä siitä, mikä on aidosti eri kanavien rooli ja yhteys myymäläkävijöihin, saittikävijöihin asiakkaan web-sivuilla ja ennen muuta myyntilukuihin. Jos mitään variaatiota toimenpiteissä ei ole, syy-seuraus-suhteet ovat mutun varassa. A/B-testaamista tarvitaan siis muuallakin kuin verkkokaupassa!

Eri selittävien muuttujien lisääminen analyysiin, uusien selittävien asioiden löytäminen, ja lukujen tulkinnat eivät tule mistään matemaattisesta kaavasta, vaan nämä juuri ovat analyytikon ammattiosaamista. Kuten mikä tahansa analytiikka, pelkät numerot ja tilastot eivät johda mihinkään. Väärin tulkittuna tilastot voivat myös johtaa vääränlaisiin päätelmiin. Esimerkin tapauksessa analyysissä pitäisi huomioida kunkin viikonpäivän keskimyynti silloin, kun mainospanostuksia ei ole - ja laskea ilmoittelun tuoma lisämyynti vasta tämän ylittävältä osalta. Lauantaina kun tyypillisesti hoidetaan huonekaluostokset silloinkin, kun mitään kampanjaa ei ole.

Parhaimmillaan analytiikka alan ammattilaisen tulkitsemana on kuitenkin loistava työkalu johtaa liiketoimintaa, karsia liian kallista tai tehotonta toimintaa tai panostuksia, ja siirtää panostuksia kustannustehokkaampiin kanaviin.

Mainostoimistoissa työskentelevät jaksavat myös lakkaamatta muistuttaa luovan ratkaisun avainroolista - ja he ovat tässä aivan oikeassa. Tämänkin osalta A/B-testaus olisi äärimmäisen tärkeää, sillä sama viestikärki ei aina tehoakaan kaikkiin ihmisiin, ja osaa asiakkaista voisi puhutella eri viesti. Esimerkiksi ohjelmallinen ostaminen tarjoaa nykyisin loistavat työkalut analysoida ja optimoida lukuisia eri muuttujia: eri tuotteet, eri luovat ratkaisut, eri kohderyhmät, eri kanavat - kaikkien yhteys eri tavoitteisiin (mainosklikki, sivustovierailu, konversiopiste sivustolla, ostotapahtuma) voidaan mitata ja analysoida. On aivan takuuvarmaa, että analysoimalla tuloksia ja optimoimalla kampanjoita tulosten mukaisesti saavutetaan todella merkittäviä kustannustehokkuuden kasvuja. Mikään ei ole kalliimpaa kuin jättää mittaus ja analyysi tekemättä, ja luottamalla "näin on ennenkin tehty" -mutuun!

Analytiikka on jatkuvasti yhä keskeisemmässä roolissa markkinoinnissa, ja analytiikan käyttö lisääntyy nopeasti. Ekonometriasta on Aalto-yliopistossa nykyisin oma kurssinsa. Hyvä niin, sillä alan osaajat ovat vielä harvassa!

- Ismo Tenkanen

 

 

 

 

 

 

 

 

Kommentit

Feed You can follow this conversation by subscribing to the comment feed for this post.

Tämän kirjoituksen kommentit ovat suljetut.