Ad Fraud display-mainonnassa - kuinka tyhmänä mainostajia pidetäänkään?
Miksi evästeestä tehtiin kävijäseurannan syntipukki?

Analytiikka jatkuu vaikka evästeet kiellettäisiin kokonaan

Google ilmoitti estävänsä kahden vuoden päästä 3. osapuolen evästeet omasta Chrome-selaimestaan. Aiemmin saman päätöksen olivat jo tehneet Mozilla ja Safari, jotka ovat jo siirtyneet tähän käytäntöön, eli estävät aktiivisesti 3. osapuolen cookiet.

Näyttää siltä, että paitsi medioissa, jopa mediatoimistoissa ja digitoimistoissa ei ymmärretä todellisuudessa, mikä on eväste, koska nyt on luotu hysteriaa markkinointiväen keskuudessa kertomalla, miten evästeiden blokkaaminen mm. lopettaa selainpohjaisen web-analytiikan ja mainosmittaamisen kokonaan. Koska Google itse on yksi suurimmista mainosmittauksen tarjoajista, voitte olla kuitenkin varmoja, että mainosmittaaminen ei pääty, vaan 3. osapuolen evästeet korvataan muulla teknologialla. Vielä suurempi valhe on väittää, että analytiikka estyisi 3. osapuolen evästeiden myötä. Analytiikka jatkuu liki normaalisti, vaikka evästeet kiellettäisiin kokonaan.

Eväste ei kerää mitään dataa, ei edes ip-osoitetta

Yleinen harhaväite, joka toistuu jopa Suomen suurimman mediatoimiston eväste-artikkelissa, on, että "eväste kerää ihmisistä tietoa, kuten IP-osoite, käytetyt sivut ja mistä osoitteesta käyttäjä on tullut", josta datasta sitten kootaan mm. analytiikkaraportit. Eväste on kuitenkin passiivinen merkkijono, joka sisältää numeroita ja kirjaimia, ja evästeet tallennetaan käyttäjän omalle kiintolevylle. Koska se ei ole siis mikään ohjelma, miten se voisi aktiivisesti kerätä yhtään mitään? Käytännössä eväste on "numerolappu", joka annetaan selaimelle, ja tämän "numerolapun" eli tunnistetiedon perusteella sama selain tunnistetaan, kun se palaa uudelleen palveluun.

1. osapuolen evästeen osalta tunnistetaan kävijä, kun hän palaa verkkopalveluun, joka alun perin myönsi evästeen. 3. osapuolen evästeen osalta kävijä voidaan tunnistaa myös 3. osapuolen verkkopalvelussa, esim. mediassa, jossa tämä vierailee, vaikkapa Facebookissa, jolloin voidaan kohdentaa kävijään esimerkiksi niiden verkkokauppojen retargeting-mainos, joiden sivuilla kävijä on aiemmin vieraillut. 3. osapuolen eväste siten mahdollistaa kävijöiden tunnistamisen evästetunnisteen avulla myös eri verkkopalveluiden välillä, eikä pelkästään siinä sivustossa, joka myönsi evästeen.

Entä mitä sitten tapahtuu, jos 3. osapuolen eväste estetään? Silloin kävijää ei tunnisteta enää 3. osapuolen verkkopalvelussa, eikä häneen voida kohdistaa mainontaa sen perusteella, että hän on aiemmin käynyt jollain sivustolla, jonka kävijöille halutaan kohdentaa retargeting-mainontaa. Myös esim. sellainen kohdentaminen, jossa mainoksia kohdennetaan jostain tuotteesta tai palvelusta kiinnostuneille heidän aiemman verkkokäyttäytymisen perusteella, esim. matkailumainoksia matkailusivustoila käyneille, automainoksia autosivustoilla käyneille, tai koiranruokamainoksia lemmikkieläinsivustoilla käyneille, päättyy, jollei keksitä uutta teknologiaa 3. osapuolen evästeitä korvaamaan.

Analytiikka kerää tietonsa lokidatasta - ei evästeillä!

Sen sijaan analytiikka ei pääty mihinkään, vaikka 3. osapuolen evästeet estetäänkin. Mistä muuten analytiikkaohjemistot saisivat tänä päivänä tietää, kuinka paljon kävijöitä on vaikkapa Mozilla- ja Safari-selaimilla - jos 3. osapuolen evästeiden blokkaaminen estäisi analytiikan? Ensinnäkin, Google Analytics ja johtavat analytiikkaohjelmistot toimivat 1. osapuolen evästeillä, lukuunottamatta display-mainosmittauksia, joita niihin voidaan liittää. Toiseksi, vaikka 1. osapuolen evästeetkin kiellettäisiin, analytiikka jatkuisi - koska ne evästeet eivät kerää yhtään mitään dataa - vaan tiedonkeruu rakentuu ihan muuhun kuin evästeisiin analytiikassa!

Google Analytics -koulutuksissa kyllä kerrotaan myös, että Google "kerää tietonsa evästeiden avulla", ja jos selain estää evästeet, kävijää ei lasketa mukaan analytiikkadataan. Tästä ilmeisesti johtuu yleinen harhaluulo siitä, että estämällä evästeet voidaan estää mittaaminen. Todellisuudessa lähes kaikki data, mitä analytiikassa kerätään, voidaan tallentaa ihan samalla tavoin, vaikka kaikki evästeet kiellettäisiin huomenna.

Selainpohjaisen mittauksen tiedonkeruu rakentuu siis johonkin ihan muuhun kuin evästeisiin. Niiden tiedonkeräys pohjautuu samaan ideaan, kuin millä perinteinen serverilokidatan tallennus. Eli kun selaimella lähetetään kutsu (request) avata jokin URL eli web-osoite, vaikkapa www.econometrics.fi, niin Econometics.fi:n palvelimille eli servereille lähtee kutsu, jonka mukana kulkee IP-osoite, kutsutun sivun URL (esim. etusivu tai muu sivu), ajankohta sekunnin tarkkuudella milloin sivua on kutsuttu, sekä teknistä tietoa selaimesta, joka lähetti kutsun.

Lisäksi on mahdollista tallentaa sivu, josta kävijä on siirtynyt linkkiä pitkin, eli ns. referral-tieto, eli millä sivulla ollutta linkkiä oli klikattu, jos tultiin linkin kautta. Ja tietenkin: jos tämä linkki oli ollut hakukone, voitiin aiemmin nähdä koko se rimpsu, mikä tuli linkin mukana, ml. avainsana, jolla oli etsitty palvelua Googlesta tai muusta hakukoneesta. Sittemminhän Google esti tuon datan välittämisen 3. osapuolelle, mukamas privacy-syistä, mutta todellisuudessa Google jakaa samaa tietoa edelleen ilman mitään privacy-huolia kaikille ilmaiseksi Google Search Consolen kautta, eli Google halusi ainoastaan estää tämän tiedon jakamisen kilpailevien analytiikkaohjelmistojen osalta! Google Analyticsiin avainsanatiedot saadaan edelleen, kunhan vain aktivoidaan Google Search Console -data osaksi Google Analyticsia.

Kaikki nämä tiedot ovat tietenkin se datalähde, josta analytiikka ja serverilokidata koostuu, ja josta ne muodostavat raporttinsa sivuston kävijöistä. Edelleen yhä tänä päivänä jokainen, jolla on verkkosivusto netissä, voi mennä oman palveluntarjoajansa (ISP) sivustolle, kirjautua omiin tietoihinsa - ja lukea lokitilastot, josta ko. tiedot ilmenevät, vaikka ei olisi koskaan aktivoinut Google Analyticsia tai mitään muuta analytiikkaohjelmistoa!

Lokidata

Yllä kuvassa serverilokidataa helmikuulta 2020 - kaikki data on kerätty ilman ensimmäistäkään evästettä...

Mitä haittaa evästeiden täydellinen poistuminen aiheuttaisi analytiikkaan?

Kaikki selainpohjaiset mittaukset, kuten Google Analytics, Adobe Analytics tai Nielsenin SiteCensus, perustuvat lokidatan keruuseen siten, että mitattaville sivuille sijoitetaan pieni koodinpätkä, joka lähettää käyttäjän kutsut lokitietoineen myös mittauspalvelimelle, aina kun mitattava sivu avautuu käyttäjän selaimelle. Vaikka 3. osapuolen evästeet olisi estetty, tämä data lähtee mittauspalvelimille. Siten myös Google Analytics tai mikä tahansa analytiikkaohjelmisto saa lokidatat aivan normaalisti, vaikka GA ei ottaisi raporttiinsa mukaan niitä, jotka ovat estäneet evästeen.

Itse asiassa jo 15 vuotta sitten, kun Suomessa pohditiin ongelmaa, jossa tietoturvaohjelmistot blokkasivat mittausjärjestelmien evästeitä, ratkaistiin tämä ongelma, miten voidaan edelleen mitata kävijöitä, joiden evästeet on blokattu jollain ohjelmistolla, kuten F-Securen softalla. Idea oli yksinkertainen: koska kaikista selaimista saatiin edelleen lokidata normaalisti, ja siten sivulataukset kaikilta selaimilta, niin laskettiin saavutetut sivupyynnöt selaimilta, jotka vastaanottivat evästeet, ja vastaavasti sivupyynnöt selaimilta, jotka estivät evästeet. Jos evästeen vastaanottaneet olivat ladanneet keskimäärin 5 sivua per selain ko. verkkopalvelusta, ja sen lisäksi oli saatu 1000 sivulatausta selaimilta, jotka estivät evästeet, laskettiin 1000/5 = 200 selainta, jotka olivat estäneet evästeet. Tämä estimaatti vain sitten lisättiin kävijälukuun, joka oli mitattu niiden osalta, joilta evästetieto saatiin normaalisti, eli eivät olleet estäneet mittauspalvelimen evästettä.

Tästä voidaan siis suoraan tehdä se johtopäätös, että jos evästeet kokonaan poistuisivat käytöstä, niin eri kävijöiden (tarkemmin siis eri selaimien) laskenta heikentyisi - koska se ei enää perustuisi evästeiden tunnistetietoihin, vaan se palautettaisiin laskemaan pelkkiä IP-osoitteita - kuten lokidataohjelmistot tekevät edelleen tänä päivänä!

Samoin tilastot, jotka tänä päivänä perustuvat evästeisiin, kuten "uudet ja paluukävijät" ja vierailutiheys palvelussa, joko poistuisivat käytöstä, tai niiden laskenta jouduttaisiin vaihtamaan IP-osoitteiden varaan, joka esim. yrityskäytössä niputtaisi ison joukon käyttäjiä yhden numeron taakse.

Mutta liki kaikki muu analytiikka jatkuisi ennallaan, vaikka myös 1. osapuolen evästeet poistettasiin. Mutta koska näillä näkymin 1. osapuolen evästeitä ei olla poistamassa käytöstä - ja koska Google Analytics ja muut vastaavat analytiikkaohjelmisto käyttävät 1. osapuolen evästeitä - juuri mikään ei tule muuttumaan analytiikassa. Business as usual.

Olisiko nyt vain aika lopettaa medioissa ja blogeissa nämä höpöhöpö-jutut siitä, että "evästeet keräävät dataa käyttäjistä". Evästeet "numeroivat" selaimia, jotta ne voitaisiin tunnistaa ja laskea "eri kävijöiden" määriä, mutta eivät evästeet kerää mitään lokidataa - lokitiedot lähtevät joka tapauksessa jokaisen sivukutsun yhteydessä - koska niin Internet toimii! Mistä muuten voitaisiin tietää, kuka kutsun on lähettänyt, ja palauttaa pyydetyt sivut kutsujalle, jos estettäisiin tiedot siitä, kuka kutsun on lähettänyt? IP-numerotieto tulee siis jo pelkän kutsun yhteydessä - evästeellä ei ole mitään tekemistä asian kanssa...

- Ismo Tenkanen

 

 

Kommentit

Feed You can follow this conversation by subscribing to the comment feed for this post.

Verify your Comment

Kommentin esikatselu

This is only a preview. Your comment has not yet been posted.

Working...
Your comment could not be posted. Error type:
Your comment has been saved. Comments are moderated and will not appear until approved by the author. Post another comment

The letters and numbers you entered did not match the image. Please try again.

As a final step before posting your comment, enter the letters and numbers you see in the image below. This prevents automated programs from posting comments.

Having trouble reading this image? View an alternate.

Working...

Kommentoi

Comments are moderated, and will not appear until the author has approved them.

Your Information

(Name and email address are required. Email address will not be displayed with the comment.)