Web-analytiikan lyhyt historia: Osa 1: lokianalyyseista ensimmäisiin selainpohjaisiin mittareihin
1990-luvulla kun Web-sivut alkoivat yleistyä, jo Internet-operaattorit ja Web-hotellien ylläpitäjät tarjosivat saittien rakentajille lokianalyysi-tietoja sivuston kävijöistä. Lokianalyysit olivat usein ilmaisia ohjelmistoja, jotka analysoivat sitä dataa, mikä oli kertynyt Web-palvelimien lokitiedostoihin. Web-serverit voitiin siis palvelimen asetuksilla laittaa tallentamaan lokitietoja liikenteestä, jonka palvelimet olivat vastaanottaneet käyttäjien kutsuista.
World Wide Webin peruslogiikka kun oli, että jokainen käyttäjän linkin klikkaus tai web-osoitteen eli URLin (kuten www.mediacontacts.fi) kirjoittaminen selaimen osoitekenttään ja haun käynnistäminen lähettävät kutsun ko. sivustoa ylläpitävään palvelimeen. Lokitiedoston yksi tietue sisälsi mm. seuraavat kentät:
- kutsujan IP-numero (kenelle kutsutut tiedostot palautetaan)
- sekunnin tarkkuudella aika, jolloin kutsu saapunut palvelimelle
- mitä sivua/tiedostoa on kutsuttu, esim. www.sivusto.fi/index.html
- kutsujan käyttöjärjestelmä ja selainversio
Siten pelkän lokitiedon perusteella oli mahdollista ryhmitellä esim.
- ladatuimmat sivut ja tiedostot palvelussa
- latausmäärät tunneittain, päivittäin, kuukausittain jne.
- yleisimmät selainversiot ja käyttöjärjestelmät
Lisäksi oli mahdollista tallentaa ns. referrer- eli viitetiedot, joka tarkoittaa sitä, että jos käyttäjä on tullut linkin kautta sivustolle, oli mahdollista tallentaa mitä linkkiä oli klikattu, ja jos linkki oli hakukone, saatiin linkin mukana myös käytetty hakusana tai –sanat. Niinpä analyysiin voitiin ottaa mukaan:
- suosituimmat viitesivut eli mitkä saitit ohjaavat eniten liikennettä asiakkaalle
- mitkä ovat suosituimmat hakukoneet joita käyttäjät ovat käyttäneet etsiäkseen asiakkaan sivustoa
- mitkä ovat käytetyimmät hakusanat, joita käyttäjät ovat käyttäneet ennen kuin ovat tulleet hakukoneen tulossivun kautta asiakkaan sivustolle
Lokianalyysin ongelmat: proxy-palvelimet
Etenkin mainostilaa tarjoavien verkkomedioiden kannalta ongelmaksi muodostui nopeasti se, että palvelinlokit olivat hyvin puutteellisia, koska suuri osa sivuston lukijoista ei lainkaan näkynyt näissä lokitilastoissa. Tämä johtui siitä, että Internet-operaattorit pyrkivät aktiivisesti vähentämään liikennettä verkossa sillä, että perustivat ns. proxy- eli välimuistipalvelimia, joille ladattiin säännöllisin väliajoin suosituimmat tiedostot, joita operaattoriasiakkaat toistuvasti kutsuivat. Niinpä esim. Nokian verkkosivuista oli operaattorin proxy-palvelimelle tallennettu versio, jota tarjottiin loppukäyttäjälle, siitä huolimatta, että Nokia oli mahdollisesti jo päivän aikana uusinut sivujaan ja lisännyt sinne uutta materiaalia. Operaattoriasiakkaan selaimeen kuitenkin tuli oletusarvoisesti välimuistipalvelimelle tallennettu sivu, operaattorin omasta välimuistista, ja Nokian omille palvelimille asti ei kulkeutunut lainkaan kutsua loppukäyttäjältä. Jollei tämä sitten huomannut painaa refresh-painiketta, jolloin selain lähti hakemaan tuoreempaa versiota sivusta alkuperäislähteeltä.
Proxy-palvelimien myötä tilanne muuttuikin nopeasti sellaiseksi, että jopa enemmistö yksittäisen sivuston kutsuista saatiin välimuisteista, jolloin palvelinlokien tiedostoihin kertyi vain osa kaikesta liikenteestä. Ja ongelma oli, että kukaan ei pystynyt sanomaan, kuinka suuri osa liikenteestä näkyi palvelinlokeista. Operaattorit laativat jopa monisteita, joissa kerrottiin, että uuden sivuston pitää kertoa lokianalyysien luvut kymmenellä ja vanhemman sivuston kahdellakymmenellä, jotta saadaan tietää suurin piirtein todellinen sivuston liikennemäärä.
Jos kuitenkin verkkopalvelun liikeidea oli rahoittaa sivuston ylläpito ja sisällöntuotanto ilmoitustuloilla, oli tietenkin välttämätöntä selvittää kaiken liikenteen määrä, olipa selainkutsuihin vastattu asiakkaan ylläpitämiltä palvelimilta tai sitten operaattorien tai suuryritysten proxy-palvelimilta. Operaattorit itsekin ymmärsivät, että lokitiedostot eivät tätä asiaa pysty selvittämään, ja lähtivät ostamaan Web-mittauspalveluja yrityksiltä, jotka olivat ratkaisseet ao. ongelman.
Lue lisää: Web-analytiikan lyhyt historia, osa 2: Selainpohjaiset mittaukset:
Kommentit