tiistai, 03 joulukuu 2019 13:00

MATKAPUHELIMEMME KERTOVAT MISSÄ LIIKUMME

Kirjoittanut  tiistai, 03 joulukuu 2019 13:00

Jätämme jälkeemme yhä enemmän digitaalisia jalanjälkiä liikkeistämme. Esimerkiksi kännykkämme ovat jatkuvasti kiinni puhelinverkossa. Pelkästään puhelimiemme jäljistä muodostuu valtava tietomassa puhelinoperaattoreiden rekistereihin. Tämän kaltainen data on hiljattain avautunut kaupallisena tuotteena sekä yritysten että julkisen sektorin hyötykäyttöön.

Matkapuhelimista kertyvä data voi auttaa päätöksentekijöitä ja yrityksiä ymmärtämään ihmisjoukkojen liikkumista ja tekemään parempia päätöksiä. Esimerkiksi julkisella sektorilla löytyy paljon kohteita, jossa voidaan hyödyntää matkapuhelindataa ihmisvirroista. Vaikkapa Turun, Salon ja Helsingin välillä tehdyistä matkoista ja matkamääristä tiedetään parhaillaan suhteellisen vähän. Liikennesuunnittelun lisäksi hyötyjä voi löytyä esimerkiksi matkailun sekä palveluiden käytön ja suunnittelun piiristä.

Matkapuhelinoperaattorit tietävät linkkimaston tasolla, millä seuduilla kukin matkapuhelinliittymä liikkuu. Tarkin mahdollinen taso matkapuhelindatassa on 250 metriä kertaa 250 metriä oleva karttaruutu. Tällöin yksityisyys säilyy edelleen riittävän vahvana. Kun lähestyn esimerkiksi kirjastoa, niin jokainen linkkitorni lähettää viestiä operaattorille, että olen lähestymässä karttaruutua, jossa kirjasto sijaitsee. Datan näkökulmasta, jos viivyn kirjastossa pidemmän aikaa, niin olen käynyt kirjastossa.

Jos taas vain palautan kirjat ja poistun, niin matkapuhelindata tuskin ymmärtää minun käyneen kirjastossa. Varsinais-Suomen liitossa on marraskuun alussa käynnistynyt Pohjoisen kasvuvyöhykkeen tietopohja -hanke (PKV), jonka puitteissa olemme ostaneet Telia Insight Crowd -matkapuhelindataa. Se kattaa kolmen viikon puhelinliittymäliikkeet syksyn 2019 tasolla Telian matkapuhelinliittymistä anonymisoituna ja aggregoituna siten, että yksittäisiä käyttäjiä ei voida tunnistaa. Tilastollisin menetelmin kattavuus on laajennettu pitämään sisällään myös muiden operaattoreiden liittymät.

Datasta jalostetuista tuloksista on tarkoitus rakentaa vapaasti käytettävä karttapalvelu kevään 2020 aikana. Odotuksemme hankkeessa on, että pystymme matkapuhelindatan perusteella tuottamaan uutta tietoa muun muassa ihmisten matkoista, liikkuvuudesta ja vuorovaikutuksesta Pohjoisella kasvuvyöhykkeellä. Pohjoinen kasvuvyöhyke tarkoittaa aluetta ja yhteistyöverkostoa, jonka muodostavat Etelä-Suomen 13 kaupunkia ja kuusi maakuntaa välillä Kotka-Pori.

Toteutettavan tietopalvelun toivotaan tarjoavan luotettavaa, tarkoituksenmukaista ja ajantasaista tietoa matkapuhelindatan kuvaamien ihmisvirtojen lisäksi vyöhykkeen työmatkoista, liikenne- ja tavaravirroista ja matkustajamääristä sekä alueen väestön, työpaikkojen ja BKT:n kehityksestä. Tietopalvelun tavoite on vyöhykkeen yhtenäisen työmarkkina- ja talousalueen toiminnallisuuden lisääminen sekä elinvoiman ja kilpailukyvyn edistäminen vahvistamalla yhteistä tilannekuvaa alueen kehityksestä ja vuorovaikutussuhteista.

Julkaistu kategoriassa Blogi
Kirjoittanut  maanantai, 17 lokakuu 2016 12:24

Kahden asian välinen yhteys, korrelaatio, on yksi eniten käytetyistä tilastollisen analyysin muodoista. Esimerkiksi lämpötila ja jäätelön myynti ovat voimakkaasti yhteydessä toisiinsa: kun lämpötila kesällä kasvaa, kasvaa myös jäätelön myynti.

Pelkkä asioiden välillä oleva yhteys ei kuitenkaan tarkoita, että yksi asia olisi seurausta toisesta. Korrelaatio ei siis tarkoita automaattisesti syy-seuraussuhdetta.

Netistä löytyy monia hauskoja esimerkkejä asioiden välisitä yhteyksistä, joilla ei ole mitään tekemistä keskenään. Esimerkiksi Yhdysvalloissa margariinin kulutus korreloi voimakkaasti Mainen osavaltion avioerojen määrän kanssa. Tai Miss Amerikan iällä on havaittu olevan selvä yhteys kuumilla esineillä tehtyjen murhien kanssa.

Kaikille on selvää, että näillä satunnaisilla ilmiöillä ei ole mitään tekemistä toistensa kanssa, niiden välillä ei ole syy-seuraussuhdetta. Margariinin kulutus voi vaihdella miten sattuu, eikä kukaan sen vuoksi eroa puolisostaan. Asioiden välinen yhteys on puhtaasti sattumaa.

Hankalammaksi asioiden välisen yhteyden tulkinnan tekee, jos kahden ilmiön välinen korrelaatio johtuu jostain kolmannesta tekijästä. Esimerkiksi jäätelön myynnin kasvun lisäksi helteillä lisääntyy myös uimarantojen ruuhkat. Uiminen ei kuitenkaan johdu jäätelön syönnistä, vaan jostain muusta tekijästä, tässä tapauksessa lämpimästä säästä.

Asioiden välisiä yhteyksiä käytetään usein päätöksenteon perusteena. Tällöin on tärkeää tehdä ero sen välillä, milloin kyse on aidosta syy-seuraussuhteesta ja milloin asioiden väliseen yhteyteen vaikuttavat jotkut muut tekijät.

Erityisesti yhteiskunnallisessa päätöksenteossa tarkasteltavat asiat ovat usein hyvin monimutkaisia, jolloin niiden välisten syy-yhteyksien osoittaminen voi olla hyvin vaikeaa, ellei mahdotonta. Kun kysytään esimerkiksi mitkä tekijät johtavat nuorten syrjäytymiseen lähiöissä, ei ole mahdollista antaa yhtä kaiken kattavaa vastausta.

Tämän vuoksi monitahoisista asioista tehtäviä päätöksiä ei pitäisi perustella suoraviivaisilla yksinkertaistuksilla tai näennäisillä asiayhteyksillä. Päätöksenteko vaatii tuekseen tarkasti analysoitua tietoa, ja parhaimmillaan se pohjautuu tieteellisiin tutkimustuloksiin.

Laadukas asiaperustainen päätöksenteko asettaakin päätösten valmistelijoille suuren vastuun, etenkin kun houkutus yksinkertaistettuihin johtopäätöksiin on kiireellisessä valmistelussa suuri.

Julkaistu kategoriassa Blogi
keskiviikko, 15 huhtikuu 2015 10:51

TIETÄMISEN SIETÄMÄTÖN KEVEYS

Kirjoittanut  keskiviikko, 15 huhtikuu 2015 10:51

Tietämiseen tai tiedon tuottamiseen liittyvät haasteet juontuivat mieleeni hiljattain, kun analysoin liikennevirtojen kehitystä Turun ja Helsingin välillä.

Näennäisen yksinkertaisesta aiheesta ei tahtonut löytyä tietoa, jolla asiaa olisi voinut lähestyä helposti ja laajasti eri näkökulmista. Tietoa kyllä löytyy, mutta se on sirpaleista. Jos yksi tietolähde vastaa yhteen kysymykseen, niin se ei kerro mitään toisesta yhtä tärkeästä kysymyksestä.

Esimerkiksi liikennevirtojen tapauksessa lähdin liikkeelle työssäkäyntitietojen tarkastelusta. Tiedot ovat tarkkoja, mutta ne kertovat vain työssäkäyntiliikenteestä. Eikä oikeastaan siitäkään vaan ainoastaan ihmisten kotien ja työpaikkojen sijanneista. Liikenteen automaattisilta mittauspisteiltä saadaan erinomaista tietoa ajoneuvomääristä, mutta ei matkustajien lukumääristä.

Rautatietilastoista saa tietoa junien matkustajamääristä, mutta varsin summittain ja epätarkasti. Henkilöliikennetutkimus puolestaan tarjoaisi ainoana vaihtoehtona kokonaisvaltaisen kuvan liikennevirroista, mutta valtakunnallisena kyselytutkimuksena sen tietomäärä ei riitä luotettaviin pienipiirteisiin analyyseihin.

Vastaavia esimerkkejä on helppo luetella monia. Työttömyyttä tilastoidaan ainakin kolmella eri tavalla kolmeen eri lähteeseen perustuen. Jokaisella tilastointitavalla on vahvat ja selvät perusteensa, mutta tiedon moninaisuus asettaa vääjäämättä haasteita tiedon tulkitsijalle: miten toisistaan poikkeavia työttömyyslukuja tulisi esittää hämmennyksen välttämiseksi.

Monet ennakolliset tilastot myös tarkentuvat vielä julkaisuajankohdan jälkeen. Esimerkiksi suhdannetilastot päivittyvät yritysten verotustietojen eläessä tai uusien tilinpäätösten valmistuttua. Väestötilastot puolestaan muuttuvat, kun mattimyöhäiset jättävät muuttoilmoituksensa kuukausia myöhässä.

Selvää on, ettei kaikista monimutkaisista ilmiöistä ole mitenkään mahdollista ylläpitää aihetta kaikista näkökulmista monipuolisti kuvaavaa tietoa. Tällöin on kuitenkin riskinä se, että johtopäätöksiä tehdään varsin yksipuolisin ja kevein perustein.

Etenkin tietoperusteisen päätöksenteon tueksi tehtävien analyysien on syytä olla tarkoin puntaroituja, jotta päätökset eivät synny vääristyneeseen tai värittyneeseen tietoon nojautuen.

Julkaistu kategoriassa Blogi