Kirjoittanut  maanantai, 17 lokakuu 2016 12:24

Kahden asian välinen yhteys, korrelaatio, on yksi eniten käytetyistä tilastollisen analyysin muodoista. Esimerkiksi lämpötila ja jäätelön myynti ovat voimakkaasti yhteydessä toisiinsa: kun lämpötila kesällä kasvaa, kasvaa myös jäätelön myynti.

Pelkkä asioiden välillä oleva yhteys ei kuitenkaan tarkoita, että yksi asia olisi seurausta toisesta. Korrelaatio ei siis tarkoita automaattisesti syy-seuraussuhdetta.

Netistä löytyy monia hauskoja esimerkkejä asioiden välisitä yhteyksistä, joilla ei ole mitään tekemistä keskenään. Esimerkiksi Yhdysvalloissa margariinin kulutus korreloi voimakkaasti Mainen osavaltion avioerojen määrän kanssa. Tai Miss Amerikan iällä on havaittu olevan selvä yhteys kuumilla esineillä tehtyjen murhien kanssa.

Kaikille on selvää, että näillä satunnaisilla ilmiöillä ei ole mitään tekemistä toistensa kanssa, niiden välillä ei ole syy-seuraussuhdetta. Margariinin kulutus voi vaihdella miten sattuu, eikä kukaan sen vuoksi eroa puolisostaan. Asioiden välinen yhteys on puhtaasti sattumaa.

Hankalammaksi asioiden välisen yhteyden tulkinnan tekee, jos kahden ilmiön välinen korrelaatio johtuu jostain kolmannesta tekijästä. Esimerkiksi jäätelön myynnin kasvun lisäksi helteillä lisääntyy myös uimarantojen ruuhkat. Uiminen ei kuitenkaan johdu jäätelön syönnistä, vaan jostain muusta tekijästä, tässä tapauksessa lämpimästä säästä.

Asioiden välisiä yhteyksiä käytetään usein päätöksenteon perusteena. Tällöin on tärkeää tehdä ero sen välillä, milloin kyse on aidosta syy-seuraussuhteesta ja milloin asioiden väliseen yhteyteen vaikuttavat jotkut muut tekijät.

Erityisesti yhteiskunnallisessa päätöksenteossa tarkasteltavat asiat ovat usein hyvin monimutkaisia, jolloin niiden välisten syy-yhteyksien osoittaminen voi olla hyvin vaikeaa, ellei mahdotonta. Kun kysytään esimerkiksi mitkä tekijät johtavat nuorten syrjäytymiseen lähiöissä, ei ole mahdollista antaa yhtä kaiken kattavaa vastausta.

Tämän vuoksi monitahoisista asioista tehtäviä päätöksiä ei pitäisi perustella suoraviivaisilla yksinkertaistuksilla tai näennäisillä asiayhteyksillä. Päätöksenteko vaatii tuekseen tarkasti analysoitua tietoa, ja parhaimmillaan se pohjautuu tieteellisiin tutkimustuloksiin.

Laadukas asiaperustainen päätöksenteko asettaakin päätösten valmistelijoille suuren vastuun, etenkin kun houkutus yksinkertaistettuihin johtopäätöksiin on kiireellisessä valmistelussa suuri.

Julkaistu kategoriassa Blogi
keskiviikko, 15 huhtikuu 2015 10:51

TIETÄMISEN SIETÄMÄTÖN KEVEYS

Kirjoittanut  keskiviikko, 15 huhtikuu 2015 10:51

Tietämiseen tai tiedon tuottamiseen liittyvät haasteet juontuivat mieleeni hiljattain, kun analysoin liikennevirtojen kehitystä Turun ja Helsingin välillä.

Näennäisen yksinkertaisesta aiheesta ei tahtonut löytyä tietoa, jolla asiaa olisi voinut lähestyä helposti ja laajasti eri näkökulmista. Tietoa kyllä löytyy, mutta se on sirpaleista. Jos yksi tietolähde vastaa yhteen kysymykseen, niin se ei kerro mitään toisesta yhtä tärkeästä kysymyksestä.

Esimerkiksi liikennevirtojen tapauksessa lähdin liikkeelle työssäkäyntitietojen tarkastelusta. Tiedot ovat tarkkoja, mutta ne kertovat vain työssäkäyntiliikenteestä. Eikä oikeastaan siitäkään vaan ainoastaan ihmisten kotien ja työpaikkojen sijanneista. Liikenteen automaattisilta mittauspisteiltä saadaan erinomaista tietoa ajoneuvomääristä, mutta ei matkustajien lukumääristä.

Rautatietilastoista saa tietoa junien matkustajamääristä, mutta varsin summittain ja epätarkasti. Henkilöliikennetutkimus puolestaan tarjoaisi ainoana vaihtoehtona kokonaisvaltaisen kuvan liikennevirroista, mutta valtakunnallisena kyselytutkimuksena sen tietomäärä ei riitä luotettaviin pienipiirteisiin analyyseihin.

Vastaavia esimerkkejä on helppo luetella monia. Työttömyyttä tilastoidaan ainakin kolmella eri tavalla kolmeen eri lähteeseen perustuen. Jokaisella tilastointitavalla on vahvat ja selvät perusteensa, mutta tiedon moninaisuus asettaa vääjäämättä haasteita tiedon tulkitsijalle: miten toisistaan poikkeavia työttömyyslukuja tulisi esittää hämmennyksen välttämiseksi.

Monet ennakolliset tilastot myös tarkentuvat vielä julkaisuajankohdan jälkeen. Esimerkiksi suhdannetilastot päivittyvät yritysten verotustietojen eläessä tai uusien tilinpäätösten valmistuttua. Väestötilastot puolestaan muuttuvat, kun mattimyöhäiset jättävät muuttoilmoituksensa kuukausia myöhässä.

Selvää on, ettei kaikista monimutkaisista ilmiöistä ole mitenkään mahdollista ylläpitää aihetta kaikista näkökulmista monipuolisti kuvaavaa tietoa. Tällöin on kuitenkin riskinä se, että johtopäätöksiä tehdään varsin yksipuolisin ja kevein perustein.

Etenkin tietoperusteisen päätöksenteon tueksi tehtävien analyysien on syytä olla tarkoin puntaroituja, jotta päätökset eivät synny vääristyneeseen tai värittyneeseen tietoon nojautuen.

Julkaistu kategoriassa Blogi