Oma valokuva
Tarkoitukseni on saada lukija pohtimaan ja kysymään kysymyksiä. Tämän takia esitän tarkoituksella yleiselle ymmärrykselle vastakkaisia argumentteja. Teemat valitsen sen mukaan, missä valtavirralle vastakkaiset argumentit ovat mielestäni perusteltuja ja yhteiskunnallisesti tärkeitä. Konsensus on mielestäni usein sekä harhaanjohtavaa että vaarallista. Vaarana on ”yksimielisyyden illuusio”, joka on valitettavan yleinen älyllisen epärehellisyyden muoto: ollaan samaa mieltä, mutta kukaan ei oikein kykene perustelemaan miksi, saati sitten että perusteluista oltaisiin yhtä mieltä. Blogikirjoitukseni kumpuavat omasta päivätyöstäni tutkijana ja opettajana. Toiset käsittelevät yritysten toimintaan liittyviä kysymyksiä liiketaloustieteellisen tutkimuksen näkökulmasta. Toisissa taas käsittelen tieteen roolia yhteiskunnassa, jota pohdin ensisijaisesti tieteen käytäntöjen näkökulmasta -- siis siitä, millaista tiede on ihmisen harjoittamana toimintana. Monet teksteistäni heijastavat taustaani tilastotieteen soveltajana -- tilastollinen päättely on tärkein tutkimustyökaluni. Muokkaan toisinaan julkaistuja tekstejäkin uusien havaintojen tai saamani palautteen perusteella.

maanantai 25. heinäkuuta 2011

Tilastoista tuskin apua terroritekojen analyyseissa

Osmo Soininvaara kirjoitti blogissaan 23.7.2011:

Kun eilen klo 17 pyöräillessäni Sipoosta kohti Helsinkiä kuulin, että Oslon keskustassa on räjähtänyt pommi, olin jokseenkin varma, että kyse oli islamilaisesta terrorismista... Jälkeenpäin tilastotieteilijä minussa kysyi, miten voin veikata noin huonosti.

Tilastotieteilijä herää minussakin, ja sen ensimmäinen reaktio on todeta kaikenlaisen spekuloinnin olevan tässä tapauksessa perustelematonta.

Soininvaaran epäonnistuneen veikkauksen syitä pohtiessa lienee ensimmäisenä aiheellista kysyä: kun Oslossa räjähtää pommi, niin minkä tilastollisen perusjoukon jäseneksi tämä tapahtuma on perusteltua luokitella? Kyse on kuitenkin hyvin poikkeuksellisesta ja harvinaisesta ääri-ilmiöstä, joka ei edusta mitään perusjoukkoa, vaan tavallaan ainoastaan itseään.

On hyvin harhaanjohtavaa olettaa, että poikkeukselliset ääri-ilmiöt edustavat yhteistä tilastollista perusjoukkoa, josta voidaan tehdä luotettavaa tilastollista päättelyä (inferenssiä), tulkintaa ja johtopäätöksiä. Tilastotekninen perustelu on lyhykäisyydessään se, että heterogeenisista otoksista lasketut tunnusluvut ovat tilastollisen päättelyn ja tulkinnan kannalta merkityksettömiä. Lyömäaseiksi ne tosin soveltuvat valitettavan hyvin.

Soininvaaran blogissa käytiin ja käydään yhä vilkasta keskustelua terrori-iskuista ja siitä, mikä prosenttiosuus on minkäkin etnisen tai uskonnollisen ryhmän tekemä. Useat esittävät argumenttiensa tueksi jonkinlaisia tilastoja ja olettavat niiden oikeuttavan johtopäätöksiä. Jokainen halukas näyttää kykenevän loihtimaan jonkinlaisen tilaston argumenttinsa tueksi.

Prosenteilla spekulointi perustuu oletukseen mielekkäästä tilastollisesta perusjoukosta. Oletus, että Espanjassa tai Venäjällä vuosia sitten tehdyt pommi-iskut tai kymmenen vuotta sitten Yhdysvalloissa tapahtuneet lentokonekaappaukset antaisivat käyttökelpoista tilastollista informaatiota Oslon vuoden 2011 terroritekoa ajatellen, on erittäin ongelmallinen. Ainoa näitä terroritekoja yhdistävä tekijä on se, että kyseessä on siviileihin kohdistunut, onnistunut ja mittava väkivallanteko. Siihen nuo yhdistävät tekijät pääpiirteissään taitavat sitten jäädäkin.

Sama pätee esimerkiksi kouluampumisiin: ampujien taustalta löytyy aina kourallinen yhteisiä tekijöitä, jos niitä jaksaa etsiä. Mutta tapausten väliset erot hautaavat lumivyöryn lailla alleen kaikki nämä yhteiset tekijät. Sitä paitsi monet yhteiset tekijät ovat lähinnä itsestäänselvyyksiä: se, että kouluampujien taustalta löytyy kiinnostusta ampuma-aseisiin, on yhtä yllättävää kuin se, että AA-tapaamisissa käyvien taustalta löytyy alkoholismia. Kouluampujien taustalta löytyy myös paljon tekijöitä, joita löytyy ensisijaisesti sellaisilta, jotka eivät aseisiin koskaan tartu. Terveyden ja hyvinvoinnin laitoksen mukaan Suomessa on kymmeniä tuhansia koulukiusattuja; aseisiin on tarttunut kaksi. Erityisesti tämän takia asiantuntijat ovat melko lailla yhtä mieltä siitä, että kouluampumisten ennustaminen on käytännössä mahdotonta (muutaman vuoden takainen Hesarin kirjoitukseni teemasta löytyy täältä).

Kyse on ääri-ilmiöistä, ei tilastollisista tendensseistä. Perinteisen tilastollisen analyysin sijaan johtopäätökset lienee parasta tehdä ainoastaan kyseisen ääri-ilmiön evidenssiin perustuen, ei muihin ”vastaaviin tapahtumiin” vertaamalla. Uskon, että juuri näin Norjan poliisi tässäkin tapauksessa toimii: käyttää kaiken energiansa ainoastaan tämän tapauksen yksityiskohtien selvittämiseen.

Erityisen selvästi tällaisen ääri-ilmiön ainutlaatuisuus tuli minusta esille tässä Oslon tapauksessa, jossa tuli hyvin nopeasti -- muutamassa tunnissa -- selville se, että kyse on tosiaankin ennennäkemättömästä tapauksesta: ampuja esimerkiksi antautui ilman minkäänlaista vastarintaa.

Käytännössä kaikki tilastolliset perusjoukot (demografiset, poliittiset, uskonnolliset), joihin tapauksen 32-vuotias oslolaismies kuuluu, ovat sellaisia, joissa ei ole yhtään toista edes lähimainkaan vastaavaan tekoon syyllistynyttä. Tällaisia äärimmäisiä tekoja on valitettavasti siis hyvin vaikeaa -- ellei suorastaan mahdotonta -- ”ottaa tilastollisesti haltuun”.

Julkinen spekulointi on ollut -- jälleen kerran -- sekä perustelematonta että läpeensä epäoikeudenmukaista. Miksemme pysty pitämään suitamme kiinni, kunnes saamme varmaa tietoa? Eikö Oklahoma Cityn tapauksesta todellakaan olla opittu yhtään mitään?