Oma valokuva
Tarkoitukseni on saada lukija pohtimaan ja kysymään kysymyksiä. Tämän takia esitän tarkoituksella yleiselle ymmärrykselle vastakkaisia argumentteja. Teemat valitsen sen mukaan, missä valtavirralle vastakkaiset argumentit ovat mielestäni perusteltuja ja yhteiskunnallisesti tärkeitä. Konsensus on mielestäni usein sekä harhaanjohtavaa että vaarallista. Vaarana on ”yksimielisyyden illuusio”, joka on valitettavan yleinen älyllisen epärehellisyyden muoto: ollaan samaa mieltä, mutta kukaan ei oikein kykene perustelemaan miksi, saati sitten että perusteluista oltaisiin yhtä mieltä. Blogikirjoitukseni kumpuavat omasta päivätyöstäni tutkijana ja opettajana. Toiset käsittelevät yritysten toimintaan liittyviä kysymyksiä liiketaloustieteellisen tutkimuksen näkökulmasta. Toisissa taas käsittelen tieteen roolia yhteiskunnassa, jota pohdin ensisijaisesti tieteen käytäntöjen näkökulmasta -- siis siitä, millaista tiede on ihmisen harjoittamana toimintana. Monet teksteistäni heijastavat taustaani tilastotieteen soveltajana -- tilastollinen päättely on tärkein tutkimustyökaluni. Muokkaan toisinaan julkaistuja tekstejäkin uusien havaintojen tai saamani palautteen perusteella.

torstai 4. maaliskuuta 2010

Vastaus tieteellisiin kysymyksiin ei ole "kyllä" tai "ei"

- Vaikuttaako ihmisen toiminta ilmaston muuttumiseen?
- Aiheuttaako tupakointi syöpää?
- Aiheuttavatko geenit lihavuutta?
- Onko alkoholilla positiivisia terveysvaikutuksia?

Tieteellinen tutkimus osoittaa päivittäin erilaisten asioiden yhteyksiä toisiinsa. Valitettavasti jossain vaiheessa tutkimustuloksen julkaisuprosessia tulos vesittyy muotoon, jossa havaitun yhteyden vahvuus ja käytännön merkittävyys jäävät -- tai jätetään tahallaan -- täysin pimentoon.

Tällainen kyllä/ei -tyyppinen uutisointi on aina hämmentänyt minua, ehkä erityisesti sen takia, että oli kyse sitten ilmastonmuutoksesta, tupakoinnista, geeneistä tai mistä tieteellisen tutkimuksen teemasta tahansa, tieteelliset kysymykset eivät ole sellaisia, joihin vastaus on joko "kyllä" tai "ei". Tieteellinen tutkimus ei tuota rasti ruutuun -tyyppistä tietoa.

Mieleeni palaa noin viiden vuoden takainen uutinen, jonka mukaan naisten johtamat yritykset menestyivät miesten johtamia paremmin. Kuulin tämän uutisen ensimmäisenä käytäväkeskustelussa kollegaltani, joka oli syystä tai toisesta uutisesta kovin innoissaan. Hämmennykseni oli suuri, kun kollegani ei osannut vastata kysyessäni häneltä, kuinka suuri ero oli havaittu? Hiukan omituista innostua tutkimustuloksesta, jota ei edes muista. Kollegalleni näytti yksinkertaisesti riittävän se, että jonkinlainen yhteys oli löytynyt.

Tämä edustaa jopa ammattitutkijoidenkin keskuudessa valitettavan yleistä tapaa suhtautua tutkimukseen: riittää että muistaa oliko vastaus kyllä vai ei. Erityisesti ilmastonmuutoskeskustelussa minua hämmentää ihmisten -- jopa joidenkin asiantuntijoidenkin -- yksioikoinen suhtautuminen asiaan: tiede kuulemma sanoo "kyllä", joten minunkin on sanottava "kyllä" ja leimattava "denialisteiksi" eivät pelkästään ne, jotka sanovat "ei", vaan myös ne, jotka pitävät kyllä/ei -äänestystä mielettömänä.

Tulee väistämättä mieleen presidentti George W. Bushin retoriikka vuosituhanteen vaihteessa, kun jokainen joka ei ollut terrorismin vastaisessa taistelussa Yhdysvaltain puolella oli automaattisesti heitä vastaan -- kolmatta vaihtoehtoa ei annettu: You're either with us or against us in the fight against terror (Bush YK:ssa 6.11.2001).

Jos kyse on tilastollisesta tutkimuksesta (niinkuin usein näissä uutisissa on), kahden asian välinen yhteys tarkoittaa käytännössä sitä, että tutkimuksessa on löytynyt tilastollinen yhteys kahden tekijän välillä. Tilastollisesti merkitsevä tarkoittaa sitä, että tekijöiden välillä on löydetty jonkinlainen havaittavissa oleva nollasta poikkeava tilastollinen korrelaatio: mikä tahansa yhteys kelpaa, oli se kuinka heikko tahansa, kunhan se on vain tilastollisesti havaittavissa.

Tilastotieteen peruskurssilla hereillä olleet tietävät, että käytännön näkökulmasta täysin merkityksettömätkin yhteydet voivat olla tilastollisesti merkitseviä. Jos käytetty aineisto on erityisen laaja, niin hyvin pienetkin erot näyttäytyvät tilastollisesti merkitsevinä, eli tilastotieteen termein aineistossa on niin paljon tilastollista voimaa, että pienetkin erot havaitaan. Laaja aineisto on ikäänkuin vahva suurennuslasi, jolla havaitaan pieniäkin eroja ja vaikutuksia. Suurin osa oman tutkijanurani aikana näkemistäni tuhansista tilastollisesti merkitsevistä korrelaatioista on ollut suhteellisen yhdentekeviä käytännön merkittävyyden kannalta. Tästäkin huolimatta tällaisetkin tulokset raportoidaan usein merkittävinä löydöksinä.

Tarkoitukseni ei ole väittää, että vaikkapa ihmisen vaikutus ilmaston muutokseen ei ole merkittävä -- minulla ei ole harmainta aavistusta mikä vastaus tähän kysymykseen on. Sen uskallan kuitenkin väittää, että on ajanhukkaa kinastella siitä, onko vastaus "kyllä" vai "ei". Mielekkäät kysymykset ovat muotoa "kuinka paljon?".

Olisi varsin houkuttelevaa syyttää toimittajien lukutaidottomuutta ongelmasta: toimittajat eivät yksinkertaisesti ymmärrä tiedettä, tai sensaatiohakuisuudessaan pimittävät tärkeitä yksityiskohtia. Aivan yhtä syyllisiä ovat kuitenkin myös ne tutkijat, jotka syystä tai toisesta esittävät tuloksensa kyllä/ei -tyyppisinä, eivätkä käsittele lainkaan sitä, kuinka vahvoista yhteyksistä on kyse ja mikä niiden käytännön merkitys voisi olla. Monesti tutkijalla ei valitettavasti edes ole edellytyksiä tarkastella tulosten käytännön merkittävyyttä, jolloin hän tekee sen minkä osaa eli raportoi tilastotieteen käsikirjan neuvojen mukaan merkittävinä tulokset, joissa kahden tekijän välillä on havaittu tilastollinen yhteys riskitasolla 0,05, niinkuin käsikirjan tieteellisen näköinen periaate ohjeistaa. Tämä on tieteen käytäntöjen yleisin työkalu, jolla vastaus pohjimmiltaan kvantitatiiviseen tutkimuskysymykseen ("kuinka paljon?") saadaan näppärästi yksinkertaistettua kyllä/ei -muotoon.

Arvostettu tilastotieteilijä ja psykologian emeritusprofessori William Rozeboom (University of Alberta) on osuvasti tituleerannut tällaisten tilastollisen merkitsevyyden periaatteiden soveltamista "takuuvarmasti idioottimaisimmiksi tilastollisen tutkimuksen menetelmiksi".