Oma valokuva
Tarkoitukseni on saada lukija pohtimaan ja kysymään kysymyksiä. Tämän takia esitän tarkoituksella yleiselle ymmärrykselle vastakkaisia argumentteja. Teemat valitsen sen mukaan, missä valtavirralle vastakkaiset argumentit ovat mielestäni perusteltuja ja yhteiskunnallisesti tärkeitä. Konsensus on mielestäni usein sekä harhaanjohtavaa että vaarallista. Vaarana on ”yksimielisyyden illuusio”, joka on valitettavan yleinen älyllisen epärehellisyyden muoto: ollaan samaa mieltä, mutta kukaan ei oikein kykene perustelemaan miksi, saati sitten että perusteluista oltaisiin yhtä mieltä. Blogikirjoitukseni kumpuavat omasta päivätyöstäni tutkijana ja opettajana. Toiset käsittelevät yritysten toimintaan liittyviä kysymyksiä liiketaloustieteellisen tutkimuksen näkökulmasta. Toisissa taas käsittelen tieteen roolia yhteiskunnassa, jota pohdin ensisijaisesti tieteen käytäntöjen näkökulmasta -- siis siitä, millaista tiede on ihmisen harjoittamana toimintana. Monet teksteistäni heijastavat taustaani tilastotieteen soveltajana -- tilastollinen päättely on tärkein tutkimustyökaluni. Muokkaan toisinaan julkaistuja tekstejäkin uusien havaintojen tai saamani palautteen perusteella.

perjantai 11. maaliskuuta 2016

Tasa-arvoa ei saa ajaa itsepetoksella

Tasa-arvo on minulle niin tärkeä asia, etten voi sietää sen ajamista tutkimuksilla, joissa esitetään vääristäviä, perustelemattomia tai epäolennaisia väitteitä.

Seuraavassa muutama huomio julkisuudessa siteeratuista tutkimuksista, jotka kaikki noudattavat enemmän tai vähemmän samaa kaavaa: niissä tehdään johtopäätöksiä naisten ja miesten johtamien yritysten suorituskykyä vertailemalla.

1 -- Muistan itse kymmenen viime vuoden ajalta kourallisen tutkimuksia, joissa on osoitettu, että naisjohtajien johtamat yritykset ovat kannattavampia. Onko näyttö siis vahvaa? En tiedä, koska en tiedä kuinka monessa tutkimuksessa etsittiin eroja, mutta mitään ei löytynyt. Siitä olen aivan varma, että jos suomalaistutkija jonkun eron löytää, niin etusivun uutinen on taattu. Valtaosaa mieleeni palautuvista tutkimuksista ei ole koskaan vertaisarvioitu, joten niiden sisältämien tulosten luotettavuus on täysin tutkimuksen tekijöiden oman ilmoituksen varassa. Tieteen piirissä näitä kutsutaan työpapereiksi, joiden tuloksia ainakaan vastuuntuntoinen tutkija ei ala rummuttaa julkisuudessa. Viimeksi tällä viikolla Kansainvälisen valuuttarahaston IMF:n Christine Lagarde siteerasi BBC:n haastattelussa IMF:n työpaperin tuloksia, ehkä miljoonien ellei kymmenien miljoonien katsojien edessä. Luin kyseisen työpaperin ja sen analyyseihin perehdyttyäni olisin todella yllättynyt, jos se kelpaisi julkaistavaksi vertaisarvioidussa lehdessä. Löysin argumentista useita metodologisesti fataaleja kategoriavirheitä, ja ainakaan minun tutkijaseminaarissani IMF:n tutkimus ei menisi läpi edes opiskelijan harjoitustyönä. Mutta IMF:n arvovallalla sen tulokset epäilemättä hyväksytään sellaisinaan.

2 -- Ovatko naiset parempia johtajia? Jos halutaan esittää väite miesten ja naisten johtamistaidoista, niin silloin täytyy oikeasti arvioida empiirisesti miesten ja naisten johtamistaitoja. Kumma kyllä yhdessäkään julkisuudessa suurella fanfaarilla uutisoidussa tutkimuksessa ei ole oikeasti tutkittu johtamiskykyjä, vaan ainoastaan johtajien sukupuolen ja yrityksen tuloksen korrelaatiota. Syy tähän on tietysti ymmärrettävä: johtamistaitojen tutkiminen empiirisesti on todella aikaavievää puuhaa, kun taas tilinpäätöstiedot ja johtoryhmän demografiset jakaumat sisältävän datan saa ostettua kaupan hyllyltä muutamalla satasella. Mutta se, joka väittää yrityksen taloudellisen suorituskyvyn perustan löytyvän merkittävällä tavalla johtoryhmän tai hallituksen sukupuolijakaumasta, on auttamattomasti pihalla sekä yritystoiminnan taloudellisista realiteeteista että tuhansista yrityksen taloudellista suorituskykyä käsittelevistä vertaisarvioiduista tilastollisista tutkimuksista, joissa toimitusjohtajan sukupuoli ei ole käytännössä koskaan ollut mielekäs muuttuja.

3 -- Missä on näyttö siitä, että nainen johtaa samaa yritystä paremmin kuin mies? Kun sanotaan, että ”nainen on miestä parempi johtaja”, niin tätähän sen täytyy tarkoittaa. Eihän väitteessä Kirsti Paakkanen johti Marimekkoa paremmin kuin Jorma Ollila Nokiaa ole mitään järkeä. Se, että naisten johtamat yritykset menestyvät keskimäärin paremmin kuin miesten johtamat, ei tarkoita, että yhden ja saman firman miestoimitusjohtajan vaihtaminen naisjohtajaksi kohentaisi yrityksen taloudellista tulosta. Sanoi intuitio tästä mitä tahansa, tilastomatemaattinen fakta on se, että yritysten välisillä eroilla ja yksittäisissä yrityksissä ajassa tapahtuvilla muutoksilla ei ole mitään tekemistä toistensa kanssa. Yrityksen koon ja ylimmän johdon palkkioiden välinen yhteys on tästä hyvä esimerkki (esim. Lambert, R. A., Larcker, D. F., & Weigelt, K., 1991. How sensitive is executive compensation to organizational size? Strategic Management Journal, 12(5), 395-402).

Julkisuudessa raportoidut tutkimukset perustuvat tilastollisten otosten varianssien ja keskiarvojen -- ei siis ajassa tapahtuvan muutoksen -- analysointiin. Empiirinen tutkimusasetelma on käytännössä pääpiirteissään se, että yritykset jaetaan naisten ja miesten johtamiin yrityksiin, ja näitä ryhmiä verrataan toisiinsa. En tiedä yhtään tutkimusta, jossa olisi tarkasteltu suuressa otoksessa yrityksen tuloksen kehitystä toimitusjohtajan vaihduttua miehestä naiseksi, ja niin että olisi osoitettu, että nainen johtaa yritystä menestyksekkäämmin, tai että naisten lisääminen johtoryhmään tai hallitukseen kohentaa tulosta. Jos tiedät, että tällainen vertaisarvioitu tutkimus on olemassa ja siinä on uskottavasti osoitettu systemaattinen positiivinen naisjohtajaefekti, niin laita sähköpostia tulemaan (mikko@ketokivi.fi). Lahjoitan sata euroa ensimmäisen esimerkin lähettäneen valitsemaan hyväntekeväisyyskohteeseen.

Väitteet naisjohtajien paremmuudesta ovat lopulta aika tympeitä karhunpalveluksia naisille. Jos alamme ihan oikeasti uskoa siihen, että naiset ovat miehiä parempia johtajia, niin omistajat alkavat hyvin ymmärrettävästi myös odottaa tätä. Tämä odotus on sekä epäoikeudenmukainen että kohtuuton. Epäoikeudenmukaiseksi odotuksen tekee se, että ainakin minun käyttämäni määritelmän mukaan on tasa-arvon ajatukselle päinvastaista odottaa yhdeltä sukupuolelta enemmän kuin toiselta. Kohtuuttomaksi odotuksen tekee se, että uskottavaa näyttöä naisten paremmuudesta johtajina ei yksinkertaisesti ole olemassa. Samaisessa BBC:n haastattelussa Christine Lagarde väitti, että naisten palkkaaminen yritysten johtoon tarjoaa ei enempää eikä vähempää kuin ratkaisun hitaan talouskasvun haasteeseen! Voi hyvänen aika sentään millaisia odotuksia naisjohtajien harteille ollaan lataamassa. Mitä tapahtuu, jos (kun) näitä odotuksia ei lunasteta?

En väitä, etteikö miesten hegemonia yritysten johtoryhmissä ja hallituksissa olisi epäkohta ja ongelma -- se on sitä mitä suurimmassa määrin. Minä en vaan kuollaksenikaan muista milloin viimeksi itsepetos olisi tarjonnut yhteiskunnalliseen ongelmaan toimivan ratkaisun.

keskiviikko 23. joulukuuta 2015

Jos rikkaita halutaan haukkua, niin haukutaan perustelluista syistä

Hesarin "suuren köyhyyskyselyn" tulokset on jostain syystä otettu rikkaiden sättimisen keppihevoseksi. Selvästi tarkoitushakuisin uutinen revittiin seuraavasta kokeesta (HS 20.12.):

---
Tutkijaryhmä poimi aineistosta erilleen kaikkein rikkaimpien ja kaikkein köyhimpien vastaukset ja vertaili niitä. Otettiin 125 suurituloisinta ja 125 köyhintä. Toisessa joukossa perheiden tulot olivat alle 500 euroa kuukaudessa, toisessa 15 500–250 000 euroa kuukaudessa. Sitten tehtiin pieni koe.

Vastaukset annettiin luettavaksi sosiologiasta opinnäytetyötään tekevälle Annina Mutaselle ensin niin, ettei kerrottu, mitkä niistä ovat köyhien ja mitkä rikkaiden vastauksia. Mutanen lajitteli vastaukset sisällön mukaan. Sitten katsottiin, noudattavatko näkemykset tulotasoa.

Tulos oli, että 65 prosentissa tapauksista hän oli pystynyt vastauksen sisällöstä arvaamaan vastaajan tulotason oikein.
---

Tuota 65 prosenttia ei sen kummemmin tulkittu eikä analysoitu. Rivien välissä lukee, että rikkaan ja köyhän mielipiteet köyhyydestä ovat selvästi erilaisia.

Tuota 65 prosenttia voisi kuitenkin analysoida hiukan. Ensimmäinen huomio on se, että lukua ei pidä verrata nollaan vaan 50 prosenttiin: Mutanen saisi puhtaalla arvauksella kommentteja lukematta keskimäärin 50 prosenttia vastauksista oikein. Tähän verrattuna 65 prosenttia ei tunnu enää kovinkaan huimalta parannukselta.

Seuraavaksi täytyy ottaa huomioon se, että tuo 50 prosenttia on vain keskiarvo, ja Mutanen voi päästä arvaamalla selvästi yli 50 prosentin osumatarkkuuteen. Yksinkertainen laskutoimitus binomijakauman keskihajonnalla kertoo, että puhtaalla arvauksella voi hyvinkin päästä 56 prosenttiin oikeita vastauksia. 65 prosenttia on enää 9 prosenttiyksikköä korkeampi.

Nyt kun otetaan vielä huomioon otanta (kokeen tuloiltaan köyhät ja tuloiltaan rikkaat ovat todella ääripään köyhiä ja ääripään rikkaita), niin ainoa rehellinen ja puolueeton johtopäätös tästä on se, että rikkaiden ja köyhien mielipiteitä köyhyydestä on todella vaikeaa erottaa toisistaan. Minusta tämä on varsin yllättävä, joskin oikeastaan erittäin positiivinen asia. Kuitenkin sekä Hesarin toimittaja että tutkimuksen tehneet tutkijat haluavat syystä tai toisesta tehdä täysin päinvastaisia tulkintoja. Hesarin juttu alkaa lauseella "Näin rikkaat ajattelevat köyhistä", jota seuraa ilmeisen tarkoitushakuisesti koottu litania rikkaiden esittämiä ylimielisiä kommentteja köyhistä ja köyhyydestä. No, kun vastaajia on liki kymmenen tuhatta, niin kyllähän sieltä löytyy vaikka kuinka oksettavia mielipiteitä, kunhan vaan jaksaa etsiä.

Onkohan tämä nyt sitä "keskustelua herättävää vastakkainasettelua", jonka tunnettu suomalainen toimittaja kertoi minulle olevan toimittajien tärkeä tehtävä, kun hän joitain vuosia sitten pyysi kommenttejani STX-telakkajupakan yhteydessä?


p.s. Sain sähköpostilla erinomaisen kommentin kirjoituksestani, kiitos siitä! Meilissä esitettiin, että kyllä tuo koko 15 prosenttia mikä menee yli 50 prosentin pitäisi pistää Mutasen taidon piikkiin, koska hän selvästi kykenee ainakin jotenkin erottelemaan rikkaiden ja köyhien vastaukset toisistaan (onhan tuo 65 prosenttia selvästi tilastollisesti merkitsevä). Ymmärrän argumentin logiikan, mutta itse tulkitsen tulosta konservatiivisesti, jotta tulkinnallisia ylilyöntejä ei pääse tapahtumaan. Koska kokeen teki ainoastaan yksi henkilö ja ainoastaan yhden kerran, ei voida tietää kuinka suuri osa tuosta 50 prosentin ylimenevästä osuudesta on säkää ja kuinka paljon taitoa. On siis yksinkertaisesti valittava miten tulos tulkitaan. Konservatiivisena tulosten tulkitsijana laitan itse ensimmäiset 6 prosenttiyksikköä säkän piikkiin. On jokseenkin turha alkaa kiistellä siitä, onko tämä oikein vai väärin, koska tämä on sama kuin kysyisi onko konservatiivisuus evidenssin suhteen väärä vai oikea valinta. On aivan perusteltua tulkita tuota 65 prosenttia konservatiivisesti -- siis "korjata sitä alaspäin" -- koska myös puhdas arvaus tuottaa 50 prosentin todennäköisyydellä oikean vastauksen. Hakusanalla "correcting for guessing" löytyy paljon teemaan liittyvää lukemistoa.

Koe pitäisi ilman muuta toistaa ja tarkastella useiden riippumattomien koehenkilöiden osumatarkkuuksia.

Tämä on kuitenkin minusta pieni detalji, joka ei muuta argumenttini keskeistä johtopäätöstä lainkaan: rikkaiden ja köyhien mielipiteitä köyhyydestä on todella vaikeaa erottaa toisistaan -- todella mielenkiintoinen löydös!

tiistai 9. kesäkuuta 2015

Hyväntekeväisyyttä harjoittavat yksilöt, eivät yhteisöt

Amerikkalainen taloustieteilijä ja nobelisti Milton Friedman esitti 1960-luvulla ajatuksen, että yrityksen yhteiskuntavastuu ei voi olla muuta kuin taloudellisen lisäarvon tuottamista. Kävimme pari viikkoa sitten MBA-opiskelijoiden kanssa Jyväskylän yliopistossa mielenkiintoisia keskusteluja teemasta, ja voisi olla paikallaan pohtia hiukan asiaa myös blogitekstissä.

Friedmanin kanta on helppo sivuuttaa oksettavana. Siihen voi myös yrittää tutustua hiukan tarkemmin, jotta ymmärtäisi, miksi Friedman piti yritysten yhteiskuntavastuuta ongelmallisena käsitteenä. Friedmanin kanta kiteytyy neljään keskeiseen kysymykseen:

1 -- Jos yrityksillä (käytännössä niiden ylimmällä johdolla) on muita yhteiskunnallisia velvoitteita kuin taloudellisen lisäarvon luonti, mistä he tietävät mitä nämä velvoitteet ovat?
2 -- Yritysjohtajat ovat yksityishenkilöitä, joita ei ole valittu tehtäväänsä millään muotoa demokraattisesti, vaan heidät on palkattu palvelemaan yksityisiä intressejä. Ovatko he oikeita henkilöitä päättämään, mikä on yhteiskunnan edun mukaista?
3 -- Kuinka paljon yrityksen varallisuutta yhteiskunnan edun vaalimiseen tulee käyttää?
4 -- Onko hyväksyttävää, että yritys näin ryhtyy julkiseksi toimijaksi? Sehän käytännössä verottaa omistajiaan ja näillä "verotuotoilla" ryhtyy julkisten hyödykkeiden tuottajaksi. Onko hyväksyttävää, että näistä verotuspäätöksistä vastaavat yksityishenkilöt, jotka sattuvat kulloinkin istumaan yrityksen johtoryhmässä tai hallituksessa?

Ongelmalliseksi asian tekee se, että raja yhteiskuntavastuun ja poliittisen aktivismin välillä on häilyvä. Jos pikaruokakonserni haluaa rakentaa lastensairaalan, niin moni pitää asiaa hyvänä, itse asiassa niin hyvänä, että se vaikuttanee positiivisesti yrityksen taloudelliseen arvoon. Mutta kun globaalin kahvilaketjun toimitusjohtaja kannattaa avoimesti samaa sukupuolta olevien oikeutta solmia avioliitto, asia monimutkaistuu. Oli homoliitoista mitä mieltä tahansa, on tunnistettava, että tällaiset kannanotot yrityksen toimitusjohtajalta saattavat vahingoittaa yrityksen arvoa. Tätä ei voi sivuuttaa olankohautuksella: monissa maissa laki velvoittaa yritysjohtoa ja yrityksen hallitusta toimimaan tavalla, joka on lojaali osakkeenomistajia kohtaan (esimerkiksi amerikkalaisessa lainsäädännössä ns. lojaalisuusvelvoite on yrityksen hallituksen keskeisin velvoite). Näin ollen avoin tasa-arvon puolustaminen -- niin kunnioitettavaa kuin se onkin -- saattaa olla voittoa tavoittelevan toiminnan piirissä jopa lain vastaista. Tähän kiteytyy yhteiskuntavastuun dilemma, joka on aivan pakko tunnistaa, jos keskustelussa halutaan aidosti päästä eteenpäin. Monet tyytyvät kuitenkin omaa näkökulmaa puolustavaan asemasotaan, mikä on tietysti helpompi vaihtoehto.

Kun Norjassa tuli voimaan laki, että julkisesti noteerattujen yritysten hallituksissa täytyy olla vähintään 40% naisia, yritysten arvo aleni huomattavasti. On siis täysin perusteltua esittää, että kyseinen tasa-arvolaki on ristiriidassa ainakin osakeyhtiölain hengen kanssa. No, yritykset tietysti välttivät lainsäädännön vaikutuksen siirtymällä sen ulottumattomiin: 30% julkisista osakeyhtiöistä päätti lähteä pörssistä. Jokainen vähänkin rahoitusmarkkinoita tunteva tietää, että pörssin kutistuminen kolmanneksella voi olla melkoinen ongelma.

Tasa-arvon vaalimisen seuraamukset on aina ymmärrettävä kokonaisuudessaan.

On tietysti selvää, että yritykset eivät saa toimia laittomasti tai moraalittomasti. Friedmania kritisoidaan monesti siitä, että hänen kantansa puolustaa moraalittomuutta ja ahneutta. Dikotomisointi on kuitenkin väärä: valintaa ei tehdä moraalisen ja moraalittoman (immoral) vaan moraalisen ja ei-moraalisen (amoral) välillä. Ei-moraalinen tarkoittaa sitä, että voittoa tavoittelevan toiminnan piirissä ei oteta kantaa mahdollisiin moraalisiin kysymyksiin. Tämä ei ole sama asia kuin moraaliton toiminta eikä se tietenkään saa siihen johtaa. Jos se siihen johtaa, niin syynä on kyllä joku muu kuin Friedmanin oppien noudattaminen. Olen huomannut, että taloustieteilijöitä syytetään aika ajoin yhteiskunnan ongelmista [esim. Ghoshal, S. (2005). Bad management theories are destroying good management practices. Academy of Management Learning & Education, 4(1), 75-91]. Logiikka näissä argumenteissa on vähän sama kuin siinä, että rattijuoppous ja ylinopeus laitettaisiin autokoulujen syyksi. Olen kirjoittamassa vastinetta Ghoshalin argumenttiin, joka on tällä hetkellä tarkastettavana yllä mainitussa AMLE-lehdessä (käsikirjoitusta voi pyytää minulta sähköpostitse). Ajatus siitä, että talousteoriat jotenkin murentaisivat yritysjohtajien moraalia, on jokseenkin hämmentävä. Sillä, että Enronin toimitusjohtaja Jeffrey Skilling päätti ryhtyä talousrikolliseksi, ei varmaankaan ole hirveästi tekemistä sen kanssa, että hänellä on MBA-tutkinto Harvardista. Harvardin MBA-ohjelmasta valmistuu vuosittain 2000 maisteria -- kuinka monen heistä tiedämme syyllistyneen rikoksiin? Harvardista on sitä paitsi valmistunut myös yritysmaailman kuuluisin filantrooppi Bill Gates (no, jätti ensin kesken mutta lopulta v. 2007 sai tutkinnon).

Kaikki tykkäävät kivoista asioista: on helppo vedota yhteiskuntavastuuseen puhumalla lastensairaalasta. Mutta yleisiä argumentteja ei saa rakentaa yksittäistapauksen varaan. Yleisellä tasolla fakta on kiistaton: kun puhutaan yhteiskuntavastuusta, kyse on aina valinnoista, ja valintatilanteissa yhden mieltymykset ovat aina erilaisia kuin toisen. Tämän takia Friedman korostaa ajatusta, että yrityksen (kollektiivin) ei tule ryhtyä harjoittamaan filantropiaa. Kun hampurilaiskonserni rakensi lastensairaalan, olivatko kaikki osakkaat yksimielisesti ajatuksen takana? Tuskin. Olisivatko jotkut omistajista halunneet lahjoittaa omaisuuttaan -- kun sitä nyt haluttiin johonkin lahjoittaa -- mieluummin johonkin muuhun, esimerkiksi vanhusten hoitoon tai nuorten mielenterveyden edistämiseen? Aivan varmasti. Onko hyväksyttävää, että hampurilaiskonsernin ylin johto päätti sivuuttaa näiden osakkaiden toiveet? Rehellinen vastaus tähän kysymykseen ei voi olla muuta kuin kieltävä.

Friedmanin mukaan yrityksen on jaettava yrityksen voitto omistajille, joille se kuuluu, ja omistajat voivat mieltymystensä mukaan harjoittaa hyväntekeväisyyttä niin paljon kuin haluavat. Käsittääkseni peliyhtiö Supercell toimi juuri näin: lahjoituksia ei tehnyt Supercell vaan sen henkilökunta.

Tämä on juurikin Friedmanin oppien mukaista hyväntekeväisyyttä. Supercellin henkilökunnan ja ylimmän johdon toimissa yhdistyy esimerkillisesti sekä filantropia että hyvä hallinto. Uusimman netti-Hesarin uutisen mukaan yritysjohtajista Matti Alahuhta, Reijo Karhinen ja Antti Herlin ovat samoin lupautuneet lahjoittamaan omasta palkastaan (eivät yrityksen varoista) yhteiskunnan hyväksi.

Voidaan myös kysyä, että miksi julkisissa keskusteluissa yhteiskuntavastuu rajoittuu käytännössä yritysten omistajiin ja ylimpään johtoon. Esimerkiksi ahtaajien lakon aikana monilla heräsi kysymys: onko työntekijäjärjestöillä aina oikeus ajaa ainoastaan omaa etuaan? Olen huomannut, että tämä on kysymys, josta Suomessa on käytännössä mahdotonta käydä keskustelua. Poliittiset intohimot, puolin ja toisin, ovat valtavat. Ilolla kuitenkin pistin merkille, että yllä mainitun netti-Hesarin uutisen yhteydessä kysyttiin myös ay-johtajien kiinnostusta osallistua yritysjohtajien tapaan "palkkatalkoisiin". On sekä tärkeää että esimerkillistä viedä kysymykset yrityksen ja organisaation tasolta nimenomaan yksilötasolle, ja että haaste esitetään kaikille yrityksen sidosryhmille, ei ainoastaan suurten yritysten ylimmälle johdolle, jotka ovat kansantalouden näkökulmasta mitättömän pieni ryhmä: vaikka sadan suurimman yrityksen toimitusjohtajat antaisivat 10% nettotuloistaan hyväntekeväisyyteen, kansantaloudellisesti kyse olisi parhaimmillaankin hyttysen ininästä.

Kriittinen itsereflektio on tärkeää. Onkin paikallaan päättää tekstini kysymykseen: kun seuraavan kerran myyt omaisuuttasi (vaikkapa asuntosi), kuinka paljon mahdollisesti syntyvästä myyntivoitosta aiot lahjoittaa yhteiskuntavastuun nimissä hyväntekeväisyyteen? Tai voisiko valtio pistää myyntivoiton veron päälle vielä ylimääräisen yhteiskuntavastuuveron? Mikä olisi mielestäsi sopiva yhteiskuntavastuuvero, esimerkiksi prosentteina myyntivoitosta?

Toivottavasti vastauksesi ei ole se, että mielestäsi yhteiskuntavastuu ei koske sinua. Jos se ei nimittäin koske sinua, niin ei koske kyllä ketään muutakaan.

torstai 23. huhtikuuta 2015

"No tää nyt ei ollutkaan tieteellinen selvitys"

Reaktio YLEn faktorianalyyseista esittämääni kritiikkiin oli jotakuinkin ennustettavissa, ja kiteytyy tokaisuun "no tää nyt ei ollutkaan mikään tieteellinen selvitys".

Lopetan välittömästi tällaisten analyysien kritisoinnin, jos niiden loppuun laitetaan huomio "Tämä tutkimus ei täytä tieteellisissä teksteissä esitettyjä mittaamiseen liittyviä kriteerejä". Perään voisi laittaa vaikka muutaman teknisen selvennyksen:

1) Analyyseissa ei ole arvioitu mittauksen luotettavuutta (reliabiliteetti ja validiteetti) lainkaan.
2) Analyyseissa ei ole tarkasteltu sisällöllisesti validiksi osoitettuja mittareita.
3) Aineiston varianssista selittyy kolmasosa; se että valtaosa jää selittämättä, ei ole tämän selvityksen kannalta olennaista.
4) Uutisessa käytetään faktorianalyyttista terminologiaa, mutta tietyin taiteellisin vapauksin. Olemme käyttäneet esimerkiksi sanoja riippuvaisuus ja vastaus synonyymina tilastotekniselle käsitteelle varianssi.

Syy, miksi puutun tällaisiin analyyseihin on se, että yksi tärkeä osa päivätyötäni on opettaa tutkijoita faktorianalyysin vastuullisiksi käyttäjiksi. Sikäli minulla on tässä oma lehmä ojassa, että jos tällaiset analyysit ihan oikeasti hyväksytään yhteiskunnallisessa keskustelussa tiedoksi, niin faktorianalyysin ja mittausteorian opettamisen voi yliopistoissa ainakin maisteritasolla lopettaa tarpeettomina.

Minulle opetettiin jo ensimmäisessä tohtoriseminaarissa Minnesotan yliopistossa syksyllä 1997, että tällaisia eksploratiivisia faktorianalyyseja ei enää hyväksytä opinnäytetöissä.

Jos analyyseissa ollaan "suurpiirteisiä", niin ollaan sitä sitten avoimesti.

tiistai 21. huhtikuuta 2015

Miten perussuomalaisista tuli konservatiiveja?

Vuoden 2011 eduskuntavaalien jälkeen Helsingin yliopiston tutkijoiden kanssa yhteistyössä tilastollisen analyysin tehneet Hesarin toimittajat totesivat Osmo Soininvaaran olevan oikeistolaisin. Soininvaara oli tuolloin melkoisen hämillään tästä johtopäätöksestä -- taisi olla aika moni muukin.

Aika hämillään taitaa olla moni tälläkin kertaa luettuaan YLEn uutisen Kuka on oikeistolaisin, kuka liberaalein? Suurin hämmennyksen kohde omalla kohdallani on konservatiivi-liberaali -erottelu. Tutkijoiden tekemän analyysin mukaan konservatiivit ajattelevat, että

(1) Maahanmuuttoa Suomeen on rajoitettava terrorismin uhan vuoksi.
(2) Euron ulkopuolella Suomi pärjäisi paremmin.
(3) Suomeen tarvitaan enemmän poliiseja.
(4) Verkkovalvonnassa valtion turvallisuus on tärkeämpää kuin kansalaisten yksityisyyden suoja.
(5) Suomessa on liian helppo elää sosiaaliturvan varassa.

kun taas liberaalien mielestä

(1) Suomen pitää ottaa suurempi vastuu EU:n alueelle tulevista turvapaikanhakijoista.
(2) On aika luopua ajatuksesta, että koko Suomi on pidettävä asuttuna.
(3) Ilmastonmuutoksen hillitseminen pitää asettaa teollisuuden kilpailukyvyn edelle.
(4) Geenimuunneltu ruoka on turvallista ihmiselle ja ympäristölle.
(5) Ruoan verotusta on varaa kiristää.

Sentimentti on siis se, että konservatiivit ja liberaalit eivät ajattele samoista asioista eri tavalla, vaan yksinkertaisesti ajattelevat eri asioita. Samalla liberalismi ja konservatiivisuus esitetään YLEn analyysissa yhden ja saman jatkumon ääripäinä. Eli liberaalit ja konservatiivit ajattelevat aivan eri asioita, mutta kuitenkin keskenään vertailukelpoisesti (?) Onko lopputulema hyödyllinen vai keinotekoisuudessaan harhaanjohtava vastakkainasettelu?

Ei liene yllättävää, että YLEn analyysin tuloksena esimerkiksi perussuomalaiset todetaan konservatiiveiksi.

Mutta minkä määritelmän tai valtio-opin teorian mukaan maahanmuuton rajoittaminen (nimenomaan terrorismin uhan vuoksi) ja eurosta luopuminen ovat konservatiivisuutta? Entäs geenimuunnellun ruoan ympäristöystävällisenä pitäminen liberalismia?

Eivät minkään.

Nämä vaalikyselyjen pohjalta tehdyt analyysit ovat siitä harhaanjohtavia, että eihän niissä ole oikeasti mitattu esim. konservatiivisuutta. Johtopäätökset perustuvat ehdokkailta (yhdessä tarkoituksessa) kysyttyihin hyvin kirjaviin yksittäisiin kysymyksiin, joihin annettuja vastauksia on jälkikäteen analysoitu (aivan toisessa tarkoituksessa) tilastollisella algoritmilla, joka ryhmittelee vastaukset sen mukaan, kuinka vahvasti ne korreloivat keskenään. Tämä ryhmittely on puhtaasti empiirinen ja siinä ei olla käytetty hyväksi mitään määritelmiä (esim. käsitteille konservatiivisuus ja liberalismi). Nämä otsikot liitetään kysymyksistä muodostettuihin ryhmiin vasta analyysien jälkeen. Eli kun huomataan, että vastaukset ilmastonmuutosta, ruoan verotusta ja geenimuunnellun ruoan turvallisuutta koskeviin kysymyksiin korreloivat, tulkitaan että nämä ovat liberalismin heijastumia, joskin aika moni käyttäisi tulkita-verbin sijaan verbiä keksiä. Ainakin minulle geenimuunnellun ruoan ympäristöystävällisyys on empiirinen tieteellinen kysymys. En siis ymmärrä, miten tieteelliseen kysymykseen suhtautuminen on osoitus poliittisesta ideologiasta, ja miksi liberaalit pitävät geenimuunneltua ruokaa nimenomaan turvallisena.

Pakko luovuttaa, en ymmärrä tällaista tilastollista analyysia, en sitten millään.

Jos halutaan oikeasti mitata ehdokkaan konservatiivisuutta, niin marssijärjestyksen pitäisi olla täysin päinvastainen:

1) ensin määritellään tarkasti, mitä konservatiivisuudella (ja liberalismilla) tarkoitetaan. Jo Wikipediakin tuntee konservatiivisuudelle kahdeksan eri alalajia, joten käsitteitä täytynee tarkentaa melkoisesti, ennenkuin määritelmät kirkastuvat.
2) sitten operationalisoidaan käsitteet täsmäkysymyksiksi määritelmien pohjalta; kysymykset siis ryhmitellään a priori eikä vasta analyysien jälkeen.
3) tämän jälkeen luodaan kysely, jossa haetaan vastauksia ehdokkailta.
4) vastaukset analysoidaan konfirmatorisella algoritmilla: korreloivatko konservatiivisuutta käsittelevät kysymykset tavalla, jolla niiden ennustettiin korreloivan? Kysymykset siis kysytään ja analysoidaan samassa eikä eri tarkoituksessa.

Tilastotieteen termein puhutaan eksploratiivisesta (YLE) vs. konfirmatorisesta (minun ehdotukseni) lähestymistavasta. Minun on erittäin vaikea ymmärtää, miksi vuosi toisensa jälkeen näitä analyyseja tehdään ainoastaan eksploratiivisella otteella. Lopputulema on aina sama: käsitteiden empiirinen sisältö on yhtä sillisalaattia.

Kaikkien ns. faktorianalyyttisten tutkimusten keskeinen ominaisuus on se, että tulokset riippuvat täysin siitä, mitä on kysytty. Se, että konservatiivisuus on de facto määrittynyt tietynlaiseksi nationalismiksi, on seurausta vain ja ainoastaan siitä, että tämän päivän Suomessa näitä kysymyksiä kysytään vaalien alla. Perussuomalaisista on siis tullut konservatiiveja sen takia, että heidät on aineiston perusteella sellaisiksi määritelty. Konservatiivin leima on siis täysin päälleliimattu ominaisuus.

Valtio-opin professori Matti Wiberg toteaa YLEn uutisessa, että

"Tässä perussuomalaiset ovat selvästi paljastaneet karvansa. Silmiinpistävästi perussuomalaiset tai heidän ehdokkaittensa painopiste on konservatiivisempi kuin kristillisdemokraateilla. Tässä on kyllä miettimisen paikka aika monella."

Tulkinnassa täytyy pitää kieli keskellä suuta: ainakaan minusta perussuomalaiset eivät ole sinänsä paljastaneet yhtään mitään, vaan heidän otsaansa on yksinkertaisesti lyöty konservatiivin leima. Minä en ymmärrä, miten tämä leima auttaa meitä ymmärtämään yhtään mitään paremmin kuin aiemmin -- jos jollain on tähän vasta-argumentti, niin olen pelkkänä korvana. Samanlaista tarpeetonta leimaamista on tapahtunut muidenkin puolueiden kohdalla, perussuomalaiset ovat vain minusta selvin esimerkki.

Tieteellisessä tutkimuksessa käsitteiden empiiristä sisältöä ei määritellä aineiston kautta vaan a priori. Käsitteiden operationalisointi ennen aineiston keruuta onkin tutkimuksen keskeisimpiä vaiheita. Tällaiset YLEn selvityksen kaltaiset puhtaasti aineistolähtöiset analyysit siis tuskin kelpaisivat edes maisteritason opinnäytetöiksi. Toisaalta, oli tiedonintressi tieteellinen tai ei: eikö perussuomalaisista pitäisi tulla konservatiiveja (jos on tullakseen) ja Osmo Soininvaarasta oikeistolainen (jos on tullakseen) vasta sitten kun konservatiivisuus (ja oikeistolaisuus) on ensin perustellusti määritelty ja sitten mitattu tarkoitusta varten kehitetyllä mittarilla?

tiistai 31. maaliskuuta 2015

Lähteekö "talentti" Fortumista?

Otin mielenkiinnolla vastaan uutisen, että Fortum päätti olla nostamatta hallituspalkkioitaan. Eikö nyt siis saada melko suoraan testattua hypoteesi, että "talentti" lähtee hallituksesta, jos sille ei makseta kunnolla? Aika moni julkisuudessa palkkioiden korotuksia vaatinuthan on esittänyt, että osaajat pitää houkutella hallitushommiin nimenomaan rahalla (tästä kirjoitin jo aiemmin).

Itse satun olemaan täysin eri mieltä. Veikkaan myös, että yksikään tällä hetkellä Fortumin hallituksessa istuvista ei irtisanoudu palkkioiden jäädyttämisen takia.

Tällä hetkellä Fortumin hallituksessa istuvat Sari Baldauf, Kim Ignatius, Minoo Akhtarzand, Heinz-Werner Binzel, Eva Hamilton, Tapio Kuula, Petteri Taalas ja Jyrki Talvitie. Tälle "talentille" maksetaan 40-75 tuhannen euron vuosipalkkio, joka työmäärä huomioon ottaen on enemmän kuin kohtuullinen. Hallitus nimettiin tänään, joten voinemme olettaa, että nimitetyt ovat tyytyväisiä palkkioihinsa.

Fortumin hallituspalkkiot ovat suunnilleen samaa luokkaa kuin Applen hallituspalkkiot. Jos Disneyn toimitusjohtaja Robert Iger istuu 50 tuhannen dollarin palkkiota vastaan Applen hallituksessa, niin uskoisin, että Ilmatieteenlaitoksen Petteri Taalakselle samansuuruinen liksa Fortumin hallitustyöstä riittää mainiosti. Pitäisi ainakin, Apple kun teki esimerkiksi vuonna 2013 liikevoittoa 37 miljardia dollaria, mikä on noin kahdeksan kertaa Fortumin liikevaihto.


p.s. 1.4.2015

Nesteen hallituksen puheenjohtaja Jorma Elorannan ulostulon (Kauppalehti 1.4.) on pakko olla aprillipila. Kauppalehden uutisen mukaan Eloranta arvostelee avoimesti Nesteen yhtiökokouksessa sitä, että valtio-omistaja vastustaa Nesteen hallituspalkkioiden korottamista. Eloranta siis toteaa yksioikoisesti ja vieläpä tiedotusvälineiden edessä, että hänelle ei makseta Nesteen hallitustyöstä tarpeeksi!

Ketä Jorma Eloranta oikein katsoo Nesteen hallituksessa edustavansa, jos hän näin avoimesti kritisoi suurimman omistajan arvostelukykyä? Tämän ulostulon perusteella näyttää siltä, että Elorantaa kiinnostaa enemmän oma tilinauha kuin pääomistajan tahto. Tämä on todella huolestuttavaa, koska looginen johtopäätös tästä on se, että Nesteessä ei ole pelkästään vakava governanssiongelma, vaan että ongelma on siinä osassa organisaatiota, jonka tehtävä on nimenomaan governanssiongelmien poistaminen!

Eloranta pitää käytännössä hallitusta yhtenä yrityksen sidosryhmistä. Minulla ei ole tuon taivaallista aavistusta mihin governanssioppeihin tällainen lähtökohta voisi perustua.

maanantai 2. helmikuuta 2015

Voisi olla aika irtaantua todellisuudesta

Sain edellisen tekstin jälkeen aika paljon palautetta, suurkiitos siitä. Argumenttini tuntui kuitenkin kirvoittavan ensisijaisesti tunnereaktioita, ja valitettavasti ainoastaan toissijaisesti perusteltuja vasta-argumentteja. Yhdessä kommentissa todettiin, että "professori on irtaantunut todellisuudesta". No, tuota kuulee aina silloin tällöin.

Tällä kertaa huomio tosin pitää paikkansa.

Talousnobelisti Oliver Williamson [Williamson, 2008, Corporate boards of directors: In principle and in practice. Journal of Law, Economics, & Organization, 24, 247-272] on esittänyt kymmenen tutkimukseen perustuvaa faktaa osakeyhtiöiden hallitusten todellisuudesta. Käyn erityisesti kokeneiden johtajien kanssa executive education -seminaareissa listan läpi. Keskustelujen päätteeksi tyypillisesti toteamme, että lista on ehkä tarpeettoman pessimistinen, mutta pääpiirteissään tarkka kuvaus hallitustyöskentelyn realiteeteista.

1 -- Monissa yrityksissä toimitusjohtaja valitsee käytännössä hallituksen, ei päinvastoin.
2 -- Toimitusjohtaja päättää mitä hallituksissa tehdään.
3 -- Hallituksen jäsenten oma työpaikka on jossain muualla kuin siinä yrityksessä, jonka hallituksessa he istuvat.
4 -- Hallitusten jäsenet ovat erittäin kiireisiä ihmisiä, joilla ei juurikaan ole motivaatiota ja/tai aikaa huolelliseen hallitustyöhön.
5 -- Valtaosa hallituksista toimii ylimmän johdon neuvonantajana.
6 -- Valtaosa hallituksista pyrkii toimimaan jonkinlaisena "yrityksen omatuntona" (engl. corporate conscience).
7 -- Valtaosa hallituksen jäsenistä pyrkii olemaan aktiivisia kriisitilanteissa.
8 -- Jotkut hallitukset osallistuvat tiiviisti yrityksen strategiatyöhön, valtaosa ei.
9 -- Jotkut hallituksen jäsenet kykenevät esittämään kriittisiä kysymyksiä, valtaosa ei.
10 -- Jotkut hallitukset arvioivat toimitusjohtajan suorituskykyä ja voivat halutessaan irtisanoa toimitusjohtajan. Suurimalla osalla hallituksista ei ole tällaista valtaa.

Jos tarkastelemme näiden faktojen valossa ajatusta, että yrityksen hallituksen tehtävä on varmistaa toimiva hallinto, niin tehtävä näyttää käytännössä mahdottomalta. Ratkeaako ongelma sillä, että hallituspalkkiota nostetaan? Jos jollain on esittää tähän uskottava argumentti, niin olen pelkkänä korvana. Aika monissa tutkimukseen perustuvissa argumenteissa korostetaan, että raha ennemminkin luo lisää governanssiongelmia [esim. Gillespie & Zweig, 2010, Money for Nothing: How the Failure of Corporate Boards is Ruining American Business and Costing Us Trillions -- John Gillespie toimi 18 vuotta investointipankkiirina Lehmanilla, Morgan Stanleyssa ja Bear Stearnsissa. Tuossa linkitetyssä YouTube-videossa Gillespie kertoo melko tympeän tarinan Bank of American hallituksen jäsenestä, joka sai potkut kehdattuaan kysyä hallituksen kokouksessa, onko toimitusjohtajan 79 miljoonan dollarin vuosiansio perusteltu, kun yritys irtisanoo samana vuonna 12.600 työntekijää].

Yllä oleva lista ei ole tietenkään läpeensä negatiivinen (pidän itse erityisesti kohdasta 6), mutta kokonaisuutena lista (erityisesti kohdat 1-4 ja 9) kuvastaa minulle todellisuutta, josta toivoisi ainakin osakkeenomistajien irtaantuvan.

perjantai 30. tammikuuta 2015

Yrityksen hallitus ei ole työpaikka

Eilisessä Hesarissa Solidiumin toimitusjohtaja Kari Järvinen valitteli sitä, että suomalaisten yritysten hallituksiin ei löydy tarpeeksi "talenttia". Järvisen mielestä hallituksen jäsenille pitäisi maksaa enemmän, jotta heitä saataisiin houkuteltua hallitukseen.

Järvisen argumentissa on fundamentaali ajatusvirhe.

Yrityksen hallitus ei ole työpaikka vaan ennemminkin luottamustoimi: hallituksen tehtävä on varmistaa, että yrityksen hallinto toimii. Hallitus ei siis ole vastuussa yrityksen strategiasta tai kilpailukyvystä, tämä kuuluu yhtiön ylimmälle johdolle, jolle maksetaan enemmän kuin kohtuullinen korvaus tästä työstä. Hallitukselle tällaiset ruhtinaalliset palkkiot eivät kuulu. Hallituksen jäsenet harvoin tuntevat yrityksen toimialaa ja strategiaa tarpeeksi hyvin. He käyttävät parhaimmillaankin joitain kymmeniä tunteja vuodessa tehtäväänsä, tästä ei saa maksaa muuta kuin kohtuullinen korvaus ajankäytöstä. Harvat hallituksen jäsenet osaavat kysyä hallituksen kokouksissa kriittisiä kysymyksiä (esim. Williamson, 2008, Corporate boards of directors: in principle and in practice, Journal of Law, Economics & Organization, 24, 247-272). Silti monet nostavat hallituspalkkioina summia, joiden suhde tehtyyn työhön on suorastaan kohtuuton. Jos vuosipalkkio jaetaan vuotuisten työtuntien määrällä, niin lopputulos voi hyvinkin olla jo nykykorvauksilla useita satoja, jopa tuhat euroa tunti. Kyllä tuolla tuntitaksalla jo luulisi "talenttia" löytyvän.

McKinseyn vuonna 2011 tekemän tutkimuksen mukaan (vastaajina 1600 hallituksen jäsentä eri yrityksistä) kolmasosalla hallituksen jäsenistä on vain alkeellinen ymmärrys yrityksen riskeistä ja toimialan dynamiikasta. Lienee selvää, että hallitus, jossa kolmasosa on amatöörejä, ei voi olla vastuussa yrityksen strategiasta -- mutta tämähän ei ole tarkoituskaan.

Pitäisikö hallituksen jäsenille maksaa enemmän? Ei missään nimessä. Sellaista henkilöä, joka esittää palkkiovaatimuksia ehtona hallitustyöskentelyyn, ei pidä koskaan nimittää hallitukseen. Tällöin ainoastaan luodaan ylimääräinen toimijuuden ongelma (engl. agency problem). Ironista tässä on se, että yrityksen hallituksen tärkein tehtävä on nimenomaan toimijuuden ongelmien poistaminen, ei niiden luominen.

Toimijuuden ongelma osakeyhtiössä on pähkinänkuoressa tämä: jos yrityksen palveluksessa olevan henkilön (so. "toimijan") ensisijainen motivaatio on oma toimeentulo, on todennäköistä, että hän ei tee osakkeenomistajien näkökulmasta parhaita mahdollisia päätöksiä (so. "ongelma"). Tyypillisesti toimijuuden ongelmasta puhutaan toimitusjohtajan yhteydessä, mutta se pätee yleisemminkin kaikkiin yrityksen työntekijöihin, myös hallitukseen. Hallituksen jäsenten kohdalla kysymys on erityisen tärkeä, koska hallituksen ensisijainen tehtävä on nimenomaan toimijuuden ongelman poistaminen ja toimivan hallinnon varmistaminen. Jos hallituksen jäsen kantaa huolta omasta palkkiostaan, hän on aivan väärässä tehtävässä. Ideaalista olisi, että hallituksen jäsenelle ei makseta muuta kuin kulukorvaukset -- ajatus ei ole ollenkaan niin utopistinen kuin miltä se ehkä kuulostaa.

Esimerkki lienee paikallaan. Applen hallituksessa istuu todella kovan luokan "talenttia", mm. Disneyn toimitusjohtaja Robert Iger ja Genentech-yhtiön entinen toimitusjohtaja Arthur Levinson. Tälle "talentille" maksetaan vuodessa 50.000 dollaria, joka on käytännössä merkityksetön osa heidän vuosituloistaan (Igerin vuosipalkka bonuksineen on noin 30 miljoonaa dollaria). On siis päivänselvää, että Iger ei istu Applen hallituksessa rahan takia. Näin toivoisi olevan kaikissa yrityksissä.

Jotkin Applen hallituksen jäsenet tienaavat suuria summia Applen osakkeilla, mutta tämä on tietysti aivan eri asia. Jos Iger haluaa ostaa miljoonalla dollarilla Applen osakkeita, se on hänen oma asiansa. Governanssin näkökulmasta ainoa relevantti asia on se, että osakekaupat tehdään sisäpiirikauppoja koskevan lainsäädännön puitteissa.

Kysyn governanssi-luennolla MBA-opiskelijoilta, kuinka suuriksi he arvioivat Applen hallituksen jäsenten palkkiot. Usein arviot ovat kertaluokkaa miljoona dollaria.

Hiukan liian usein tulee tunne, että hallituksen ja ylimmän johdon eroa ei ymmärretä. Suomessakin usein käytetään hallitustyöstä nimitystä "johtotehtävä", vaikka se ei sitä ole käytännössä missään merkityksessä. Yritystä johtaa sen johtoryhmä, ei hallitus. Miksi ihmeessä yrityksessä pitäisi olla kaksi johtoryhmää?

Yrityksen omistajat tietysti maksavat hallituksensa jäsenille mitä haluavat, joskin omistajien mahdollisuus vaikuttaa näihin palkkioihin on lopulta sekin valitettavan rajallinen. Joka tapauksessa Järvisen esittämät yleisen tason ehdotukset nostaa hallitusten jäsenten palkkioita "talentin" houkuttelemiseksi ovat jokseenkin käsittämättömiä. Jos yrityksellä on vaikeuksia saada hallituksiinsa osaajia, niin rahalla houkuttelu on typerin mahdollinen ratkaisu. Minä ainakin olisin osakkeenomistajana erittäin huolissani, jos yrityksen hallituksessa istuvien henkilöiden ensisijainen motivaatio olisi raha.

Logiikka on sama kuin siinä, että toivon poliisien, palomiesten, opettajien ja poliitikkojen tekevän työtään ensisijaisesti jonkun muun kuin rahan motivoimana.

tiistai 29. huhtikuuta 2014

Jokainen tutkija on muita fiksumpi


Tiede on objektiivista, kriittistä, autonomista ja itseään korjaavaa – tieteen normatiiviset kriteerit löytyvät kaikista tieteenfilosofian perusteoksista.

Eikö ole kuitenkin kohtuullista esittää, että normatiiviset kriteerit ovat relevantteja ainoastaan, jos ne pystytään osoittamaan olennaiseksi osaksi tieteen ruohonjuuritason käytäntöjä? Jos kriteerit ovat ainoastaan ihanteita, eikö olisi hyödyllisempää keskittyä tarkastelemaan tiedettä sen käytäntöjen valossa? Eikö tieteen määritä se, miten tiedeyhteisöissä toimitaan? Käytännöissähän se tieteellinen tieto ja ymmärrys meitä askarruttavista ilmiöistä syntyy eikä tieteenfilosofian oppikirjoissa. Aivan samalla lailla esimerkiksi demokratian tai kapitalistisen talousjärjestelmän ymmärrys jää alkeelliseksi, jos se perustuu ainoastaan valtiotieteiden ja taloustieteiden kirjallisuudessa esitettyihin ihanteisiin. Vastaus kysymykseen Onko Yhdysvallat demokratia? ei löydy Yhdysvaltain itsenäisyysjulistuksesta tai perustuslaista.

Filosofi Paul Feyerabend on myös osuvasti esittänyt, että sikäli kuin halutaan esittää tiede erilaisena kuin muut inhimillisen toiminnan muodot, olisi myös paikallaan muotoilla kriteerejä, jotka ovat erityisesti tieteelle ominaisia. Tieteen normatiiviset kriteerit ovat siinä mielessä harhaanjohtavia, että on lukuisia inhimillisen toiminnan muotoja, jossa pyritään esimerkiksi kriittisyyteen ja virheiden korjaamiseen; talon remontointi ja pianonsoitto sopivat esimerkeiksi.

Tieteen normatiiviset kriteerit ovat piinallisen etäällä tieteen käytännöistä. Tämä on kiistaton fakta, ja aiheuttaa valtavasti sekaannuksia ja väärinymmärryksiä. Esimerkiksi ajatus tieteestä itseään korjaavana synnyttää mielleyhtymän tieteestä sinnikkäästi ja lahjomattomasti omia periaatteitaan toteuttavana toimijana. Lienee kuitenkin itsestään selvää, että toimijoita ovat tutkijat, ei tiede. Kuinka moni tutkija harjoittaa tieteen ihanteiden mukaista ”itsensä korjaamista”, siis myöntää tekevänsä virheitä ja olevansa väärässä? Tieteen kuvailu itseään korjaavavaksi on perusteltua ainoastaan, jos oma-aloitteinen virheiden myöntäminen ja autenttinen itsekriittisyys on tiedeyhteisöissä yleinen käytäntö.

Ainakaan minulle ei tule tutkijanuraltani mieleen yhtään esimerkkiä tiedeyhteisön jäsenestä, joka olisi tieteellisessä käsikirjoituksessa tai konferenssiesitelmässä myöntänyt tekevänsä virheitä tai olisi avoimesti kritisoinut oman tutkimusryhmänsä työtä. Käytännössä kriittisyys tieteessä näyttää siis tarkoittavan ensisijaisesti muiden tekemän tutkimuksen kritisointia. Uskallan väittää, että tämä ei ole oman tutkimusalani erityispiirre.

Mikä mahtaa olla tällaisen oman työn suosimisen metodologinen perustelu? Onko jokainen meistä muita fiksumpi?

Yritykset pelastaa tieteellinen idealismi tieteen käytännöissä johtavat varsin kiusallisiin jatkokysymyksiin.

maanantai 6. toukokuuta 2013

Vain heikoimmat selviytyvät

Yhteiskuntatieteilijöiden keskuudessa esitetään usein argumentteja siitä, kuinka erilaiset biologiseen evoluutioon perustuvat teoriat, mallit ja yleensäkin ”evoluutioajattelu” eivät sovi yhteiskuntatieteisiin. Kyseessä on tavallisimmin joko tutkimuspoliittinen kannanotto tai silkka tunnereaktio, koska argumentteja ei juurikaan sen yksityiskohtaisemmin perustella.

Valitettavasti argumentissa ympätään yhteen kaksi eri asiaa: biologia ja evoluutio. Evoluutio ei ole biologien yksityisomaisuutta: toimialat muuttuvat, yhteiskunnat kehittyvät, autojen polttomoottoritekniikka edistyy, kieleen tulee uusia sanoja ja käsitteitä, ja niin edelleen. Muutosta tapahtuu kaikkialla. Kutsutaanko tätä sitten evoluutioksi, on eri asia. Sana evoluutio on lopulta erittäin huono käännös englanninkieliselle sanalle evolution.

Evoluutioajattelun soveltamisessa on kuitenkin yksi huolestuttava piirre: valitettavan yleinen retorinen strategia, jossa argumentteja esitetään ensisijaisesti biologiseen analogiaan vetoamalla -- kutsuttakoon tätä (taloustieteen kontekstissa) vaikkapa ”taloustieteen darwinismiksi”: esimerkiksi kilpailu on hyvästä, koska se erottelee tehokkaat yritykset tehottomista. Mitä vähemmän sääntelyä, sen parempi. Vain vahvimmat selviytyvät; tämä on talouden luonnonlaki, ja se on lopulta kaikille hyväksi. Huomautettakoon tosin, että biologisessa evoluutiossa hyvän ja huonon käsitteet eivät ole olennaisia, joten en ole ihan varma, mihin tuo ”yhteisen hyvän” johtopäätös lopulta perustuu; ilmeisesti jonkinlaiseen ylimalkaiseen ajatukseen siitä, että ”taloudellinen tehokkuus on nyt vaan hyvä asia”.

Argumentti on kaikessa ylimalkaisuudessaan päällisin puolin koherentti ja saa varmasti aikaan huomattavan määrän positiivisia tunnereaktioita. Kaikki on hyvin siihen asti, kunnes asiaa tarkastellaan tutkimusaineistojen valossa:

1 -- tehokas ja elinkelpoinen ovat aivan eri asioita.
2 -- suuret yritykset ovat keskimäärin elinkelpoisempia, mutta niiden taloudellinen tehokkuus on usein pieniä alhaisempaa.
3 -- lopputulema voi hyvinkin olla se, että ”heikommat” selviytyvät: riittää että on elinkelpoinen eli joko tarpeeksi suuri tai jotenkin muulla tavalla legitiimi. Taloudellinen tehokkuus on toisarvoista.

Teemaa on tutkittu vuosikymmeniä. Mm. William Barnett (1997, ”The dynamics of competitive intensity”, Administrative Science Quarterly) tarkasteli pennsylvanialaisia puhelinyhtiöitä ja amerikkalaista panimoteollisuutta ja löysi empiiristä evidenssiä hypoteesille, jonka mukaan ”heikommat selviytyvät” (ns. weak survivor hypothesis).

Barnettin tutkimuksesta ei löydy ensimmäistäkään viittausta Darwiniin eikä esimerkiksi sanaa biologia kertaakaan. Organisaatioekologin ei siis tarvitse nojata argumenteissaan biologiaan; monet organisaatioekologian pioneerit ovat sitä mieltä, että näin ei saakaan tehdä. Monia organisaatioekologian kriittisiä arvioita lukiessa tulee sellainen olo, että tätä ei ole alkuunkaan ymmärretty. Maineikkaassa American Sociological Review -lehdessä vuonna 1988 julkaistussa arviossa kritisoitiin sitä, että organisaatioekologian teorioiden yhteys biologiseen malliin ei ole tarpeeksi vahva.

Barnett osoittaa myös, että hokema ”only the strongest survive” kaatuu lopulta omaan mahdottomuuteensa: mitä kauemmin yritys ”selviytyy”, sitä todennäköisemmin sen tehokkuus alkaa laskea.

Taloustieteen darwinismin ongelma on myös se, että argumenteissa menevät usein faktat ja hyveet sekaisin: erityisesti kun kyseessä on taloudellinen toiminta, niin ”selviytymisessä” (määriteltäköön tämä vaikka konkurssin välttämiseksi) ei ole sinänsä mitään ”hyvää”. Yksi osoitus tästä on talouskriisin yhteydessä yleistynyt (ja paljon kritisoitu) ajatus, että suuria yrityksiä ”ei saa päästää konkurssiin” (they are ”too big to fail”).

Brittiläistä monitieteilijää ja filosofia Herbert Spenceriä pidetään usein ”sosiaalisen darwinismin” oppi-isänä. Maine on siinä mielessä valitettava, että Spencer korosti esimerkiksi keskeisessä teoksessaan First Principles ensisijaisesti empiiristä kurinalaisuutta: sikäli kuin argumentteja muutoksesta tai kehityksestä (”evoluutiosta”) halutaan esittää, nämä täytyy osoittaa empiirisesti. Spencerin hengessä: esitettiin argumentteja muutoksesta missä kontekstissa hyvänsä, argumentti ei saa perustua ”ikään kuin -päättelyyn”, jossa keskeistä on biologiseen analogiaan vetoaminen.

Erityisen huolellinen täytyy olla argumenteissa, jossa muutos halutaan esittää kehityksenä.

torstai 21. helmikuuta 2013

Kauppatieteilijä ei ole kapitalistin käsikassara


Hesarissa oli tänään iso juttu kauppatieteilijästä, “joka päätyi vastustamaan kulutuskulttuuria”.

Dekonstruoidaanpa ajatus, että kauppatieteilijän päätyminen vastustamaan kulutuskulttuuria on uutinen.

Ei voi oikein päätyä muuhun kuin siihen, että ilmeisesti me kauppatieteilijät -- ja yleisemmin liiketaloustieteilijät -- oletusarvoisesti kannatamme joitain erityisiä taloudellisen toiminnan muotoja, vaikkapa nyt sitten kulutuskulttuuria (mitä se ikinä tarkoittaakin). Hesarin uutisen kauppatieteilijä oli päätynyt degrowth-aatteen kannattajaksi (mitä se ikinä tarkoittaakin). Olenko minä liiketaloustieteilijänä oletusarvoisesti jonkun puolella (ja siis ilmeisesti jotain muuta vastaan)?

Totta kai olen.

---

Sana tiede ammattinimikkeessäni velvoittaa minua pyrkimään puolueettomuuteen, perusteltuihin argumentteihin ja empiiriseen kurinalaisuuteen. Siispä vastustan esimerkiksi älyllistä epärehellisyyttä, toiveajattelua, kohtuuttomia yleistyksiä ja mielipiteiden esittämistä faktoina.

Sana liiketalous vastaavasti ei suoranaisesti velvoita yhtään mihinkään, se kuvaa lähinnä kontekstia, jossa teen tutkimustani. Vähän kuin hammaslääkäri: lääkäriys velvoittaa, hammas kertoo kontekstin.

Se, että tutkin voittoa tavoittelevaa toimintaa, velvoittaa tietysti ottamaan liiketoiminnan yleiset lähtökohdat ja realiteetit huomioon, mutta jos joku luulee, että teen tutkimustani yritysjohdon toimeksiannosta ja että ensisijaisesti yritän auttaa yrityksiä menestymään, niin tämä käsitys todettakoon samantien täysin virheelliseksi. Teen toki tutkimusta yhteistyössä johtajien kanssa, mutta yhteinen ymmärrys ja lähtökohta on aina se, että en ole millään muotoa “heidän asiallaan”. Silloin tällöin tosin löytyy kysymys, josta molemmat ovat kiinnostuneita.

Kuulostaa ehkä oudolta tekstiltä, kun kirjoittaja on liiketaloustieteilijä, jonka työnantaja IE Business School on yrittäjien perustama ja pyörittämä yksityinen kauppakorkeakoulu. Ilmiantoa pohtiville tiedoksi: yllä olevat mielipiteet eivät ole kerettiläisyyttä, vaan täysin linjassa IE:n tutkimuspolitiikan kanssa. Työsopimukseni käytännössä velvoittaa minua tekemään tutkimusta yllä kuvailemistani lähtökohdista. Jos lähtisin ajamaan tutkimuksessani yritysjohdon intressejä, saisin vuoden sisällä huomautuksen, potkut viimeistään parin vuoden kuluttua.

---

Onko esimerkiksi yrityksen kasvua tutkiva liiketaloustieteilijä automaattisesti ”yrityksen kasvun asialla”? Onko kasvu hänestä tavoittelemisen arvoinen asia?

Kysymys on mielenkiintoinen, sillä yritysten kasvukirjallisuuden suuria nimiä käytetään usein keppihevosena, kun lobataan kasvun puolesta. Paras esimerkki suuresta nimestä on ilman muuta edesmennyt brittiläinen taloustieteilijä Edith Penrose, jonka pääteosta The Theory of the Growth of the Firm siteerataan kasvukirjallisuuden jonkinlaisena raamattuna. Penrosen teos on siinä mielessä tyypillinen, että sitä siteeraavat ovat harvemmin lukeneet sitä -- ainakaan ajatuksella. Samaan often-cited-seldom-read -kategoriaan kuuluvat monet taloustieteen klassikot, listan kärjessä Adam Smith, jota siteeraavat eivät selvästikään ole lukeneet Wealth of Nations -teoksesta enempää kuin muutaman sivun, saati sitten että olisivat tutustuneet Smithin moraalifilosofiaan. Nimen Milton Friedman kuuleminen saa monet välittömästi raivon valtaan, joskin olisin yllättynyt jos hermostuja on koskaan edes avannut Friedmanin pääteosta Capitalism and Freedom, jossa on paljon muutakin kuin tekstiä siitä, millaisiin ongelmiin ja suoranaisiin dilemmoihin yrityksen yhteiskuntavastuun käsite käytännön sovelluksissa johtaa. Sikäli kuin haluaa esittää kritiikkia, täytyy ensin ymmärtää syy, miksi Friedman pitää yritysten yhteiskuntavastuuta suorastaan ylitsepääsemättömän ongelmallisena ajatuksena. Friedmania lukiessa auttaa myös, jos tietää jotain historiallisesta kontekstista, jossa teos on kirjoitettu (liikkeelle voi lähteä esim. googlaamalla Presidentti Kennedyn State of the Union -puheen vuodelta 1962).

Sivuraiteelta takaisin Penroseen. Penrose ei ollut missään uransa vaiheessa yritysten kasvun puolestapuhuja, hän ainoastaan halusi ymmärtää miten yritykset kasvavat ja mikä rajoittaa tätä kasvua. Koska hän tutki yritysten kasvua, hän toki teoreettisesti ja empiirisesti kurinalaisena tutkijana oletti, että yritykset pyrkivät tekemään voittoa (profit motive).

Mutta oliko Penroselle voiton maksimointi mielekäs päämäärä? Jos lukee Penrosea siteeraavaa tutkimusta, niin saa helposti tällaisen kuvan. Mutta jos taas lukee Penrosen alkuperäistä tekstiä (erityisesti pääteoksen lukua The Firm in Theory), niin huomaa, että Penrose näki kasvun ja kannattavuuden välillä perustavanlaatuisen jännitteen. Jos nimittäin voiton maksimoinnilla tarkoitetaan omistajien sijoitusten tuoton maksimointia, niin se on suorastaan ristiriidassa kasvun tavoittelemisen kanssa. Tämän jännitteen ymmärtäminen toisi suomalaiseen kasvukeskusteluun aimo annoksen realismia ja empiiristä kurinalaisuutta. Toinen asia, minkä voisimme Penroselta oppia on se, että yrityksen kasvussa ei tyypillisesti ole kyse tahdosta vaan mahdollisuuksista: valtaosa firmoista ei pysty kasvamaan, oli tahtoa sitten kuinka paljon tahansa.

perjantai 15. helmikuuta 2013

Kansantajuistaminen on armotonta yksinkertaistamista

Kirjoitin aikaisemmassa tekstissä siitä, kuinka vaikeana pidän tieteellisen tutkimuksen niin sanottua ”kansantajuistamista”. Netti-Hesarissa oli tällä viikolla uutinen, jonka mukaan alkoholistien masennus johtuu juomisesta. Uutinen on loistava esimerkki siitä, mihin nämä kansantajuistamisyritykset pahimmillaan johtavat.

Tartuin juuri kyseiseen uutiseen sen takia, että olen yhteistyössä mielialahäiriöiden tutkijoiden ja kliinisten psykiatrien kanssa pohtinut jo kahdeksan vuoden ajan erilaisten aineistojen ja tilastollisten analyysien valossa, miten tähän (ja laajemmin tämäntyyppiseen) kausaalisuuteen voisi päästä käsiksi. Haaste on melkoinen. Nähdessäni Hesarin otsikon etsin tietysti samantien käsiini uutisessa siteeratun tutkimuksen, joka julkaistiin uusimmassa Journal of Studies on Alcohol and Drugs -aikakauslehdessä.

Kausaalisuudesta ei ole itse tutkimuksessa tehty minkäänlaista empiiristä johtopäätöstä. Syy oli varsin tuttu (suora lainaus itse tutkimuksesta):

”[T]he data on depression, as only one component of a larger study, were primarily descriptive, and the use of 5-year epochs of follow-up makes it difficult to disentangle cause and effect when both heavy drinking and depressive episodes occur in the same 5-year period.”

Masennus ja alkoholismi kulkevat yksilötasolla ajassa niin sanotusti komorbideina, jolloin syyn ja seurauksen erottelu toisistaan on käytännössä mahdotonta, varsinkin kun aikaa on analysoitu kyseisessä tutkimuksessa hyvin karkeasti viiden vuoden klöntteinä. Itse asiassa komorbiditeetin kohdalla on oikeastaan harhaanjohtavaa puhua siitä, että yksi tekijä aiheuttaa toisen: jos jonkinlaista kausaalisuutta esiintyy, niin se on ennemminkin sitä, että molemmat vaikuttavat samanaikaisesti toisiinsa, ovat siis vastavuoroisesti kausaalisia (reciprocal causation). Vastavuoroisessa kausaalisuudessa ei ole olennaista, mielekästä eikä edes mahdollista tarkastella empiirisesti sitä, kummasta tekijästä kausaalisuus on alunperin lähtenyt liikkeelle. Tilastollisten mallien kaikki muuttujat ovat endogeenisia.

Komorbiditeetti ilmiönä aiheuttaa sekä tutkijoille että kliinisille psykiatreille melkoisesti päänvaivaa -- mielialahäiriöistä kärsivistä nyt puhumattakaan.

On toisaalta ymmärrettävää, että tiedetoimittaja ei kirjoita uutisessa komorbiditeetista, vastavuoroisesta kausaalisuudesta tai endogeenisuudesta. Samalla on kuitenkin pidettävä mielessä, että jos halutaan rehellisesti kuvailla sitä, mitä on tutkittu ja mitä on osoitettu, niin yksinkertaistaminen on aina harhaanjohtavaa. Masennuksen ja päihdeongelmien välinen suhde on kaikkea muuta kuin yksinkertainen.

Tällä kertaa mennään valitettavasti pahasti metsään, sillä Hesarin tiedetoimittaja kirjoitti uutisessa:

”Suurimalla osalla masennusjaksot tulivat vain rankan juomisputken aikana. Tämä viittaa siihen, että juominen oli masennuksen syy.”

Itse tutkijat ovat kuitenkin esittäneet ensimmäisen virkkeen juurikin selitykseksi sille, miksi kausaalisen johtopäätöksen tekeminen ei ole mahdollista. Jotta tämän voi ymmärtää, täytyy ymmärtää

[1] komorbiditeetin käsite,
[2] vastavuoroisen kausaalisuuden käsite,
[3] tilastollinen endogeenisuuden ongelma ja
[4] ei-kokeellisten aineistojen rajallisuus.

Lisäksi on ymmärrettävä, että tutkijoiden huomio difficult to disentangle tarkoittaa tieteellisessä retoriikassa sitä, että tutkijat eivät katso aiheelliseksi esittää aineiston perusteella kausaalista johtopäätöstä: sana difficult ei siis tarkoita tässä yhteydessä vaikeaa mutta mahdollista vaan vaikeaa ja siis mahdotonta. Tieteellisiä tekstejä täytyy lukea aina huolella. Lisäksi on pystyttävä erottelemaan empiiriset johtopäätökset yleisemmän tason huomioista.

Keskeisin tutkimuksen empiirinen johtopäätös oli se, että alkoholistien masennus on erilaista kuin muiden masentuneiden. Tällä perusteltiin sitä, että masentuneita alkoholisteja täytyy myös hoitaa eri lailla kuin muita. Jutussa ei esitetä, että hoidon lähtökohdaksi tulisi ottaa ajatus, että alkoholistin masennus johtuu nimenomaan juomisesta.

Tämä esimerkki kertoo hyvin siitä, miten tieteellisen tutkimuksen popularisointi on lähes vääjäämättä armotonta yksinkertaistamista -- jopa niin armotonta, että mustasta saattaa tulla valkoista.

Olen melko varma, että uutisen luettuaan ainakin osa Hesarin lukijoista uskoo, että kausaalisuus masennuksen ja alkoholismin välillä on nyt tieteellisesti osoitettu ja vieläpä niin, että alkoholistin masennus nimenomaan johtuu juomisesta. Yleisellä tasolla saattaa vastaavasti jäädä mieleen ajatus, että mielialahäiriöissä kausaalisuus on jotenkin yksiselitteisesti empiirisesti todennettavissa. Itse en ole analysoinut vielä ensimmäistäkään tilastollista aineistoa, jossa tämä olisi osoittautunut lähimainkaan mahdolliseksi -- siitäkin huolimatta, että Suomessa kerätyt seuranta-aineistot ovat varsin korkealuokkaisia.

Kuten niin monet muutkin kansantajuistamisyritykset, tämäkin uutinen luo yksinkertaistetun mielikuvan, jonka yhteys itse tutkimukseen on lähes olematon.

---

P.S.

Siltä varalta, että lukija pitää esimerkkiäni tarkoitushakuisesti poimittuna yksittäistapauksena: Brechman et al. (2009) tarkastelivat empiirisesti genetiikan tutkimustulosten uutisointia ja havaitsivat muiden muassa, että

1 - lähes 70 prosentissa tapauksista tutkimustulos oli uutisoitu yksinkertaistaen, jonkinlaisen biologisen determinismin lähtökohdista: geenit nimenomaan aiheuttavat milloin mitäkin.

2 - kahdesta aivan samaa tieteellistä tutkimustulosta käsittelevästä uutisesta löytyi uutisia toisiinsa verrattaessa epäyhtenäisyyksiä (inconsistencies) 40 prosentissa tapauksista. Mikä mahtaa olla satunnaisen lukijan kyky harjoittaa lähdekritiikkiä ja valita kaikista uutisista juuri se ”oikea”?

lauantai 2. helmikuuta 2013

Terveen järjen käytöstä pitäisi luopua

Duncan J. Watts argumentoi provosoivasti mutta vakuuttavasti teoksessaan Everything is Obvious, että kun kyse on monimutkaisista asioista, niin päätöksenteossa täytyisi ennemminkin vähentää ”terveen järjen” (engl. common sense) käyttöä kuin lisätä sitä.

Ajatus terveen järjen käyttämisestä kuulostaa toki hienolta, mutta valitettavasti monissa käytännön tilanteissa terveestä järjestä ei löydy sen enempää järkeä kuin mitään tervettäkään; sillä lähinnä luodaan ja ylläpidetään harhakuvitelmaa, että monimutkainen asia on periaatteessa kenen tahansa ymmärrettävissä ja monimutkainen ongelma kenen tahansa ratkaistavissa.

Olen ollut useasti tilanteessa, jossa tokaisun ”käytetääs nyt ihan tervettä järkeä tässä” jälkeen keskustelun taso laskee huomattavasti. Olen myös havainnut, että erityisesti tilastojen tulkinnassa terve järki täytyy korvata analyyttisella otteella. Alla esimerkki, joka minusta hyvin havainnollistaa väitettä.

---

Mieleen palautuu parikymmentä vuotta sitten USA:ssa lukemani ja tilastollisen analyysin luennollakin esimerkkinä käyttämäni uutinen, jonka mukaan katumaastureilla tapahtuneissa kuolemaan johtaneissa liikenneonnettomuuksissa 62%:ssa tapauksista katumaasturi oli pyörähtänyt (katon kautta) ympäri. Uutisen tarkoitus oli selvästi saada lukija uskomaan, että katumaasturit ovat vaarallisia, koska ne lentävät ulosajossa katon kautta ympäri ja tappavat ihmisiä; syynä on katumaasturin normaalia henkilöautoa korkeammalla oleva painopiste. Tavallisilla henkilöautoilla vastaava prosenttiosuus on huomattavasti alhaisempi, joidenkin arvioiden mukaan noin 20% luokkaa.

Katumaasturionnettomuuksiin erikoistuneen amerikkalaisen lakifirman mukaan katumaasturit ovat ”vaarallisia ja onnettomuusalttiita”. Lakifirma kehottaa katumaasturionnettomuudessa kuolleen omaisia ottamaan yhteyttä.

Kenelle tuo 62% on tärkeä luku? Pitäisikö katumaasturin ratissa istuvan olla huolissaan? Tuohan on hyvänen aika yli puolet, suurin osa! Mitä sanoo terve järki?

---

En väitä etteikö katumaasturin korkeammalla oleva painopiste saata aiheuttaa ongelmia, mutta sen väitän, että tuon 62% voi unohtaa saman tien -- luku kun ei koske eläviä vaan jo kuolleita. Jos luet tätä tekstiä, et ole sen tilastollisen perusjoukon jäsen, jota tuo prosenttiluku koskee. Ja kuolleille vastaavasti millään todennäköisyyksillä ei ole enää merkitystä. Vähän sama kuin se, että lotossa voittamisen todennäköisyydellä ei ole enää merkitystä sen jälkeen, kun on voittanut jättipotin; tyttölapsen syntymisen noin 50 prosentin todennäköisyydellä ei ole merkitystä sen jälkeen kun tyttö on syntynyt; luetteloa voisi jatkaa loputtomiin.

Täytyy siis laskea todennäköisyyksiä, joilla on merkitystä elävien kirjoissa oleville katumaasturikuskeille:

1. Todennäköisyys, että katumaasturi pyörähtää kolarissa tai ulosajossa ympäri.
2. Todennäköisyys, että katumaasturin ympäri pyörähdettyä joku autossa matkustavista kuolee.

Sanoi terve järki mitä tahansa, fakta on tämä: tuolla 62%:lla ei ole mitään tekemistä näiden kahden todennäköisyyden kanssa. Todennäköisyyksistä ensimmäinen on joidenkin tilastojen mukaan jossain 1% ja 10% välillä ja jälkimmäinen noin 4%. Nämä molemmat todennäköisyydet riippuvat tietysti ratkaisevasti tilannekohtaisista tekijöistä, joten niitä ei oikeastaan pitäisi edes tulkita todennäköisyyksinä vaan ainoastaan prosenttiosuuksina. Joka tapauksessa, jos todennäköisyyksiä halutaan laskea, niin todennäköisyys sille, että katumaasturisi pyörähtää ulosajossa ympäri ja joku kuolee on siis jossain 0,05x0,04=0,002 eli 0,2% paikkeilla. Ei tämä tarkka luku tietenkään ole, mutta kertaluokka on varmasti kohdallaan. Oleellisin on huomio, että luku on jotain aivan muuta kuin 62%.

Tietysti pienikin todennäköisyys näkyy loppujen lopuksi tilastoissa suurina lukuina, jos tarkastellaan tarpeeksi suurta ryhmää. Yksi tilastoilla pelottelun perusstrategia onkin tulosten raportointi suhteuttamatta lukuja ryhmään, josta ne on laskettu. USA:ssa kuolee vuosittain tilastojen mukaan Asikkalan kunnan väkiluvun verran eli noin 9000 henkeä onnettomuuksissa, joissa katumaasturi on pyörähtänyt ympäri. Luvun saa kuulostamaan pelottavalta, kunhan vaan jättää jakolaskun tekemättä ja ”unohtaa” mainita, että USA:n väkiluku on 40000-kertainen Asikkalaan verrattuna, ja tuo 9000 on kolme henkeä per sata tuhatta asukasta, siis 0,27 henkeä per Asikkalan kokoinen kunta; Asikkalan kokoisessa kunnassa siis noin yksi kuolema neljässä vuodessa. Ei tuo nyt ihan hirveän huolestuttavalta enää kuulosta.

Ja kuinka monessa tapauksista kuoleman aiheutti juuri auton ympäripyörähtäminen, sitä voimme vain arvailla. Sekä auton ympäripyörähtämisen että kuoleman voi olla aiheuttanut kolmas tekijä, esimerkiksi kova ylinopeus. Kyllä jonkun täytyy mennä todella pahasti pieleen ennenkuin auto -- mikä tahansa auto -- pyörii katon kautta ympäri. Tästä syystä yllä olevassa kohdassa (2) ei ole esitetty minkäänlaista kausaalisuuden ajatusta (”ympäripyörähdys aiheuttaa kuoleman”). Tämän kausaalisuuden osoittaminen empiirisesti onnettomuustilastoista lienee todella vaikeaa: olisiko ulosajo johtanut kuolemaan, jos auto ei olisi pyörähtänyt ympäri? Ja sikäli kuin haluamme osoittaa, että ongelma on katumaasturin korkeammalla oleva painopiste: olisiko tavallinen henkilöauto pyörähtänyt vastaavassa tilanteessa ympäri vai ei? Tällaista ns. counterfactual-analyysia on hyvin vaikea tehdä muuten kuin erilaisilla ajatusharjoituksilla; empiirisesti sitä on käytännössä mahdotonta tehdä.

---

Wattsin kirjan Everything Is Obvious alaotsikko on Once You Know the Answer. Uskoisin, että terveen järjen nimeen vannova on tässä vaiheessa lukenut tuon 62%:n oikean tulkinnan ”terveen järjen” meriitiksi (olettaen tietysti, että pitää ylläolevaa argumenttiani uskottavana, siis ”oikeana”). Se, että tulkintaan ei päädytty terveellä järjellä vaan ehdollisia todennäköisyyksiä ja empiirisiä tendenssejä analysoimalla, tuppaa unohtumaan aika nopeasti.

Valtaosa keuhkosyöpää sairastavista -- noin 90% -- on tupakoitsijoita. Miten tulkitset tätä lukua? Onko se samalla tavalla (samasta syystä) ongelmallinen kuin tuo katumaasturiesimerkin 62%? Mitä sanoo terve järki: pitääkö tupakoitsijan olla huolissaan juuri tuosta luvusta, vai ehkä jostain muusta?

Jos alat heittää kolikkoa, niin kumpi kolmen sarja tulee todennäköisemmin ensin: kruuna-klaava-klaava vai kruuna-klaava-kruuna? Mitä sanoo terve järki? Yhtä todennäköisiä? Pieleen meni, kruuna-klaava-klaava tulee todennäköisemmin ensin. Ja tämä ei ole pelkästään keksimällä keksitty mikkihiiri-esimerkki. Korvataanpa kruunat ja klaavat kirjaimilla A, T, C ja G ja laitetaan niitä kolmen kirjaimen jonoihin: syntyy aminohappojen geneettistä koodia.

Yleisempänä johtopäätöksenä voisin esittää, että tilastoja lukiessa on aina tärkeää yrittää ymmärtää, mitä tarkoitusta varten tilasto on tehty. Hyvin harvoilla tilastoilla pyritään antamaan yksittäisille henkilöille olennaista tietoa. Ehdolliset todennäköisyydet tekevät myös monen sorttisia kognitiivisia kepposia: ”A ehdolla B” ja ”B ehdolla A” menevät helposti sekaisin.

Piintyneen hokeman ”numerot puhuvat itse puolestaan” voisi vastaavasti viimeinkin heittää romukoppaan (joskin todennäköisyys, että tämä jää ainoastaan toiveeksi lienee varsin korkea). Tilastot ovat aina jonkin tiedonintressin tuottamia ja jokaikinen numero tämän tiedonintressin heijastuma. Tilastojen luojan vastuulla on aina tulosten selvä tulkinta siinä kontekstissa ja tarkoituksessa, jossa tilasto on luotu. Valitettavasti tulkinta varsin usein ja täysin vastuuntunnottomasti ”ulkoistetaan” lukijalle: kerrotaan esimerkiksi, että suomalaiset ovat Venäjänvastaisia ilman että juuri mitenkään valotetaan sitä, mitä on kysytty, keneltä ja miksi.

Symmetrisesti vastuu on kuitenkin myös lukijalla: jos ei ymmärrä mitä tarkoitusta varten jokin tilasto on luotu, niin kyseistä tilastoa ei ole perusteltua käyttää keppihevosena omassa argumentissa.

Tilastoja on vaikea ymmärtää, jos niitä yrittää tulkita terveellä järjellä: niitä täytyy aina lähestyä analyyttisesti ja kontekstoiden, ei intuitiivisesti eikä yleistäen. Ja mitä enemmän ihmiset luottavat terveeseen järkeen, sitä helpompaa tilastoilla harhauttaminen ja pelottelu myös on. Analyyttisesti ja kontekstoiden tilastoja lähestyvää on paljon vaikeampi harhauttaa.

Esimerkiksi koti- ja autovakuutuksia kauppaavien vakuutusyhtiöiden on nykyään täysin mahdotonta jymäyttää minua laskemaan vakuutusteni omavastuuosuutta. 20 vuotta sitten se onnistui vielä varsin helposti.

tiistai 15. tammikuuta 2013

Onko tieteen "kansantajuistaminen" mahdollista?

Kuka osaa puhua tieteestä tai taloudesta ”kansantajuisesti”? Pakko tunnustaa, että en minä ainakaan.

Tunnen ammattini puolesta talousnobelisti Oliver Williamsonin työtä melko hyvin; tohtoriseminaareissani on vuodesta 2004 asti käsitelty hänen teorioitaan ja kirjallista tuotantoaan. Tässä tuotannossa on paljon vieraalta kuulostavia käsitteitä: asset specificity, small numbers bargaining, fundamental transformation, discriminating alignment, selective intervention (luetteloa jatkuu vielä noin 10-15 termin verran). Kaikki nämä ovat Williamsonin argumenteissa keskeisiä. Keskeistä ovat myös näiden käsitteiden monimutkaiset keskinäiset yhteydet. Seminaareihin osallistujat ovat vuosi toisensa jälkeen todenneet, että he eivät ole koskaan joutuneet lukemaan lähimainkaan yhtä vaikeaselkoista tekstiä. En oikein osaa antaa heille muuta ohjetta kuin sen, mikä aikanaan toimi omalla kohdallani, kun Williamsonin tuotantoon tutustuin: lukekaa uudestaan, ja uudestaan, ja uudestaan, ja jos ei tunnu että aukeaa, niin lukekaa jotain muuta ja palatkaa sitten Williamsonin teksteihin. Arvaan, että tätä ohjetta noudattaa maksimissaan ehkä yksi kymmenestä.

Tässä tyypillinen katkelma Williamsonin tekstiä (2004, essee: Transaction Costs Economics and Organization Theory):

“If all feasible forms of organization are flawed (Coase 1964), then references to benign government, costless regulation, omniscient courts, and the like are operationally irrelevant. That does not deny that hypothetical ideals can be useful as a reference standard, but standards are often arbitrary. Is unbounded rationality the relevant standard? How about perfect stewardship, in which event opportunism vanishes?”

Tuo ei ole mikä tahansa katkelma, vaan transaktiokustannusteorian keskeistä motivointia. Ei, en aio edes yrittää kansantajuistaa tuota tekstiä; ammattitaitoni riittää juuri ja juuri siihen, että saan sen neljän tunnin tohtoriseminaarissa tohtoriopiskelijalle ymmärrettäväksi. Ja tämäkin edellyttää sitä, että seminaariin osallistujat ovat käyttäneet ennen seminaaria vähintäänkin toiset neljä tuntia perehtyäkseen Williamsonin teksteihin etukäteen.

Williamsonin työn kansantajuistaminen suomalaisille vaatisi tietysti myös sen, että tekstejä ja avainkäsitteitä käännettäisiin suomen kielelle. Omien kykyjeni raja tulee vastaan jo ensimmäisen käsitteen -- asset specificity -- käännöksen kohdalla (tämä on Williamsonin teorian keskeisin käsite). Keksin kyllä heti montakin esimerkkiä, mutta käsitteen sisällölle oikeutta tekevää käännöstä en saa aikaiseksi millään.

Kaikilla niillä tieteenaloilla, joita tunnen, on olemassa enemmän tai vähemmän poikkeuksetta sovellettava sääntö: älä esitä argumentissa koskaan uusia käsitteitä, ellei se ole välttämätöntä. Otan siis yhden tämän kirjoituksen premissiksi sen, että Williamsonin teorian käsitteet ovat välttämättömiä.

Toinen periaate on se, että argumenteissa on aina vältettävä esittämästä yhtään sen enempää olettamuksia, teoreemoja ja hypoteeseja kuin mitä argumentin kannalta on tarpeellista. Tästä seuraa toinen premissi: argumentti ei ole monimutkainen sen takia, että sen esittäjä haluaa kiusata yleisöään tai väsäillä monimutkaisia teorioita, vaan sen takia, että argumentti käsittelee monimutkaista teemaa. Yksinkertainen vastaus monimutkaiseen kysymykseen on harvoin uskottava.

Kolmas premissi -- tai oikeammin empiirinen huomio -- on se, että vähänkin monimutkaisemman argumentin esittämiseen menee vähintäänkin tuollainen 5000 sanaa. Viimeisin minun esittämäni argumentti käsittelee ydinvoimaloiden ulkoistamispäätöksiä ja niihin liittyviä riskejä; tämän argumentin esittämiseen meni 7875 sanaa, mikä todennäköisesti vertaisarviointiprosessin aikana ennemminkin kasvaa kuin pienenee. Jotkut kollegoistani pitävät ammattilehtien sivu- ja sanamäärärajoja aivan liian vaativina; jotkut niin vaativina, että kirjoittavat argumenttinsa mieluummin kirjaksi.

Tuntuu siltä, että ainoa tapa kansantajuistaa Williamsonin transaktiokustannusteoria on luopua kaikista yllämainituista premisseistä: (1) teknisiä termejä ei saa käyttää; (2) argumentin on oltava niin suoraviivainen, että sen viesti on välittömästi ymmärrettävissä ja (3) argumentti on esitettävä kolumnimittaisena, ennemminkin 5000 merkin kuin 5000 sanan mittaisena.

Tuon kolmannen kriteerin suhteen on jonkin verran tietysti vaihtelua, mutta kyllä valtaosa vaikkapa talouden ilmiöiden kansantajuistamisyrityksiä on yhden tai kahden eikä viidenkymmenen sivun mittaisia. Sunnuntain Hesarissa kolumnisti Tommi Uschanov yritti kansantajuistaa toisen talousnobelistin Paul Krugmanin väitettä siitä, että valtion kilpailukyky ei ole mielekäs käsite. Uskallan väittää, että Hesarin lukija ei ainakaan tuon kolumnin tekstin perusteella saa minkäänlaista otetta Krugmanin argumentista. Teemasta netti-Hesarissa käytävä keskustelu on tyypillistä: keskustelijat lähinnä sättivät kolumnistia siitä, että hän ei taida tajuta taloustieteestä yhtään mitään. Tällaisia ovat valitettavan monet kansantajuistamista yrittävien tekstien aikaansaamat keskustelut; joskin on omanlaisensa liioittelun maailmanennätys käyttää nettipalstoilla naljailusta otsikkoa keskustelu. Minusta Krugmanin argumentti on erittäin huomionarvoinen, mutta siihen täytyy tutustua lukemalla Krugmanin omaa tuotantoa, joka todennäköisesti ei avaudu ilman vähintään maisterintason taloustieteellistä koulutusta. Minä en valitettavasti näe oikotietä onneen, en tässä enkä oikein missään muussakaan asiassa. Jos joku tässä maailmassa ärsyttää, niin se on oletus, että tällaisia oikoteitä on olemassa. Brittiläiskanadalaisella kirjailijalla Malcolm Gladwellilla on minusta ainakin kertaluokka kohdallaan, kun hän väittää, että jonkin asian asiantuntijaksi tuleminen vaatii 10.000 tuntia harjoittelua (työajaksi käännettynä tuo on 1250 työpäivää eli suomalaisten noin 200 työpäivän vuositahdilla reilut kuusi vuotta täysipäiväistä työtä).

Kuinkahan monta tuntia mahdetaan vaatia siihen, että vastaavasti ymmärtää asiantuntijan argumentteja? Onko luku kuinka paljon alle tuon 10.000 tuntia?

Palaan Williamsoniin: miten hyvin mediassa onnistuttiin aikanaan kuvailemaan Oliver Williamsonin saavutuksia hänen saadessaan taloustieteen Nobel-palkinnon vuonna 2009? Minun mielestäni tämä ei onnistunut alkuunkaan. Yritin itsekin kantaa korteni kekoon ETLAn nettikolumnissani, mutta näin muutama vuosi jälkeenpäin tuo teksti näyttäytyy tuskallisen yksinkertaistettuna, siitäkin huolimatta että se varmaan sitä ensimmäistä kertaa lukevalla näyttäytyy ennemminkin monimutkaisena.

Loppujen lopuksi kansantajuistaminen tekee oikeastaan omanlaisensa karhunpalveluksen: jos kerran argumentti voidaan esittää sivun mittaisena kertaheitolla lukijan ymmärrettävissä olevana tekstinä, niin mihinköhän tutkijan koulutusta ylipäänsä tarvitaan? Kieleni on tässä kohtaa vain puoliksi poskessa kiinni.

keskiviikko 19. joulukuuta 2012

Tulevaisuutta ei saa sekoittaa menneisyyteen

Luin huolestuneena uutisointia raportista, jossa oli selvitetty Suomessa joukkosurmiin syyllistyneiden taustoja. Yhteisiä tekijöitä löytyi kaksi: tekijät ovat miehiä ja kärsivät mielenterveyden ongelmista. Minua huolestutti se, että ainakaan minun lukemassani uutisessa ei kerrottu, kuinka paljon mielenterveyden ongelmista kärsiviä miehiä Suomesta löytyy. Ehkä -- ja toivottavasti -- tämä mainitaan itse raportissa, koska tieto on erittäin olennainen: valtaosa (prosenttiosuus lienee vähintäänkin 99,9%) mielenterveysongelmaisista miehistä ei ole uhka kenellekään ulkopuoliselle.

Psykiatrisia mielenterveyspalveluja käyttää Suomessa kertaluokkaa sata tuhatta miestä (lähde: THL). Mielenterveysongelmista kärsivien miesten määrä on tuota vielä huomattavasti korkeampi; miehet valitettavasti hakeutuvat hoitoon naisia harvemmin.

On harhaanjohtavaa puhua mielenterveysongelmasta riskitekijänä. Riskitekijät arvioidaan ennen tapahtumaa eikä sen jälkeen. Tupakointi on riskitekijä kun puhutaan keuhkosyövästä. Se, että 90% keuhkosyöpää sairastavista on tupakoitsijoita, ei kuitenkaan ole riskin kannalta oleellinen: oleellista on ”toiseen suuntaan” menevä todennäköisyys eli tupakoitsijan todennäköisyys sairastua keuhkosyöpään.

Mielenterveystyötä Suomessa täytyy vaalia ja siihen täytyy osoittaa määrärahoja, mutta ei sillä perusteella, että näin estetään joukkosurmia, vaan sillä, että mielenterveyden ongelmista kärsiviä täytyy auttaa, olivat he uhkia tai ei. Mielenterveyden ongelmista kärsivät takuulla aavistavat, jos heihin aletaan suhtautua potentiaalisina uhkina. Miten tällainen potilas voi luottaa häntä hoitaviin lääkäreihin? Miten hoitoa tarvitsevat mutta sitä vaille jäävät toimivat huomattuaan, että uhkaavasti käyttäytymällä saa paremmin huomiota? Miten koulukiusattu reagoi aavistettuaan, että häntä on alettu pelätä?

---

Vaarana kaikissa jälkikäteen tehdyissä selvityksissä on se, että niissä menneisyys ja tulevaisuus menevät helposti sekaisin. Menneisyyteen on verrattain helppo katsoa ”deterministisellä otteella”, kun taas tulevaisuus on perustavalla tavalla epävarma, suorastaan epämääräinen: me emme voi edes aavistaa, mitä kaikkea maailmassa ylipäänsä voi tapahtua. Viime viikon tapahtumat Newtownissa USA:ssa ovat olleet tästä karmaiseva muistutus. Ja juuri ilmestyneen netti-Hesarin uutisen mukaan Hyvinkään ampumistapauksen välitön syy oli ”painihäviön aiheuttama raivo”.

Duncan J. Watts tekee myös kirjassaan Everything is Obvious tärkeän huomion: menneisyyttä selittäessämme kaikki huomiomme kiinnittyy siihen mitä tapahtui eikä lainkaan siihen mitä olisi voinut tapahtua. Lukemattomat tapahtumat -- esimerkiksi onnettomuudet -- ovat kuitenkin ”pienestä kiinni” ja yhteensattuman merkitys voi olla suuri. Aika harvoissa selityksissä korostetaan yhteensattuman tai satunnaisuuden merkitystä: selitykset ovat tosiaankin deterministisiä.

Joukkosurmaajien taustalta ”deterministisellä otteella” löytyneillä yhteisillä tekijöillä ei välttämättä ole minkäänlaista ennustearvoa tulevaisuutta ajatellen; ja todistuksen taakka on ilman muuta ennusteisiin uskovilla, ei niitä epäilevillä. Philip Tetlock kiteyttää ajatuksen teoksessaan Expert Political Judgment oivasti:

”retrospective explanations do not travel well into the future”

eli

”menneisyyden selittäminen ei ole matkalippu tulevaisuuteen”

Tetlock argumentoi myös varsin vakuuttavasti -- laajaan empiiriseen aineistoon perustuvaan tutkimukseen nojaamalla --, että sikäli kuin on kyse tulevaisuuden ennustamisesta, kukaan ei ole asiantuntija. Asiantuntijat eivät tuota oman asiantuntemuksensa alalta yhtään sen parempia ennusteita tulevaisuudesta kuin ei-asiantuntijat; tohtorintutkinnon suorittaneet eivät ole yhtään sen parempia ennustajia kuin muut; työkokemuksella ei myöskään ole merkitystä. Tämä on osoitus lähinnä siitä, että valtaosa ennusteista on yksinkertaisesti arvauksia.

Joukkosurmien sekä ennustaminen että ennakointi lienevät mahdottomia tehtäviä: väärät hälytykset jättävät jälkeensä armotonta tuhoa. Kyseessä ei ole ongelma vaan dilemma, pulma johon ei ole ratkaisua:

”Costs of misidentification and labeling of children as dangerous are very serious, as are those associated with failure to recognize those in need of help.”

eli

”Lasten leimaaminen virheellisesti vaarallisiksi on erittäin vakavaa; erittäin vakavaa on myös avun tarpeessa olevan huomaamatta jääminen.”

(lähde: Verlinden et al., 2000, Risk factors in school shootings, Clinical Psychology Review)

Tilastollinen tosiasia on valitettavasti se, että nämä kaksi -- virheellisen leimaamisen todennäköisyys ja todennäköisyys että avun tarpeessa oleva ei apua saa -- ovat toisilleen vastakkaisia: yhden todennäköisyyden pienentäminen automaattisesti kasvattaa toista.

Dilemma täytyy tunnistaa ja tunnustaa: kuinka monta nuorta mielenterveyden ongelmista kärsivää miestä olemme valmiita uhraamaan väärien hälytysten alttarilla?

---

Eikö mielenterveyden ongelmista kärsiville voida antaa hoitoa ja koulukiusaamiseen puuttua ilman että ketään leimataan potentiaaliseksi uhkaksi?

sunnuntai 2. joulukuuta 2012

Jos korrelaatio ei tarkoita mitään...

... niin mikä on vaihtoehto? Lienee hyvien tapojen mukaista ehdottaa vaihtoehtoja, jos jotain kritisoi. Seuraavassa muutama korrelaatiokertoimelle varsin käyttökelpoinen vaihtoehto, jotka ainakin minulle opetettiin jo tilastotieteen peruskursseilla.

1 -- Piirrä kuva. Jos tarkastelun kohteena on kaksi muuttujaa X ja Y, niin yksinkertainen kuvaaja (ns. scatterplot -- en valitettavasti tunne yhtään toimivaa suomennosta) antaa jo varsin hyvän kuvan assosiaation luonteesta, muodosta ja sen vahvuudesta (googlaamalla löytyy esimerkkejä pilvin pimein). Scatterplot-kuvaaja on monessa mielessä erittäin käyttökelpoinen. Ensinnäkin, siinä on mukana koko aineisto, eli assosiaatiota ei ole pelkistetty yhdeksi tunnusluvuksi. Scatterplot-kuvaajasta näkee selvästi myös molempien muuttujien vaihteluvälin aineistossa. Hyvin usein muuttujien välisestä assosiaatiosta saa tarpeeksi hyvän ymmärryksen ilman sen kummempia tilastollisia analyyseja. Yli 40 vuotta tilastollista tutkimusta erilaisilla aineistoilla tehnyt kollegani totesi osuvasti kuukauden takaisessa keskustelussamme, että jos tilastollista assosiaatiota ei saada havaittua ilman monimutkaisia tilastollisia menetelmiä, niin kyse ei voi olla käytännön kannalta merkittävästä assosiaatiosta. Tapanani kun on tarjota ilmaita lounaita, niin tässä taas siihen mahdollisuus: kumoa autenttisella esimerkillä kollegani väite.

2 -- Tee taulukko. Jos muuttujat ovat kategorisia (esim. X ja Y ovat tapahtumia, jotka siis joko tapahtuvat tai eivät tapahdu), ristiintaulukointi on ilman muuta paras vaihtoehto. Se kertoo tilastollisesta assosiaatiosta kaiken olennaisen. Ristiintaulukosta voi laskea varsin käyttökelpoisia ehdollisia todennäköisyyksiä: mikä on tapahtuman X:n todennäköisyys -- siis P(X) -- verrattuna sen todennäköisyyteen tilanteessa, jossa Y on tapahtunut -- siis P(X|Y)?

3 -- Jos käytät regressioanalyysia, tulkitse ei-standardoituja regressiokertoimia, ne kertovat kuinka paljon Y-muuttujan arvot vaihtelevat X-muuttujan arvojen vaihdellessa. Ei-standardoiduissa regressiokertoimissa on se hyvä puoli, että ne säilyttävät X:n ja Y:n alkuperäiset mittayksiköt.

4 -- Jatkoa edelliseen... laske regressioanalyysin perusteella Y:lle ennustevälejä. Monien käytännön sovellusten kannalta olennainen kysymys on se, kuinka tarkasti Y-muuttujan arvo pystytään ennustamaan X-muuttujien arvojen perusteella. Regressioanalyysin tulosten perusteella lasketut ennustevälit antavat tähän yksiselitteisen vastauksen. Kuten edellisessä kirjoituksessani jo totesin, ennustevälit tuppaavat olemaan hyvin vahvojenkin korrelaatioiden tapauksessa yllättävän leveitä. Yrityksen liikevaihdon ennustaminen henkilöstömäärän perusteella on hyvä esimerkki. Korrelaatiota 0,90 ei saa koskaan automaattisesti tulkita vahvaksi ainoastaan sen takia, että se nyt vaan on niin lähellä ykköstä.

5 -- Mieti, kuinka mielekäs tilastollisen assosiaation mittari ylipäänsä on. Tilastollisen assosiaation tunnusluvut ovat pääsääntöisesti otostason tendenssien mittareita. Mutta onko otostason tendenssi juuri se, johon pitäisi kiinnittää kyseisen tutkimuskysymyksen kohdalla huomiota? Ehkä mielenkiintoiset kysymykset eivät koskekaan aineiston yleisiä tendenssejä vaan sen ääriarvoja: erityisen hyvämaineiset yritykset, vakavasti masentuneet potilaat, poikkeuksellisen vahvan syrjinnän kohteeksi joutuneet maahanmuuttajat, ja niin edelleen. Tällöin vastaus tutkimuskysymykseen löytyy todennäköisemmin aineiston reunoilta eikä otostason tendensseistä. Tähän löytyy varsin mittava valikoima erilaisia työkaluja; ensimmäisenä tulee mieleen taloustieteessä käytetty Data Envelopment Analysis.

Eiväthän nämä vaihtoehdot tietenkään kaikkia edellisessä kirjoituksessani mainitsemia ongelmia poista, mutta ne helpottavat aika lailla itse tilastollisen assosiaation vahvuuden ja muodon ymmärrystä.

Uskottavaa ja perusteltua tulkintaa pohdittaessa tilastollinen päättely onkin sitten ainoastaan sivuosassa: tilastollinen päättely ei koskaan tuota tulkintaa.

torstai 22. marraskuuta 2012

Korrelaatio ei tarkoita mitään

Kysyn tilastollisten menetelmien tutkijaseminaarin alussa opiskelijoilta, mitä tilastollinen korrelaatio tarkoittaa. Usein tarkennan kysymällä: jos korrelaatiokerroin kahden muuttujan X ja Y välillä on 0,56, niin mitä tämä tarkoittaa?

Tyypillinen vastaus on: 0,56 tarkoittaa melko vahvaa tai jopa vahvaa korrelaatiota. Näin kuulemma opetetaan tilastotieteen peruskurssilla. Myös Wikipedian mukaan 0,56 on tulkittavissa vahvaksi korrelaatioksi.

Tuo ei kuitenkaan ole vastaus esitettyyn kysymykseen. En kysynyt, onko 0,56 vahva korrelaatio vai ei, kysyin mitä korrelaatio 0,56 ylipäänsä tarkoittaa: mikä on 0,56?

”-10 astetta Celsiusta on jo aika kylmä” ei vastaa kysymykseen ”Mikä on Celsius-aste?” saati sitten kysymykseen ”Mitä lämpötila on ja millaisilla mittareilla sitä arvioidaan?” Sitä paitsi jos kontekstina on pakastimen lämpötila, niin -10 astettahan ei ole ”aika kylmä” vaan ennemminkin ”aivan liian lämmin”.

Olen vetänyt seminaaria 12 vuotta. Kertaakaan en ole saanut kysymykseen oikeaa vastausta. Syy tähän ei ole se, että opiskelijat ovat tyhmiä vaan yksinkertaisesti se, että korrelaatiokerroin ei tarkoita yhtään mitään; sille ei ole olemassa millään muotoa mielekästä tulkintaa.

Tilastollisen korrelaation määritelmät ja havainnollistukset ovat joko aritmeettisia (Pearsonin kaava) tai geometrisia (kahden regressiosuoran y=f[x] ja x=f[y] välisen kulman kosini) artefaktoja. Näille on aivan turha etsiä yksinkertaisia yleistajuisia tulkintoja. Siispä seminaarissa opiskelijoiden usein esittämään kysymykseen ”Voisitko antaa yleistajuisen tulkinnan korrelaatiokertoimelle?” vastaukseni on aina yhtä turhauttava: sellaista ei ole olemassa. Tilastollisessa analyysissa ja laajemmin tieteellisessä tutkimuksessa on aika vähän yksinkertaisia ja yleistajuisia asioita. Mene ja tiedä, olisikohan tämä syy, miksi tutkijalta vaaditaan tutkijan koulutus?

Tämän kirjoituksen voisi lopettaa tähän, jos kaikki ylläoleva otettaisiin tieteellisessä retoriikassa huomioon. Mutta todellisuus on päinvastainen: sekä tieteellisissä keskusteluissa että erityisesti tieteen popularisoinnissa korrelaatiokertoimesta puhutaan ja kirjoitetaan ikään kuin sen merkitys olisi yksiselitteisesti kaikkien tiedossa. Tottahan kaikki tietävät, mitä korrelaatio 0,56 tarkoittaa ja miten se tulkitaan; ne jotka eivät tiedä eivät vaan yksinkertaisesti ymmärrä tilastollista tutkimusta.

Pari vuotta sitten törmäsin aineistossa korrelaatioon, jonka vahvuus oli 0,82. Tarkempi analyysi osoitti, että muuttujien välinen yhteys oli kuitenkin tutkimuskysymystä ajatellen niin heikko, ettei sillä ollut oikeastaan mitään käytännön merkitystä. Syy oli se, että aineiston perusteella lasketut ennustevälit yksittäisille havainnoille olivat niin leveitä, että Y-muuttujalle ei saatu X-muuttujan perusteella käyttökelpoista ennustetta. Tämä ei ole ainoastaan yksittäistapaus, vaan erikoistapaus hyvin yleisestä ilmiöstä: hyvinkin vahvat korrelaatiot tuottavat yllättävän leveitä ennustevälejä.

Yritysten henkilöstömäärän ja liikevaihdon korrelaatio on noin 0,90. Henkilöstömäärä ja liikevaihto menevät siis käsi kädessä? Ei ihan, esimerkiksi Suomessa noin 500 henkeä työllistävien yritysten liikevaihdot vaihtelevat vajaasta sadasta miljoonasta aina miljardiin euroon asti.

Tulkinta on aina kontekstoitava.

Yksi sekaannusta aiheuttava tekijä saattaa hyvinkin olla se, että korrelaatio tarkoittaa tilastollisena käsitteenä hyvin eri asiaa kuin arkikielessä. Esimerkiksi www.dictionary.com antaa sanalle correlation synonyymeiksi seuraavia: similarity (=samankaltaisuus), equivalence (=vastaavuus) ja matching (=yhteensopiva). Näillä ei ole oikeastaan mitään tekemistä tilastollisen korrelaation määritelmän kanssa.

Seuraavassa muutama tärkeä huomio tilastollisesta korrelaatiosta, jolla tarkoitan tässä yhteydessä yleisimmin käytössä olevaa ns. Pearsonin korrelaatiokerrointa. Monet allaolevista huomioista pätevät moniin muihinkin tilastollisen assosiaation mittareihin.

---

1 -- Vahva korrelaatio ei ole merkki siitä, että X:n ja Y:n välillä on vahva yhteys. Se tarkoittaa ainoastaan, että muuttujien välinen yhteys on tietyn muotoinen (Pearsonin korrelaatiokertoimen tapauksessa: lineaarinen). Vastaavasti nollakorrelaatio ei automaattisesti tarkoita, että muuttujien välillä ei ole yhteyttä; muuttujien välinen yhteys voi olla sen muotoinen, että lineaarinen korrelaatiokerroin ei sitä rekisteröi. Tämä jälkimmäinen on tosin ainakin minun analysoimissani aineistoissa sangen harvinaista: olen omissa aineistoissani päätynyt nollakorrelaation havaittuani käytännössä aina siihen, että tilastollista (saati käytännön kannalta merkittävää) yhteyttä ei ole. En kuitenkaan suosittele tällaisen johtopäätöksen tekemistä automaattisesti vaan aineistoa tarkemmin tarkastelemalla.

2 -- Vahva korrelaatiokerroin ei tarkoita, että X:n muuttuessa paljon myös Y muuttuu paljon. Ensinnäkin, sana paljon menettää korrelaation kohdalla merkityksensä, tai oikeammin: sen merkitys muuttuu absoluuttisesta suhteelliseksi. Korrelaatiota laskettaessa muuttujat nimittäin standardoidaan niiden vaihtelun suhteen. Tämä tarkoittaa sitä, että korrelaatiolla ei oikeastaan ole mitään ymmärrettävää ja yksiselitteistä mittayksikköä. Korrelaatiota ei siis koskaan voida tulkita sen numeroarvon perusteella, koska tästä numeroarvosta on riisuttu pois sekä molempien muuttujien alkuperäiset mittayksiköt että niiden vaihteluväli aineistossa.

Jos minä haluan tietää, onko sinulla mukanasi tarpeeksi käteistä, niin vastauksesi ”minulla on lompakossani puoli keskihajontaa enemmän kuin keskimäärin” ei juurikaan lisää ymmärrystäni. Standardointi arkipäivän tilanteissa on hölmöläisen hommaa.

Miksi siis tieteellisessä tutkimuksessa aineisto standardoidaan tilastollisia assosiaatioita laskiessa? Erittäin hyvä kysymys, johon en itse osaa vastata. Eivät osaa tosin monet muutkaan tutkijat, jotka standardointia harjoittavat. Ilmeisesti se on yksi tilastollisen tutkimuksen tapa, jonka mielekkyyttä ei sen kummemmin pysähdytä miettimään. Lähes aina kun itse pysähdyn pohtimaan kysymystä yksittäisen aineiston tai analyysin kohdalla, päädyn siihen, että standardointia ei kannata tehdä.

Nämä ovat yhtäältä teknisiä detaljeja, mutta toisaalta niiden seuraamukset ovat sekä konkreettiset että merkittävät: korrelaatiokerroin ei kerro yhtään mitään siitä, onko jotain (vaihtelua, tilastollista yhteyttä, kausaalista vaikutusta) absoluuttisessa mielessä vähän tai paljon. Käytännön merkittävyyttä arvioidaan kuitenkin ensisijaisesti absoluuttisen eikä suhteellisen efektin kautta; suhteelliset efektit eivät ole käytännön päätöksentekotilanteissa kovinkaan relevantteja. Jos jokin lääke puolittaa sairastumisen todennäköisyyden, niin lienee relevanttia kysyä: kuinka suuri sairastumisen todennäköisyys ylipäätään on? Verbin puolittaa käytännön merkitys kun ymmärrettävästi riippuu täysin siitä, minkä suuruista todennäköisyyttä ollaan puolittamassa.

Otoskeskihajonnalla standardointi tarkoittaa myös sitä, että kahden eri tutkimusaineiston perusteella lasketut korrelaatiokertoimet ovat vertailukelpoisia ainoastaan jos tarkasteltujen muuttujien otosvarianssit ovat aineistoissa identtisiä; en ole tutkijanurani aikana törmännyt kertaakaan tilanteeseen, jossa otosvarianssit olisivat niin lähellä toisiaan, että korrelaatiokertoimia voidaan verrata. Jos siis ruotsalaisella otoksella laskettu korrelaatio on 0,50 ja suomalaisella otoksella laskettu korrelaatio 0,25, niin johtopäätös ”Ruotsin aineistossa yhteys on kaksi kertaa niin vahva kuin Suomen aineistossa” ei ole mitenkään perusteltu. Ja itse asiassa vaikka se olisikin, niin ainakaan minä en tiedä mitä tuo ”kaksi kertaa niin vahva” oikeasti tarkoittaa, koska... niin, koska korrelaatiokerroin ei tarkoita yhtään mitään.

Korrelaatiokerroin ei tyypillisissä tilastollisissa tutkimuksissa myöskään kerro muutoksesta yhtään mitään: kun tilastollisissa tutkimuksissa todetaan, että ”X:n muuttuessa myös Y muuttuu”, niin tällöin tarkoitetaan otoksen havaintoyksikköjen välisiä eroja X:n ja Y:n arvoissa, ei suinkaan yksittäisessä havaintoyksikössä ajassa tapahtuvaa muutosta. Verbiä muuttua käytetään siis sangen erikoisessa merkityksessä; niin erikoisessa, että muutoksesta puhuminen tilastollisten poikkileikkausaineistojen -- ja yllättävää kyllä, myös monien seuranta-aineistojen! -- kohdalla on erittäin harhaanjohtavaa. Yksi syy tähän voi olla se, että merkitykseltään kaksi hyvin erilaista englannin kielen verbiä to change and to vary käännetään molemmat usein suomen kielelle samaksi verbiksi muuttua. Kun lisäksi englanninkielisissä tilastoteksteissä käytetään usein verbiä to change kun pitäisi käyttää to vary, niin väärinymmärryksen todennäköisyys on maksimoitu.

Liiketaloustieteellisissä poikkileikkausaineistoissa on esimerkiksi havaittu yrityksen koon ja toimitusjohtajan palkan välillä hyvin vahva positiivinen yhteys. Mutta kun tarkastellaan ajassa yksittäisen yrityksen koon muutosta ja saman yrityksen toimitusjohtajan palkan muutosta, huomataankin yhteyden olevan varsin heikko (Lambert R. A., D. F. Larcker and K. Weigelt, 1991. ”How sensitive is executive compensation to organizational size?” Strategic Management Journal, vol. 12, no. 5, 395-402).

3 -- Korrelaatio ei kerro kausaalisuudesta yhtään mitään. Tämä tuttu hokema opetetaan jo tilastotieteen peruskurssilla, mutta niin kauan kuin se saman tien unohdetaan, on paikallaan muistuttaa asiasta. Sekä tieteellisissä keskusteluissa että tulosten popularisoinnissa korrelaation tulkintaan nimittäin salakuljetetaan käytännössä aina jonkinlainen ajatus kausaalisuudesta, jolle aineisto ja tilastollinen analyysi eivät anna oikeastaan minkäänlaista metodologista oikeutusta. Syitä on lukuisia, mainitsen tässä kaksi.

Selvin syy on minusta se, että korrelaatio lasketaan aina otoksen tasolla (korrelaatio on perusjoukon parametri), mutta mielenkiinnon kohteena olevat kausaalimekanismit -- sikäli kuin sellaisia on olemassa -- eivät juuri koskaan operoi perusjoukon vaan havaintoyksikön tasolla. Otostason korrelaation kausaalinen tulkinta on valtaosassa tapauksista ei enempää eikä vähempää kuin kategoriavirheen erikoistapaus. Ja kategoriavirhehän ei ole pieni kauneusvirhe vaan metodologisesti fataali.

Tilastollisen tutkimuksen tuloksia tulkittaessa tehdään hämmentävän usein seuraava ajatusvirhe: jos aineisto koostuu sadasta havaintoyksiköstä, joista kaikista on yksi havainto, niin tulokset kuitenkin tulkitaan ikäänkuin olisi tehty sata havaintoa yhdestä ja samasta havaintoyksiköstä.

Toinen syy miksi korrelaation kausaalisessa tulkinnassa on syytä olla varovainen on se, että tyypillisissä tilastollisissa tutkimuksissa mallien selittävät eli eksogeeniset muuttujat ainoastaan havainnoidaan, niitä ei manipuloida (vrt. kokeellinen tutkimus). Hyvin usein tulokset tulkitaan kausaalisesti (X->Y) ikään kuin X olisikin ollut kokeellisesti manipuloitu muuttuja. Kun siis aikoinaan tilastollisen analyysin perusteella toimitusjohtajan sukupuolella (X) väitettiin olevan kausaalinen yhteys yrityksen suorituskykyyn (Y), tehtiin implisiittinen metodologinen oletus, että toimitusjohtajat valikoituvat yritysten johtotehtäviin satunnaisesti. Voiko tämän väärempää oletusta enää tehdä?

Kumpi on fiksumpaa: (a) tehdä aineiston perusteella metodologisesti perustelematon, spekulatiivinen johtopäätös kahden muuttujan välisestä kausaalivaikutuksesta vai (b) jättää johtopäätös tekemättä? Mikä tieteellisen tutkimuksen periaate mahtaisi perustella vaihtoehdon (a) valinnan?

Pidätkö uskottavana sellaista lääketutkimusta, johon osallistuvat saavat itse valita, laitetaanko heidät oikeaa lääkettä vai lumelääkettä saavaan ryhmään?

4 -- Tekstiäni lukeva luonnontieteilijä saattaa tuudittautua ajatukseen, että kirjoitan yhteiskuntatieteiden ongelmista. Kokeellinen tutkimus -- luonnontieteellistä tai ei -- ei ole kuitenkaan kausaalisuuden suhteen oikeastaan yhtään sen autuaampaa kuin havaintoaineistoihin perustuva tutkimuskaan. Lienee myös paikallaan muistuttaa, että huomattava osa luonnontieteen tutkimusta ei ole kokeellisiin vaan havaintoaineistoihin perustuvaa.

Kokeellisessa tutkimuksessa on tietysti omat kiistattomat vahvuutensa. Jos muuttujaa X voidaan koeasetelmassa manipuloida, niin tällöin voidaan toki tehdä metodologisesti vahvempia johtopäätöksiä kausaalisuudesta, koska X on tilastollisissa malleissa ns. aidosti eksogeeninen muuttuja. Mutta tämä kausaalisuus havaitaan kontrolloidussa koetilanteessa, jossa ulkoiset häiriötekijät on suljettu pois. Mitä tapahtuu kausaaliefektille tilanteessa, jossa kaikki hairiötekijät ovat läsnä sekä (a) vaikuttamassa vastemuuttujaan Y että (b) häiritsemässä kokeellisesti manipuloidun tekijän X vaikutusta vastemuuttujaan Y? Lisäksi on muistettava, että muuttuja X ei todennäköisesti käyttäydy tosielämässä samalla lailla kuin koetilanteessa manipuloitaessa ja/tai että X:n luonnollinen vaihtelu on jotain aivan erilaista kuin koetilanteessa: X saattaa olla esimerkiksi muuttuja, jonka arvoon vaikuttaa olennaisesti yksilön valinta. Jätänkö lääkkeeni ottamatta sivuvaikutusten takia? Tilastotieteen termein: X ei koetilanteen ulkopuolella olekaan enää eksogeeninen vaan endogeeninen muuttuja.

Esim. lääketieteellisessä tutkimuksessa on aina tärkeää erottaa lääkkeen tai hoidon kliinisissä tutkimuksissa havaittu tehokkuus (efficacy) sen tehokkuudesta ihmisten jokapäiväisessä elämässä (effectiveness). Se, että nämä kaksi tehokkuutta eroteltaisiin hyvin selvästi sekä tieteellisissä keskusteluissa että kuluttajille suunnatussa mainonnassa, taitaa jäädä ainoastaan toiveeksi.

---

Jos tämä teksti sai lukijansa solmuun, niin viestini meni perille: uskon vakaasti siihen, että on paljon rakentavampaa tunnistaa asioiden monimutkaisuus kuin olettaa vastaukset yksinkertaisiksi. Pearsonin korrelaatiohan tyypillisesti käsitellään jo lukiomatematiikan kursseilla. Olisi julmetun mielenkiintoista olla kärpäsenä katossa kuuntelemassa, miten teemaa käsitellään. Omasta lukioajastani muistan nimittäin lähinnä sen, että vaikka kuinka kauan Pearsonin kaavaa tuijotin, vääntelin ja kääntelin, en tajunnut siitä juuri mitään; en millään ymmärtänyt, mitä hyötyä on siitä, että X:n ja Y:n kovarianssi jaetaan muuttujien keskihajonnoilla.

Jostain syystä ymmärrykseni ei noista päivistä ole juurikaan lisääntynyt.