Falsk statistik?

Statistik är livsviktigt. Den ger oss en sammanfattande överblick och förståelse av verkligheten, för att kunna göra bra bedömningar inom politik, medicin, folkhälsa, ekonomi och forskning. Bra statistik lyfter fram det väsentliga, och där är kruxet – vad anser vi vara väsentligt?

Media fylls av statistik, och sätter dagordningen. Siffror är hårda. Fakta sparkar, sägs det. Fast genom att räkna och mäta försöker man att formulera en fråga, och ingen enskild fråga kan någonsin fånga alla sidor av verkligheten.

Siffror kan snarare vara rätt mjuka och mesiga och präglas av vad avsändaren vill ha fram ur data. Det sker både av misstag och med avsikt. Inget sensationellt med det, men då siffror alltför ofta blir sedda som objektiva är det lätt att pendeln svänger och en del börjar att misstro all statistik. Det handlar om att läsa statistiken kritiskt, och känna till några av vanligaste tricken.

Riskerna med cirkeldiagram har behandlats tidigare. Andra sätt är att använda diagrammets yta eller volym för att ge en annan bild än vad siffrorna visar. Ett annat vanligt trick är att diagrammet bara inkluderar de tidsperioder där siffrorna verkar ge som mest utslag åt diagrammakarens tes. Det är när perspektivet sträcks ut över en längre tid som det går att få en bättre bedömning av vad som skett.

En fråga inom all statistik är: jämfört med vad? Diagram kan jämföra en företeelse över tiden med något annat som ger ett bättre intryck för den tes som man vill föra fram. Det är mer raffinerat än att jämföra äpplen och päron.

Median och medelvärde är två begrepp som måste hållas åtskilda, de låter likartade men ger olika bilder av samma material. Tidigare har vi tagit upp korrelation och kausalitet, samt statistisk signifikans.

Dagens opinionsundersökningar rymmer en hel del statistiska problem, fast det mest problematiska är inte statistiken utan den roll som de fått; att driva opinionen genom att visa att någon inställning är allmänt gångbar.

Tage Danielsson i sin berömda monolog ”Om Sannolikhet”. Under normala omständigheter var olyckan i Harrisburg mycket osannolik, men nu då det har hänt så är det mycket sannolikt. För att riktigt förstå måste vi studera vad som relativt mest sannolikt, och inte dra hypotesen ur resultatet.

Ett annat problem är publication bias, att vi inte får se alla studier som gjorts utan bara dem som publicerats. Den tendensen är begriplig, en studie som visar att den uppställda tesen inte stämmer ger tyvärr för sällan forskaren ett erkännande. Egentligen är det minst lika viktig forskning. Då publiceras inte ett dåligt resultat, samtidigt som positiva resultat kan publiceras på mer än ett ställe, under olika former, så att det verkar finnas många studier som säger samma sak.

Konsumentprisindex KPI är ett viktigt mått i ekonomin. Men prisförändringar kan manipuleras genom substitution, om en vara stiger i pris så förutsätter man att folk köper mindre av den och istället lägger pengarna på något som minskat i pris. Det är inte rimligt om man jämför t.ex. mjölk med datorer. En prishöjning på en basvara är svår att välja bort. Kvalitetsjusteringar av produkter ges genomslag i KPI. Om TV-apparater stiger i pris med 30 procent så räknas plattskärm och nya funktioner som inte kan väljas bort (har du kunnat hitta någon gammal tjockskärms-TV på sistone?) som något som sänker priset. Men funktionen på varan är den samma. Frågan är vad som ryms i den varukorg som KPI-beräkningarna grundar sig på? I USA tog man bort nybilspriserna och ersatte dem med priserna på begagnade bilar, vilket i ett slag halverade priset på bilar. Fast alla kan inte köpa en begagnad bil.

Mirakel och katastrofer säljer. Det ger rubriker, forskningsanslag och berömmelse. Exempel: en studie säger att risken för hjärtinfarkt är 50 procent högre om ditt kolesterol är högt. Usch, det låter illa. Om det istället är en extra risk att få hjärtinfarkt på 2 procent om du har högt kolesterol? Låter inte lika illa. Fast det är ju samma siffror. Jämför med om av hundra med normalt kolesterol får fyra får hjärtinfarkt. Men av hundra med högt kolesterol så får sex hjärtinfarkt. Skillnaden mellan relativa och absoluta tal är viktig, där absoluta tal innehåller mer information.