Antal kryss på Stryktipset och i Premier League

Inte alltid kryss i match tretton?

Häromveckan fick jag en intressant tweet av Twitterkompis @wossmar. Han hade tagit fram antalet 1/X/2 i samtliga matcher på Stryktipset för 2017. Sådan här onödig statistik kan alltid vara rolig att titta på ibland. Om inte annat för att förklara för alla som tror på omöjligheter som ”Alltid kryss i match tretton” och så vidare. Det finns givetvis ingen statistik som stödjer påståenden om fler antal kryss i en specifik stryktipsmatch över vettigt långa tidsperioder.

Just för 2017 var det alltså 25 procent (13 av 52) kryss i match tretton. Det känns väl ganska medel?

Däremot uppmärksammade @hansimalmo oss om den lite udda statistiken i position fyra. Hälften av utfallen var ettor och det är väl inte så mycket att orda om, men enbart 8 procent (4 av 52) av matcherna slutade oavgjort och 42 procent slutade tvåa. Anmärkningsvärt!

Eller är det särskilt anmärkningsvärt egentligen?

Jag började fundera lite och tänkte att det kanske inte är jätteudda att bland tretton olika möjligheter endast 4 av 52 matcher slutar oavgjort. Som ett isolerat fall känns det givetvis helt sjukt. (Ta 52 matcher en gång. Sannolikheten att endast fyra eller färre slutat med ett kryss bör vara ytterst liten…) Men om vi har tretton möjligheter på oss?

Jag bestämde mig för att räkna. Men för att kunna börja behövde jag ett värde på sannolikheten för att en match på Stryktipset slutar oavgjort. Jag tänkte att de flesta stryktipsomgångarna innehåller matcher från Premier League (speciellt för position fyra på Stryket), så historisk data från den engelska högstaligan bör kunna utgöra ett bra underlag för sannolikheten för oavgjort.

 

Antal kryss i Premier League – Historisk data

Jag har matchdata från Premier League för hela 2000-talet och tog fram antalet ettor, antalet kryss, respektive antalet tvåor säsong för säsong. Totalt över alla 6460 matcher hade 3003 slutat med hemmaseger, 1652 slutat oavgjort och 1805 slutat med bortaseger. Det vill säga 46.49, 25.57 respektive 27.94 procent.

antal ettor antal kryss antal tvaor premier league
Utfall för antalet ettor, kryss och tvåor för samtliga Premier League-säsonger under 2000-talet fram till och med slutet på säsongen 2016/2017. Totalt slutade 46.49 procent av matcherna med en hemmaseger, 25.57 med oavgjort och 27.94 procent med bortaseger.

Jag tänker att 25 procent kan vara ett ganska vettigt värde att använda för sannolikheten för kryss i en match i Premier League. (Minns ni vad utfallet under 2017 var för antal kryss i position tretton förresten. Titta igen ovan…)

Det är emellertid ganska intressant att det varierar hyfsat mellan säsongerna. Både under säsonger 2005/2006 och 2013/2014 slutade endast 20 procent av matcherna oavgjort.

 

Sannolikhet för fyra kryss bland 52 matcher – Ett experiment

Låt X vara antal kryss i ett experiment med  n=52 matcher där sannolikheten för att en match slutar oavgjort är p=0.25. Då är X Binomialfördelad. Sannolikheten att max fyra matcher slutar oavgjort ges av

P(X \le 4) = \Sigma_{k=1}^4 \binom{52}{k} \cdot 0.25^k \cdot 0.75^{(52-k)} = 0.0013782.

Det vill säga sannolikheten att för ett experiment med 52 matcher är sannolikheten att som mest fyra slutar oavgjort 0.14 procent. En dryg promille.  Extremt osannolikt alltså!

binominalfördelning med n=52 och p=0.25

 

Sannolikhet för fyra kryss bland 52 matcher – Tretton experiment

Sannolikheten att position fyra på Stryktipset har fyra eller färre oavgjorda matcher är alltså 0.14 procent. Det vill säga nästan noll. Det kan alltså anses vara sjukt att endast fyra kryss inträffade i position fyra under 2017! Men nu är det ju så att vi har tretton positioner på en stryktipskupong och vi visste ju inte på förhand att det var just position  fyra vi var intresserade av. För att göra statistik och sannolikheter rättvisa vill vi alltså veta vad sannolikheten är för att det bland Stryktipsets tretton positioner någon slutar med fyra kryss eller färre.

Låt Y vara antalet positioner på stryktipskupongerna 2017 där som mest fyra kryss hamnade. Vi vill räkna ut P(Y > 0).

Denna sannolikhet beräknas också enkelt med Binomialfördelningen med n=13 och p=0.0014 (mer exakt 0.0013782) Vi vill alltså veta: Givet att sannolikheten för att en händelse inträffar vid ett experiment  är 0.0014, vad är sannolikheten att den inträffar minst en gång vid tretton experiment. Svaret är 1 minus sannolikheten att det inte inträffar alls. Eller

P(Y>0) = 1-P(Y=0) = 1-(1-0.0013782)^{13} = 0.0178.

Sannolikheten att vi lyckats hitta ett fall där endast fyra matcher slutade oavgjort var alltså nästan 2 procent. Inte mycket, men inte heller omöjligt.

 

Känslighetstest: Antal kryss vid sannolikhet 20 % chans att enskild match slutar oavgjort

Vi har ju egentligen ingen aning om 25 procent som vi valde som sannolikhet för oavgjort i specifik match är en vettig parameter i vårt specifika fall. Vad hade hänt om vi hade bytt ut 25 procent mot enbart 20 procent? Jo, mycket!

I detta fallet hade sannolikheten att vi skulle lyckas få endast fyra kryss (eller färre) bland de tretton möjligheterna varit 16.42 procent. Inte längre försumbart alls!

 

Sensmoral

Även om det specifika fallet inte visar supertydligt så hoppas jag att jag ungefär lyckades förmedla vad jag vill ha sagt. Bara för att en händelse känns extremt osannolik i isolering, behöver det inte vara alls osannolikt att den inträffar om antalet experiment är tillräckligt många.

Min favoritpodcast More or Less: Behind the Stats tog upp den extremt sällsynta händelsen att två golfare slår Hole-in-One direkt efter varandra. BBC och andra hade rapporterat om ett sådant fall och räknat ut att sannolikheten för att detta inträffar är 1/17000000. Och det är säkert ganska bra gissat … om vi ser det som en isolerad händelse med två golfare under en specifik golfrunda. Men är det särskilt konstigt att det inträffar då och då? Det borde det väl inte vara? Sannolikheten borde öka på en medelgolfrunda där många ju inte spelar i par. En boll med tre eller fyra spelare ökar antalet möjligheter väsentligt. Och tittar vi på alla par över en hel dag på en viss golfbana så ökar det igen. Eller alla par på en bana i ett helt år. Eller på alla banor i ett land. Och så vidare. Jag tänker att sannolikheten att det inträffar då och då i världen är praktiskt taget 1!

Fundera alltid en gång till!