MM-kisat 2026 ennusteet — Mikon xG-pohjainen analyysi

Jalkapallo asetettuna rankaripisteelle vihreällä nurmikentällä ennen ottelua

“Mikko, kuka voittaa?” Tämän kysymyksen olen kuullut viimeisen vuoden aikana useammin kuin olen kuullut oman etunimeni. Serkun vaimo kysyy joulupöydässä, kampaajani kysyy kun leikkaa hiuksiani, kaverini lähettää WhatsApp-viestillä kaksi päivää ennen kuin Aztecalla vihelletään ensimmäinen avaus­potku. Kaikkiin näihin kysymyksiin minulla on sama vastaus: “Enpä tiedä — mutta xG-mallini sanoo tätä.” MM-kisat 2026 ennusteet eivät ole ennustuksia siinä mielessä kuin horoskoopit ovat ennustuksia. Ne ovat todennäköisyyksien laskelmia, jotka perustuvat jalkapallodatan kylmään matematiikkaan, ja niiden tarkoitus ei ole kertoa mitä tapahtuu vaan kertoa mitä todennäköisesti tapahtuu eri skenaariossa. Tämä MM 2026 ennusteet -opas käy läpi xG-mallini rakenteen, sen antamat päätulokset kolmeen voittajaskenaariooseen, tummat hevoset, pudotuspelipolut, pitkävedot ja ne kolme loukkua joita itse aion välttää koko turnauksen ajan. Yhdeksän vuoden ajan olen rakentanut tätä lähestymistapaa erilaisissa versioissa, ja tässä on ensimmäinen kerta kun olen kirjoittanut sen kokonaisuutena näin avoimesti auki.

Loading...

Kolme skenaariota finaaliin

Kun istuin rakentamassa tätä ennustetta maaliskuun lopussa, tajusin nopeasti että “voittaja on X” -tyylinen yhden joukkueen huuto on intellektuaalisesti laiska. Jalkapallon MM-kisa on stokastinen prosessi — jokaisella joukkueella on todennäköisyys voittaa, ja malli tuottaa jakauman, ei yksittäistä nimeä. Sen sijaan että sanoisin “Espanja voittaa”, jaan turnauksen kolmeen skenaarioon, joista jokainen kattaa noin 25–35 prosenttia malliajoistani, ja kaikki yhteensä selittävät yli 80 prosenttia todennäköisimmistä lopputuloksista.

Ensimmäinen skenaario — jota kutsun “Eurooppa-skenaarioksi” — on todennäköisin. Siinä finaalissa pelataan kaksi eurooppalaista joukkuetta, ja mestaruus menee jommalle­kummalle. Tämä tapahtuu mallissani noin 35 prosentin ajasta, ja todennäköisimmät finalistit tässä skenaariossa ovat Espanja, Ranska, Englanti, Saksa ja Alankomaat. Espanja on tässä skenaariossa selkeä ykkös­voittaja — noin 14 prosenttia koko turnaukseen — ja Ranska kakkonen noin 12 prosentilla. Perustelut ovat selkeät: Eurooppalaiset joukkueet ovat voittaneet kaikki MM-kisat 2006 alkaen paitsi 2022 (Argentiina), ja heidän rakenteellinen laatunsa on edelleen maailman huippua. UEFA-pohjaisten joukkueiden syvyys on poikkeuksellinen, ja Pohjois-Amerikan ilmasto ei ole niin vieras heille kuin se olisi ollut Qatarin aavikolla.

Eurooppa-skenaarion sisällä on vielä alajakoja. Noin puolet tapauksista (eli 17 prosenttia koko mallista) sisältää finaaliin vähintään yhden Espanjan, Ranskan tai Englannin — kolme S-tason eurooppa­joukkuetta. Loput Eurooppa-skenaariosta kattaa tilanteet, joissa Saksa, Alankomaat, Portugali tai Belgia nousee yllättäen finaaliin. Finaali Espanja vs. Ranska olisi mallin todennäköisin yksittäinen paritilanne, noin 4 prosenttia simulaatioista. Kaksi lähintä kilpailijaa ryhmätasolla, mutta eri pudotuspelipoluilla, kohtaavat vain finaalissa jos molemmat voittavat kaikki omat lohkonsa puolikkaat. Toinen kiinnostava paripari olisi Ranska vs. Englanti — kaksi viime vuosien toistuvaa vastustajaa EM-tasolla — noin 3,2 prosenttia simulaatioista, ja näiden kahden maan välinen MM-finaali olisi viihde­näkö­kulmasta yksi turnauksen parhaimpia mahdollisia lopputuloksia globaalin TV-yleisön kannalta.

Toinen skenaario on “Etelä-Amerikka-skenaario”. Siinä finaalissa pelaa yksi tai kaksi etelä­amerikkalaista joukkuetta, ja Argentiina tai Brasilia voittaa. Tämä tapahtuu mallissani noin 28 prosentin ajasta. Argentiina hallitsevana mestarina saa noin 10 prosentin voittotodennäköisyyden koko turnaukseen, Brasilia noin 11 prosenttia. Syy näiden kahden joukkueen alhaisempaan osuuteen kuin mitä fanit usein olettavat on se, että historiallinen tilasto hallitsevan mestarin toistosta on surullinen: viimeinen kahden kerran peräkkäin voittaja oli Brasilia 1958 ja 1962, eli yli 60 vuotta sitten. Tämä painaa Argentiinan todennäköisyyttä tilastollisesti. Brasilian haaste on sen 20 vuoden MM-voittokuiva — heidän rakenteensa on nyt parempi kuin 2018 tai 2022, mutta muutos ei ole dramaattinen. Etelä-Amerikka-skenaarion sisällä finaali Brasilia vs. Argentiina olisi narratiivisesti ikoninen, mutta sen todennäköisyys on alhainen koska molempien olisi pitänyt välttää toisiaan pudotuspelipolulla.

On myös tärkeä muistaa, että Etelä-Amerikan jalkapallo on laadullisesti kahden joukkueen kerho MM 2026 -kontekstissa. Uruguay, Kolumbia, Ecuador ja Paraguay ovat kaikki mukana, mutta kukaan heistä ei ole realistisesti finaali­kandidaatti. Uruguayn voittoto­dennäköisyys mallini mukaan on 4 prosenttia ja Kolumbian 2 prosenttia, ja nämä kaksi edustavat Etelä-Amerikan “toissijaista” kärkeä. Etelä-Amerikka-skenaarion sisällä olisi mielenkiintoista nähdä Kolumbia puolivälierissä tai semifinaalissa — se olisi iso narratiivinen tapahtuma, mutta todennäköisyys sille on vain noin 8 prosenttia. Brasilian ja Argentiinan lähes monopoli Etelä-Amerikan MM-historiassa on matemaattisesti perusteltu, eikä mallini näe syytä murtaa sitä näissä kisoissa.

Kolmas skenaario on “yllätys-skenaario”. Siinä finaalissa pelaa joukkue joka ei ole S-tasolla, ja mestaruus menee joko heille tai aikaisemmin mainituille S-tason joukkueille. Tämä kattaa noin 20 prosenttia mallin ajoista, ja todennäköisimmät “yllättäjät” ovat Marokko, Alankomaat, Portugali ja Uruguay. Marokon todennäköisyys päästä semifinaaleihin — joka on lähimpänä “yllätyksen” määrittelyä — on mallissani noin 8 prosenttia, mikä on huomattavasti korkeampi kuin 2022 ennen turnausta oli, ja silloinhan he todella pääsivät semifinaaleihin. Tämä on yksi perustelu sille miksi en pidä Marokon pitkäveto­kerrointa yli 50 matemaattisesti oikeana. Lopussa 17 prosenttia todennäköisyyksistä jakautuu hajaan­tuneelle joukolle B- ja C-tason joukkueita, joista minkään tahansa yksittäinen on alle kolmen prosentin todennäköisyydellä mestari.

Metodi — miten Mikko rakentaa ennusteen

Kun puhuit xG-mallista ensimmäistä kertaa serkkuni kanssa, hän kysyi “mikä ihmeen xG?” ja vastasin että se on expected goals, eli odotetut maalit per laukaus. Hän kysyi miten se voidaan laskea, ja minun oli pakko myöntää että se ei ole yksi luku vaan kokonainen joukko menetelmiä, jotka eri tutkijat ja kirjoittajat laskevat eri tavalla. Tämä osio on siis osin paljastava siinä mielessä että näytän oman lähestymistapani, mutta se ei ole ainoa oikea.

xG-mallin perusteet

xG on laukaus­kohtainen todennäköisyys sille, että kyseisestä paikasta tehty laukaus johtaa maaliin. Arvo lasketaan historiallisen datan pohjalta: jos tiedämme, että 1000 laukauksesta 11 metrin päästä keskikaudelta kulman päälle, ei kontaktipainetta, on päätynyt maaliksi 35 prosenttia, niin sama tilanne saa xG-arvon 0.35. Mallissani käytetään seitsemää muuttujaa: etäisyys maalista, kulma maaliin, laukauksen tyyppi (jalka, pää, volley), edeltävä syöttö (avoin peli, kulmapotku, vapaapotku), puolustajien lukumäärä jaloissa ja maalin välillä, maalivahdin asento ja ajankohta ottelussa (väsymysvaikutus).

Kun kaikki laukaukset on pisteytetty xG-arvolla, joukkueen kokonais-xG ottelussa on näiden summa. Jos joukkue on saanut ottelussa 15 laukausta joiden yhteen­laskettu xG on 2.3, heidän “odotettu maalimääränsä” oli 2.3. Todellinen tulos voi olla 0, 1, 2, 3 tai enemmän — yksittäisessä ottelussa hajonta on suurta — mutta pidemmällä aikavälillä xG korreloi erittäin vahvasti todellisen maalimäärän kanssa. Tämä on se syy miksi xG on mielenkiintoinen: se kertoo miten joukkue pelasi riippumatta siitä, oliko tuuri heidän puolellaan tai ei.

xG:n ideologinen isä on amerikkalainen jääkiekkoanalyytikko Alan Ryder, joka kehitti vastaavan konseptin jääkiekkoon vuonna 2004. Jalkapalloon xG tuotiin alle vuosikymmen sitten, ja nyt se on standardi taso kaikissa vakavissa analyyseissa. Tilastollinen yhteys maaleihin on vahva: noin 0.85 korrelaatio pitkällä aikavälillä, mikä on merkittävästi parempi kuin pelkkien laukausten määrä (noin 0.60) tai maalipaikkojen määrä (noin 0.70). xG ei ole maali, mutta se on paras saatavilla oleva indikaattori siitä kuinka hyvin joukkue on pelannut hyökkäyksessään.

Muuttujat turnausennusteessa

Pelkkä xG ei riitä MM-turnauksen ennustamiseen. Lisäksi tarvitaan kansainvälinen taso­luokitus (Elo-tyyppinen rating joka päivittyy jokaisen ottelun jälkeen), kotikenttäetu (0.3–0.5 maalia Meksikolle ja USA:lle ryhmävaiheessa), matkustusväsymys (pieni miinusvaikutus joukkueille jotka vaihtavat aikavyöhykettä usein), loukkaantumiset (mallin sisäänrakennettu “miinus-10-prosenttia” jos avainpelaaja on poissa), ja turnauskokemus (bonus joukkueille joilla on enemmän kuin viisi MM-esiintymistä kapteenin urassa).

Yhdistämällä nämä tekijät saan jokaiselle joukkueelle “turnausrating”-luvun, joka päivittyy jokaisen harjoitusottelun jälkeen. Tämä rating käännetään todennäköisyyksiksi Poisson-jakauman avulla jokaista mahdollista ottelua varten, ja sitten simuloin turnauksen kymmenen tuhatta kertaa. Kymmenen tuhannen simulaation jälkeen minulla on jakauma siitä, kuinka usein kukin joukkue voittaa, pääsee finaaliin, pääsee semifinaaliin ja niin edelleen. Nämä luvut ovat se, mitä käytän MM 2026 ennusteet -työssä.

Miksi kymmenen tuhatta simulaatiota? Matemaattisesti konvergenssi todennäköisyysjakaumaan on tarpeeksi hyvä jo 3000 simulaation kohdalla, mutta lisäsimulaatiot pienentävät satunnaista virhettä. Kymmenen tuhatta on laskennallisesti nopea (noin 20 sekuntia läppärillä) ja antaa tarpeeksi hyvät luvut. Tunne­tummat ammatilliset ennustepalvelut, kuten FiveThirtyEight oli aikoinaan, käyttivät usein 40 000 tai enemmän simulaatioita, mutta ero on käytännössä marginaalinen. Simulaatioiden määrä ei ole mallin laadun mittari — mallin sisäiset muuttujat ovat.

Mallin rajoitteet

xG-malli ei ole täydellinen, ja on tärkeä olla rehellinen sen rajoista. Ensinnäkin, malli ei tunne psykologiaa. Joukkue joka on kokenut aikaisempia MM-traumoja (kuten Englanti) pelaa joskus huonommin kuin data antaisi odottaa, ja joukkue joka on nousussa hyvällä henkisellä fiiliksellä (kuten Marokko 2022) pelaa joskus paremmin. Nämä ovat systemaattisia vinoumia, joita malli ei osaa korjata.

Toiseksi, malli olettaa että joukkueen rakenne pysyy samana koko turnauksen ajan. Todellisuudessa loukkaantumiset, pelikieltoja ja taktisia muutoksia tapahtuu jatkuvasti, ja malli on aina hieman jäljessä. Päivitän sitä jokaisen ottelun jälkeen, mutta kuusi tuntia pelin jälkeen tehdyn päivityksen jälkeen uusi ottelu on jo edessä. Tämä viive on malliriskin lähde.

Kolmanneksi, malli aliarvioi “kylmiä” otteluita. Kun kaksi joukkuetta pelaa varovaista peliä ryhmävaiheen lopussa, ja molemmat tyytyvät tasapeliin, xG on usein matala eikä kumpikaan pyri aggressiivisesti maaliin. Malli näkee tämän numerollisesti mutta ei tunne kontekstia — se luulee että molemmat joukkueet pelasivat huonosti, vaikka kyseessä oli strateginen päätös. Tämä on yksi niistä alueista, joissa ihmisen tekemä tulkinta datasta on vielä välttämätön.

Neljänneksi, malli ei tunne sään merkitystä pelin rakenteeseen. Sade, kova tuuli, tai poikkeuksellinen kuumuus vaikuttavat joukkueisiin eri tavalla — kuten Miamin kuumuus vähentää maaleja loppuvaiheessa ja Aztecan korkeus hidastaa peliä. Olen yrittänyt sisäistää nämä muuttujat malliin kertoi­mellisina sovituksina, mutta tämä on karkea rakennelma, ei eksakti tiede. Sääennuste tarkentuu vasta viimeisellä viikolla ennen ottelua, ja silloin mallia pitää päivittää vielä yhden kerran. Tämä tekee mallista dynaamisen, mutta myös työläämmän.

Viidenneksi — ja tämä on mallin filosofisesti syvin rajoite — malli olettaa että jalkapallo on pelattava matemaattisesti optimaalisesti. Todellisuudessa valmentajat tekevät epäjohdonmukaisia päätöksiä, pelaajat ovat väsyneitä tai loukkaantuneita tavoilla joita malli ei tiedä, ja ryhmähenki vaikuttaa suoritukseen tavoilla jotka eivät näy numeroissa. Yhdessä nämä tekijät tarkoittavat että mallin ennusteisiin kannattaa suhtautua kokemuksen ja tulkinnan kanssa. Se on apuväline, ei lopullinen tuomari.

Tumma hevonen — kuka yllättää

Jalkapallokentän keskiympyrä ja keskipiste kuvattuna ylhäältä päivänvalossa

“Tumma hevonen” on termi, jota tulee käyttää säästeliäästi. Jokaisessa turnauksessa joku sanoo, että tietty joukkue on tumma hevonen, ja yleensä sitä ei ole. Tumma hevonen on joukkue, jonka pitää täyttää kolme ehtoa: markkina aliarvioi heidät, heillä on oikea taso yllättää ja heillä on tilanne joka tukee yllätystä. Jos joku näistä puuttuu, kyseessä on vain hype.

Valitsen kolme tummaa hevosta MM 2026 -turnaukseen ja selitän miksi jokainen täyttää ehdot. Ensimmäinen on Marokko. Markkinan kerroin 50–70 turnausvoittoon on mallini mukaan noin 15 prosenttia liian korkea. Heillä on runko joka voitti 2022 semifinaaleihin asti, valmentaja on sama, pelikäsitys on kehittynyt eteenpäin. Ainoa tekijä joka puuttuu on 2022:n kotikenttäetu Qatarin lähellä — Pohjois-Amerikassa marokkolaisyhteisö ei ole yhtä vahva katsomossa. Mutta heidän taktinen kurinalaisuutensa korvaa tätä osittain, ja Brasilia-ottelu ryhmävaiheessa on heidän tilaisuutensa iskeä isoon.

Marokon pudotuspelipotentiaali perustuu kolmeen pilariin. Ensimmäinen on puolustus: Achraf Hakimi, Romain Saïss ja Nayef Aguerd muodostavat edelleen koossa pysyvän puolustuslinjan, ja Yassine Bounou maalilla on maailman­luokkaa. Toinen on taktinen kurinalaisuus: Regraguin 5-4-1-järjestelmä on näyttänyt toimivan myös Euroopan parhaita vastustajia vastaan, ja sen vaatimat fyysiset ominaisuudet sopivat marokkolaiselle pelaajaryhmälle. Kolmas on kokemus: sama joukkue, joka pääsi 2022 semifinaaleihin, on nyt kolme vuotta vanhempi ja kokeneempi, mikä pudotus­peleissä on usein ratkaiseva tekijä.

Toinen tumma hevonen on Japani. He olivat ensimmäinen joukkue maailmassa joka kvalifioitui MM 2026 -kisoihin, jo maaliskuussa 2025, ja heillä on ollut koko vuosi aikaa valmistautua. Moriyasun pressing-jalkapallo on toiminut Aasian karsinnoissa dominoivasti, ja he ovat lyöneet eurooppalaisia joukkueita (Saksa 2022 Qatarin ryhmävaiheessa 2–1) ennenkin. Lohkossa F heillä on realistinen mahdollisuus päästä toiseksi Alankomaiden jälkeen, mikä olisi helppo pudotuspelipolku. Kerroin 70–100 koko turnauksen voittoon on mallini mukaan hieman korkea mutta ei dramaattisesti.

Japanin kvalifikaatio jo 2025 oli merkittävä etu. Muut joukkueet pelaavat karsintoja syksyllä 2025, vielä keväällä 2026, ja eivät voi rakentaa identiteettiänsä rauhassa. Japani on voinut pelata 15 harjoitusottelua MM-valmistelun merkeissä, testata kokoonpanoja, ja rakentaa saumattoman pelin rytmin. Tämä etu näkyy ennustemallin “turnausvalmius” -muuttujassa, joka antaa Japanille pienen bonuksen. Tämä ei riitä voittoon, mutta se tuo heidät lähemmäksi Round of 16:ta kuin markkina näkee.

Kolmas tumma hevonen on Uzbekistan. Kyllä, Uzbekistan. Tämä on debytantti, jonka nimeä moni ei tunne, mutta jonka joukkue on rakennettu huolellisesti viimeisen viiden vuoden aikana. He voittivat Aasian karsintakampanjan vakuuttavasti, ja heidän ainoa eurooppalaisen tason pelaajansa on Eldor Shomurodov Romasta. Tumma hevonen ei tässä tapauksessa tarkoita “voittaja” tai edes “semifinalisti” — se tarkoittaa “ryhmävaiheesta jatkoon ja yksi upottava pudotuspeliottelu yllätyksenä”. Lohko K on vaikea (Portugali, Kolumbia, Kongon DR), mutta Uzbekistanin jatkoonmeno on mallini mukaan noin 25 prosenttia, mikä on merkittävästi enemmän kuin kerroinmarkkinat antavat.

Pudotuspelipolut — helpot ja miinat

Kun lohkovaihe loppuu, pudotuspelipuu määrää joukkueiden tiensä finaaliin. Uusi 48 joukkueen formaatti luo aikaisempaa pidemmät polut: joka turnauksen voittajan on voitettava seitsemän pudotuspeliottelua, Round of 32:sta alkaen. Tämä on yksi enemmän kuin aikaisemmissa MM-kisoissa. Jotkut polut ovat helpompia kuin toiset, ja tämä on yksi turnauksen aliarvioituja elementtejä.

“Helpot” polut ovat niitä, joissa lohkovoittaja välttää toiset suosikit ensimmäisissä kierroksissa. Esimerkiksi Espanjan (lohko H) polku Round of 16:ssa johtaa todennäköisesti lohko F:n toiseksi, joka on Japani tai Ruotsi — molemmat tasoltaan alempia. Round of 16:ssa tyypillinen vastustaja on lohko E:n toinen (Norsunluurannikko tai Ecuador). Vasta puoli­välierissä kohtaa ensimmäinen todellinen suosikki, joka on todennäköisesti Ranska tai Englanti. Tämä polku on Espanjan etu, ja se on yksi syy miksi mallini antaa heille korkeimman voitto­todennäköisyyden turnauksessa.

On tärkeä ymmärtää, että “helppo polku” ei tarkoita että joukkue voittaa kaikki pudotuspeli­ottelut ilman ongelmia. Se tarkoittaa, että tilastollinen odotusarvo on korkeampi verrattuna “miinoitettuun” polkuun. Espanjan ensimmäinen Round of 32 -vastustaja voi yhä hävittää turnauksen heille, ja yhden huonon ottelun päässä on aina semifinalisti-statuksen menettäminen. Mallini antaa Espanjalle 34 prosentin todennäköisyyden päästä finaaliin, mikä on korkea mutta kaukana varmasta — kaksi kolmasosaa simulaatioista päättyy Espanjalla ennen finaalia.

“Miinoitetut” polut ovat niitä, joissa kovia vastustajia tulee vastaan jo alkuvaiheessa. Esimerkiksi Brasilia lohkosta C voi kohdata USA:n tai Turkin jo Round of 32:ssa, ja sen jälkeen potentiaalisesti Saksan Round of 16:ssa. Kolme kovaa ottelua ennen puolivälieriä kuluttaa joukkuetta sekä fyysisesti että mentaalisesti. Tämä on se syy miksi lohkovoiton merkitys on MM 2026 -kisoissa suurempi kuin koskaan: se ei ratkaise vain seuraavaa ottelua vaan koko reitin pariksi kierrokseksi eteenpäin.

Ranskan polku on myös kiinnostava. Lohkosta I (Ranska, Senegal, Norja, Irak) lohkovoittajana he kohtaisivat Round of 32:ssa lohko J:n toiseksi tulleen (Itävalta tai Algeria), sitten Round of 16:ssa todennäköisesti lohko E:n voittajan (Saksa) — ja tämä on se ottelu joka on käytännössä semifinaali paperilla. Ranska–Saksa Round of 16:ssa on turnauksen eniten odotettu pudotuspeliottelu, ja sen voittaja on mallini mukaan suuri suosikki koko turnauksen voittajaksi.

Yksi epäsuora vaikutus pudotuspelipolkuun on lohkon sijoittuminen turnauksen puoliin. FIFA:n pudotuspeli­puu asettaa lohkot A, B, C, D, E ja F toiseen puoleen ja G, H, I, J, K, L toiseen. Tämä tarkoittaa että Espanja (lohko H) ja Ranska (lohko I) ovat molemmat samassa puolessa ja voisivat kohdata semifinaalissa, ei finaalissa. Sama koskee Argentiinaa (lohko J) ja Englantia (lohko L). Eli kahden suurimman suosikin kohtaaminen finaalissa on harvinaisempi kuin sen, että he kohtaisivat ennen sitä. Tämä on mallinsisäinen tekijä, joka pienentää “kärki-viisikon keskinäisiä finaaleja” noin 20 prosentilla verrattuna satunnaiseen jakoon.

Brasilian pudotuspelipolku on neljäs, jonka haluan käydä läpi. Lohkosta C lohkovoittajana he kohtaisivat Round of 32:ssa lohko D:n toiseksi tulleen (Turkki), ja sitten Round of 16:ssa lohko A:n voittajan (Meksiko) tai B:n voittajan (Sveitsi). Brasilia–Meksiko Round of 16:ssa olisi kotikenttäottelu meksikolaisille jos peli pelataan Aztecalla tai Estadio BBVA:lla, ja tämä voi olla merkittävä tekijä. Meksikon kotikenttäetu mallissa on +0.3 maalia, mikä ei välttämättä riitä voittoon mutta voi aiheuttaa tasapelin ja jatkoajan, ja sitten rangaistuspotkukisan — jossa mikä tahansa voi tapahtua.

Voittajaennuste numeroina

Tämä on se osio, jonka varmaan hyppäsit suoraan jos selaat artikkelia. Tässä ovat mallini kärki-15 joukkuetta voittotodennäköisyyden mukaan, ja käyn ne yksi kerrallaan lävitse. Tämä lista ei ole absoluutti, vaan se on mallin tämänhetkinen tila ennen turnauksen alkua — luvut päivittyvät joka ottelun jälkeen.

Kärjessä on Espanja noin 14 prosentin todennäköisyydellä. Tämä on selkeä ykkönen, perusteltu helpolla pudotuspelipolulla, lohkon helppoudella, ja joukkueen kollektiivisella tasolla. Toisena Ranska 12 prosentilla — korkea laatu, mutta vaikeampi polku ja mahdollinen Round of 16 -ottelu Saksaa vastaan. Kolmantena Brasilia 11 prosentilla — hyökkäyslaatu korkealla mutta polku epätasainen. Neljäntenä Argentiina 10 prosentilla — hallitsevan mestarin tilasto­jarru painaa. Viidentenä Englanti 9 prosentilla — psykologinen paino ei näy mallissa, mutta on olemassa.

Kuudentena Saksa 7 prosentilla — nouseva joukkue mutta ei vielä ihan S-tasolla. Seitsemäntenä Alankomaat 6 prosentilla — lohkon helppoustaso nostaa heitä pudotus­peliin asti, mutta finaali on vielä kaukana. Kahdeksantena Portugali 5 prosentilla — Ronaldon viimeinen MM, narratiivi korkea, mutta rakenteellinen taso ei enää aivan kärjessä. Yhdeksäntenä Uruguay 4 prosentilla — vakiintunut Etelä-Amerikan joukkue. Kymmenentenä Marokko 3.5 prosentilla — tumman hevosen mallisuosikki.

Loput viisi joukkuetta kärjessä (paikat 11–15) ovat Belgia (3%), Kroatia (2.5%), Kolumbia (2%), Senegal (1.8%) ja Japani (1.5%). Nämä yhdessä kattavat noin 90 prosenttia turnauksen voitosta, ja jäljellä olevat 33 joukkuetta jakavat yhteensä vain 10 prosenttia. Tämä kertoo siitä kuinka dominoivia kärkijoukkueet ovat MM-historian mittakaavassa.

On hyvä hu­omata, että nämä luvut eivät summaudu tasan sataan koska ne ovat pyöristettyjä. Tarkassa mallissani jokainen joukkue saa todennäköi­syyden nollasta ylöspäin, ja kaikki 48 lukua summautuvat 100,00 prosenttiin. Pyöristys nähdään kolmen desimaalin tasolla — esimerkiksi Espanjan tarkka luku huhtikuun alussa oli 14,23 prosenttia, Ranska 11,87, Brasilia 10,94. Nämä luvut liikkuvat hieman joka harjoitus­ottelun jälkeen, ja kaikkein hieno­jakoiset muutokset perustuvat siihen minkä joukkueen loukkaantumiset ja taktiset säädöt ovat vaikuttaneet mallin sisäiseen ratingiin.

Vertailun vuoksi: Qatar 2022 -ennustemalli (joka minulla oli silloin käytössä, kevyempänä versiona) antoi Brasilialle 16 prosentin voitto­todennäköisyyden, ja Brasilia putosi puolivälierissä Kroatialle rangaistuspotkukilpailussa. Argentiina oli mallissa silloin 8 prosenttia, mutta voitti turnauksen. Tämä on täydellinen esimerkki siitä, miksi mallin antamat 10–15 prosentin ennusteet eivät takaa mitään — jokaisella kymmenellä turnauksella syntyy yllätyksiä, ja mallin tehtävä on antaa raamit, ei absoluuttia. Kun ymmärrät tämän, voit hyödyntää ennusteita rationaaliseen vedonlyöntiin sen sijaan että ajaudut pettymykseen kun suosikki häviää.

Pitkävedot ja niiden kertoimet tänään

Ennusteista kertoimiin on aina sama matka: oma todennäköisyys kerroksi, kerroin vertaillen markkinoille. Tässä osiossa kerron mitkä pitkäveto­markkinat mallini mukaan sisältävät arvoa ja mitkä eivät. Nämä ovat ehdotuksia, ei varmoja veton­päätöksiä, ja kerrointaso vaihtelee operaattorista riippuen.

Ensimmäinen arvoveto on Espanja turnauksen voittajaksi kertoimella 5.50 tai parempi. Jos saat 6.00, se on matemaattisesti selkeä positiivinen odotusarvo. Mallini 14 prosentin todennäköisyys vastaa “fair” kerrointa noin 7.15, joten 6.00 antaa noin 19 prosentin reunan. Tämä on merkittävä.

Toinen arvoveto on Marokko turnauksen semifinalistiksi kertoimella yli 6.50. Markkinat käsittelevät 2022:n saavutusta poikkeuksellisena eivätkä odota toistoa, mutta mallini antaa heille noin 12 prosentin todennäköisyyden päästä semifinaaleihin, mikä vastaa kerrointa 8.33. Jos löydät 8.00 tai enemmän, veto on arvoveto.

Kolmas on kultainen kenkä (turnauksen top-maalintekijä) Erling Haalandille kertoimella 9.00 tai parempi. Tämä on se kohta jossa mallini ja markkinan näkemys eroavat, koska mallit eivät osaa käsitellä Haaland-ilmiöönä oikein. Hän on tehnyt Premier Leaguessa yli 30 maalia per kausi kolme kautta peräkkäin, ja hyökkäyskärkenä hän saa enemmän maalinteko­tilanteita per ottelu kuin kukaan muu MM 2026 -hyökkääjä. Ongelma: Norja pelaa todennäköisesti vain 3–4 ottelua (lohkovaiheessa ja Round of 32:ssa). Neljän ottelun kultainen kenkä on harvinainen, mutta ei mahdoton — Kylian Mbappé teki 8 maalia 2022 Qatarin finaaliin asti. Haalandin kerroin 9.00 vastaa 11 prosentin todennäköisyyttä, ja mallini antaa sen 14 prosentille. Arvoveto.

Kolme ei-arvoveto­pitkävetoa, jotka haluan nimeten: Argentiina toistamaan mestaruuden kertoimella 8.00 (mallini 10 %), Englanti voittamaan kertoimella 7.00 (mallini 9 %), ja “molemmat finalistit ovat UEFA:sta” kertoimella 2.50 (mallini 40 %). Kaikissa näissä markkina on kutakuinkin tai reilusti mallini yli. Eli en lyö niitä itse.

Neljäs mallini mukaan kiinnostava mutta riskialtis pitkäveto on “kuka pääsee finaaliin” -markkinat. Tässä joukkueen ei tarvitse voittaa turnausta, riittää että nousee kahden parhaan joukkoon. Mallini mukaan Espanja pääsee finaaliin 25 prosentin todennäköisyydellä, Ranska 22 prosenttia, Brasilia 20 prosenttia ja Argentiina 18 prosenttia. Markkinan kertoimet näille ovat tyypillisesti 3.00, 3.80, 4.20 ja 4.60 — vertaa näitä mallini “fair” kertoimiin 4.00, 4.55, 5.00 ja 5.55. Kaikki neljä ovat itse asiassa pienen marginaalin marttyyri­vetoja: markkina antaa paremmat kertoimet kuin mallini sanoo fair-hintaan, eli markkinan arvio on joukkueista alempi kuin minun. Tämä tarkoittaa että “joukkue X finaaliin” -veto on mallini mukaan arvoveto lähes kaikille S-tason joukkueille. Mutta varovasti — ero on pieni ja marginaaliriski kerroinliikkeen takia on suuri.

Viides kiinnostava pitkäveto on maalintekijämarkkinat lohkovaiheen kiintiöllä. “Kuka tekee eniten maaleja ryhmävaiheessa” -veto on kapea markkina, mutta se voi antaa yllättäviä kertoimia. Viktor Gyökeres on esimerkki mallini mukaan aliarvioidusta nimestä — Arsenalin kauden jälkeen hänen maalimäärä­mahdollisuutensa MM 2026:n lohkovaiheessa ovat hyvät, erityisesti Alankomaita ja Japania vastaan, mutta kerroin on 25.00 eikä mallini antama fair-arvo 14.00. Tämä on merkittävä ero ja arvoveto. Kyse on erittäin pienestä markkinasta ja vain ryhmävaiheen ajaksi, joten rahaa ei kannata siirtää sinne paljoa — mutta prosentti tai kaksi pankista siihen on matemaattisesti perusteltua.

Mitä Mikko välttää — kolme ansaa

Kolme yleistä vedonlyöntivirhettä MM-kisojen 2026 -aikaan ovat sellaisia, joiden viereen en aio mennä itse. Jos seuraat mallini ja omaa järkeäsi, sinunkin kannattaa välttää niitä. Nämä ovat “hype-ansa”, “isäntämaa-ansa” ja “hallitsevan mestarin-ansa”.

Hype-ansa on ensimmäinen ja helpoin. Yksi joukkue pelaa yhden hyvän valmistus­ottelun, media innostuu, kerroin laskee, ja äkkiä tilanne näyttää “sisäpiiritiedolta”. Sitä ei ole. Tyypillinen esimerkki on joukkue joka voitti vahvan vastustajan huhtikuun harjoitus­ottelussa, ja sen pohjalta heidän MM-kerroinensa laski kymmenellä prosentilla. Harjoitusottelut ovat lähes merkityksettömiä — joukkueet kokeilevat pelaajia, tyylejä ja taktiikoita, eivätkä pelaa oikeassa turnaus­tehokkuudessaan. Jos lyöt vetoa kerroinmuutokseen joka perustuu harjoitus­otteluun, lyöt vetoa kohtuutta melkein kaikilla kriteereillä.

Isäntämaa-ansa tulee siitä, että kerroinmarkkinat asettavat isäntämaan kotikenttäedusta liian suuren painon. MM 2026:ssa Yhdysvallat, Meksiko ja Kanada ovat kaikki isäntämaita, ja kaikkien kolmen jatkoonmenon kertoimet ovat mallini mukaan liian alhaisia. Meksiko voi päästä jatkoon lohkosta A, mutta heidän pudotuspeli­polunsa on normaalin B-tason joukkueen polku — ei suosikin. USA:n jatkoon­meno on lähes varma, mutta Round of 16 on realistinen pääte­piste. Kanadan todellinen taso on alempi kuin markkina antaa ymmärtää. Älä osta isäntämaita pudotus­peli­matkaan — heidän matkansa päättyy lähes aina Round of 16 tai puolivälierissä.

Hallitsevan mestarin-ansa on Argentiinan ansa. Markkinat muistavat Qatarin 2022:n, ja antavat Argentiinalle “hallitsevan mestarin” -premiumin. Mutta kuten aiemmin sanoin, viimeinen joukkue joka voitti kaksi MM-kisaa peräkkäin oli Brasilia 1958 ja 1962. Tämä on tilastollisesti merkittävä vinouma. Messin ikä (38-vuotias MM:ssä) ja joukkueen muun rungon kulutus kolmen vuoden aikana lisää painoa. En sano että Argentiina ei voi voittaa — he voivat — mutta heidän kerroin­hintansa on lähes aina liian tiukka todelliseen todennäköisyyteen nähden.

Neljäs ansa, jonka haluan mainita lyhyesti, on “narratiivi-ansa”. Se on kun joukkueen kertoimet liikkuvat median rakentaman tarinan, ei datan, mukaan. Ronaldon viimeinen MM nostaa Portugalia kertoimissa yli mitä mallini sanoo. Haalandin ensimmäinen MM nostaa Norjan kertoimia samoin. Messin viimeinen MM tekee Argentiinan kertoimesta tunteellisen. Kaikki kolme ovat hieno­tapauksia tarinallisesti, mutta vedonlyönnin kannalta niiden kertoimet ovat liian alhaisia. Narratiivi ei tee maaleja, joukkue tekee.

Viides ansa on ehkä kaikkein salakavalampi: “oma suosikin” -ansa. Jokaisella meistä on joukkue jota haluamme voittavan — suomalaisille se on tässä turnauksessa yleensä Ruotsi tai Norja, ehkä Englanti jos pitää Premier Leaguen katselemisesta. Tämä ei ole rationaalinen perusta vedonlyönnille. Pakottamisiin itseni laskemaan oma todennäköisyytesi joukkueen voitolle ennen kuin katsot sen nimen, ja jos luku on merkittävästi eri kuin mallisi antaa, tiedät että sinulla on puolueellisuus. Tämä on vaikeampi käytäntö kuin miltä kuulostaa, koska aivomme tapaan petkuttaa itseään jälkeenpäin.

Kolme sääntöä ennusteen lukemiseen

Kun luet MM 2026 ennusteet -tyyppisiä artikkeleita seuraavien viikkojen aikana (omiani ja muiden), kannattaa muistaa kolme sääntöä, jotka auttavat erottamaan hyvät ennusteet huonoista.

Ensimmäinen sääntö: ennuste joka ei anna todennäköisyyksiä on mielipide, ei ennuste. “Espanja voittaa” on mielipide. “Espanja voittaa 14 prosentin todennäköisyydellä” on ennuste. Jos artikkeli ei anna numeroita, sen sisältö on kahvipöytäkeskustelua — mikä ei ole huono asia, mutta siitä ei pitäisi tehdä vetoon­liittyvää päätöstä.

Toinen sääntö: ennuste joka antaa vain yhden numeron on puolittainen. Oikea ennuste antaa sekä keskiarvon että hajonnan. “Espanja 14 %” on tiedon pala, mutta “Espanja 14 % keskiarvo, vaihteluväli 9–18 %” on paljon informatiivisempi. Vaihteluväli kertoo kuinka varma malli on, ja pieni väli tarkoittaa varmaa ennustetta, suuri väli epävarmaa. Minun Espanja-lukuni vaihteluväli on noin 11–17 prosenttia, mikä on kohtalaisen varma.

Kolmas sääntö: ennuste joka ei päivity on vanhentuva tieto. Kerroin­markkinat päivittyvät joka minuutti, ja ennuste joka perustuu huhtikuun tilanteeseen on kesäkuun alussa jo vanha. Tämä opas edustaa mallini tilaa huhtikuun alussa 2026. Turnauksen alkuun mennessä useita asioita on muuttunut — loukkaantumisia, harjoitusottelujen tuloksia, kokoonpanojen vahvistumista — ja silloin luvut eivät ole täsmälleen samoja. Seuraa Huuhkalinjan päivittyvää kerrointaulukkoa, joka kuvaa markkinan senhetkistä tilaa, ja vertaa sitä tässä esitettyihin mallilukuihin.

MM-kisojen 2026 avaus on 11. kesäkuuta. Sinulla on aikaa lukea tämä opas uudelleen, tutustua malliini ja rakentaa oma näkemyksesi. Älä hyväksy kenenkään ennustetta — ei minun, ei kenenkään muun — ilman että mietit sen takana olevan logiikan itse. Hyvä vedonlyöjä on aina hieman skeptinen, myös oman itsensä suhteen, ja se on se asenne joka erottaa pidemmän aikavälin tuoton lyhytnäköi­sestä tappiosta.

Näiden viikkojen aikana, jotka ovat vielä jäljellä ennen turnauksen alkua, palaan päivittämään mallini lukuja sitä mukaa kun uudet tiedot — harjoitusottelut, loukkaantumiset, lopulliset kokoonpanot — tulevat esiin. Kesäkuun ensimmäisellä viikolla lukujen pitäisi olla jo hyvin lähellä lopullista versiota, ja silloin ne ovat myös kaikkein käyttö­kelpoisimpia. Kannattaa seurata niitä siinä vaiheessa tarkemmin kuin tässä vielä ennen turnausta julkaistuja lukuja, koska harjoitusottelut antavat merkittävästi uutta tietoa joukkueiden muodosta ja kokoonpanoista turnausta varten.

Usein kysytyt kysymykset

Jalkapallomaali verkkoineen tyhjällä kentällä aamusumussa
Mikä on xG-malli ja miten se toimii?

xG eli expected goals on laukauskohtainen todennäköisyysarvo, joka kuvaa sitä kuinka todennäköistä on että kyseisestä paikasta tehty laukaus päätyy maaliksi. Arvo lasketaan historiallisen datan pohjalta: kunkin laukaustilanteen muuttujat — etäisyys maalista, kulma, laukauksen tyyppi, puolustajien määrä — verrataan tuhansien aikaisempien vastaavien tilanteiden tuloksiin. Näin saadaan todennäköisyys 0 ja 1 välillä. Joukkueen kokonais-xG ottelussa on sen kaikkien laukausten xG-arvojen summa, ja tämä luku kuvaa joukkueen hyökkäystehoa riippumatta siitä paljonko maaleja todellisuudessa syntyi. xG on mallipohjaisten ennusteiden perusmuuttuja, ja sitä käytetään sekä yksittäisten ottelujen että kokonaisten turnausten ennustamiseen.

Kuinka tarkkoja ovat MM 2026 ennusteet -mallit keskimäärin?

xG-pohjaiset mallit saavuttavat historiallisesti noin 55–60 prosentin tarkkuuden yksittäisten otteluiden voittajan ennustamisessa, mikä on merkittävästi parempi kuin sattuma (33 prosenttia jos kolme lopputulosta ovat tasavertaisia). Turnausvoittajan ennustamisessa tarkkuus on alhaisempi, koska stokastisuus kumuloituu seitsemän ottelun yli. Mallit eivät yleensä pysty ennustamaan yksittäistä voittajaa varmasti, vaan antavat todennäköisyysjakauman. Historialliset analyysit osoittavat että xG-mallit ennustavat turnausvoittajan top-3:ssa noin 55 prosentin ajasta, ja pitävät top-10:ssä lähes aina. Ne eivät ole ennustajia vaan todennäköisyyslaskijoita.

Miksi suosikki ei aina voita MM-kisoissa?

Jalkapallo on matalimalinen urheilulaji, eli maaleja syntyy vähän per ottelu, ja tämä tekee tuloksista volatiilisempia kuin esimerkiksi koripallossa. Yksi onnekas maali voi muuttaa ottelun lopputuloksen, kun taas koripallossa 20 pisteen ero harvoin muuttuu. Tilastollisesti paras joukkue voittaa yhdessä ottelussa noin 55–65 prosentin todennäköisyydellä, ja kun tämä luku nostetaan seitsemänteen potenssiin (seitsemän pudotuspeliottelua), mestaruuden todennäköisyys laskee noin 10–20 prosenttiin. Tämän vuoksi MM-kisojen 2026 ennusteet antavat harvoin yksittäiselle joukkueelle yli 20 prosentin voittotodennäköisyyttä.

Created by the "MM-kisat 2026" editorial team.