Hvem vinder VM 2018 og hvem er bedst til at prædiktere det?
Sommeren står i sportens tegn for i år skal vi skal underholdes med både Tour de France og ikke mindst VM i fodbold. Den næste tv-måned bliver rædselsfuld, for man kan ikke tænde for fjernsynet uden at høre om fodbold hele tiden. Fodbold i fjernsynet er dog langtfra så underholdende, som at prædiktere vinderen ved hjælp af statistik, så hvorfor ikke tage forskud på glæderne inden VM sparkes i gang i eftermiddag, og komme med et bud på årets vinder.
Og vinderen er …
Den overordnede introduktion til den anvendte metode er beskrevet i [indlægget fra 2016]({{% relref "2016-06-01-em2016.html" %}}). Som input til modellen bruges enten ELO ranking (indhentet den 12. maj) eller odds for de 32 hold som input til modellen (indhentet fra Bet365 samme dag). Oddsene har allerede inkorporeret, at Rusland spiller på hjemmebane, men det har ELO værdierne ikke, og ligesom ved EM i 2016 øges ELO værdien med 5% for Rusland for at give en hjemmebanefordel.1 Denne hjemmebanefordel inkluderer derfor både gevinsten ved hjemmebanepublikum, effekten af bestikkelser mv. De 5% er - ligesom meget af det andet - grebet lidt ud af luften. Data fremgår af tabellen nedenfor.
Navn | Gruppe | odds | ELO | Navn | Gruppe | odds | ELO | |
---|---|---|---|---|---|---|---|---|
Egypt | A | 151.0 | 1646 | Brazil | E | 5.0 | 2131 | |
Russia | A | 41.0 | 1769 | Costa Rica | E | 501.0 | 1745 | |
Saudi Arabia | A | 1001.0 | 1582 | Switzerland | E | 101.0 | 1879 | |
Uruguay | A | 34.0 | 1890 | Serbia | E | 201.0 | 1770 | |
Iran | B | 501.0 | 1793 | Germany | F | 5.5 | 2092 | |
Morocco | B | 501.0 | 1711 | South Korea | F | 751.0 | 1746 | |
Portugal | B | 26.0 | 1975 | Mexico | F | 101.0 | 1859 | |
Spain | B | 7.0 | 2048 | Sweden | F | 151.0 | 1796 | |
Australia | C | 301.0 | 1714 | Belgium | G | 12.0 | 1931 | |
Denmark | C | 101.0 | 1843 | England | G | 19.0 | 1941 | |
France | C | 7.5 | 1984 | Panama | G | 1001.0 | 1669 | |
Peru | C | 201.0 | 1906 | Tunisia | G | 751.0 | 1649 | |
Argentina | D | 10.0 | 1985 | Colombia | H | 41.0 | 1935 | |
Croatia | D | 34.0 | 1853 | Japan | H | 301.0 | 1693 | |
Iceland | D | 201.0 | 1787 | Poland | H | 51.0 | 1831 | |
Nigeria | D | 201.0 | 1699 | Senegal | H | 201.0 | 1747 |
Når enten odds eller ELO omregnes til sandsynligheder kan holdene indbyrdes sammenlignes. De parvise sandsynligheder for kampene på baggrund af ELO scores kan ses i figuren nedenfor. Jo rødere farven er, jo større sandsynlighed er der for at holdet angivet ude til venstre vinder (før musen henover for at se de konkrete sandsynligheder). Man kan bemærke, at Brasilien, Spanien og Tyskland alle har gode chancer for at vinde hver af deres kampe (deres rækker er meget røde), mens det står noget værre til med eksempelvis Saudi Arabien.
Når vi simulerer 100000 slutrunder og tæller op, hvem der vinder VM, så tegner der sig et ret klart mønster: Tyskland har suverænt størst chance for at vinde VM (med en samlet sandsynlighed for at vinde på 25.357 %), mens Brasilien har den klart næststørste chance med 20.104 %. Resultaterne ændrer sig stort set ikke om man bruger data fra odds eller ELO rating til at lave simulationerne. Det er måske værd at bemærke, at Danmarks chancer for at vinde VM ikke er for gode: Vi har 0.111 % chance for at hive pokalen hjem!
Ser man på, hvilke hold, der kommer til at spille finalekampen mod hinanden er der en del variation. Tabellen nedenfor viser de 8 hyppigste kombinationer, og i ca. 14% af de simulerede slutrunder har det netop været Tyskland mod Brasilien, der har mødtes.
Lande | Hyppighed |
---|---|
Brazil, Germany | 14.037 |
France, Germany | 7.169 |
Belgium, Germany | 5.819 |
Argentina, Brazil | 5.630 |
Brazil, Spain | 5.128 |
Belgium, Brazil | 4.547 |
Belgium, England | 4.308 |
Brazil, England | 4.300 |
Danmarks chancer i gruppekampene
Danmark starter i samme gruppe som Frankrig, Peru og Australien, og vi går kun videre til resten af turneringen, hvis vi slutter som nummer 1 eller 2 i gruppen. Modellen kan udregne, hvor stor sandsynlighed der er, for at et givent hold ender som nummer 1, 2, 3 eller 4 i gruppen. For Danmarks gruppe estimeres sandsynlighederne til at være: