close
ספט 5, 2017
ספט 5, 2017

ניתוח המודלים השונים לחיזוי שערים

איך מחשבים תחזית שערים?

מהן הגישות השונות שעומדות מאחורי מודלים לחיזוי שערים?

איזה מודל לחיזוי שערים הוא המדויק ביותר?

ניתוח המודלים השונים לחיזוי שערים

בעבר, תחזית השערים התבססה על מבחר מצומצם של נתוני ספורט, אך היום היא כוללת לא מעט סטטיסטיקות כדורגל נפוצות כמו החזקת כדור, בעיטות למסגרת ומספר העבירות שבוצעו. בנוסף, יש לא מעט גישות שעומדות מאחורי מודלים לחיזוי שערים. בכתבה הזו נבחן את המודלים השונים ונראה אילו תוצאות כל אחד מהם מייצר.

בכדורגל, מטרת הקבוצה היא לכבוש שערים נגד היריבה בלי לספוג שערים. זה נשמע פשוט, אבל בגלל דברים כמו אקראיות ומזל קבוצות לא תמיד משיגות את התוצאות "שהגיעו" להן.

לכן ניתוחי נתונים ומודלים כמו תחזית שערים עוזרים מאוד להימורי ספורט. בעזרתם, אפשר לנתח את היכולת של הקבוצות מנקודת מבט סטטיסטית ולתת משנה תוקף לטענות כמו "לא הגיע לה לא לנצח".

בגלל שהפעולה המרכזית שמובילה לשער היא הבעיטה לשער, נתוני הבעיטות לשער הם המפתח בכל מודל לחיזוי שערים.

תחזית שערים (או מודל לחיזוי שערים) היא אחת מהצורות של ניתוח נתונים שבהן משתמשות קבוצות כדורגל. בימינו, היא גם הולכת וצוברת פופולריות בקרב המהמרים. באינטרנט אפשר למצוא לא מעט תחזיות שערים, אך הן לא תמיד דומות, מכיוון שמשתמשים במודלים שונים כדי לחשב אותן.

יש קשת רחבה של מודלים, מפשוטים ועד למורכבים מאוד, ובכתבה הזו ננסה להסביר איך המודלים השונים לחיזוי שערים פועלים. אז מהם המנגנונים שעומדים מאחורי המודלים השונים? ואילו תוצאות הם מייצרים?

שימוש בנתונים בסיסיים של בעיטות לשער

אנדרו ביזלי כבר הסביר איך לחשב תחזית שערים באמצעות מודל המבוסס על נתונים בסיסיים של בעיטות לשער. בגלל שהפעולה המרכזית שמובילה לשער היא הבעיטה לשער, נתוני הבעיטות לשער הם המפתח בכל מודל לחיזוי שערים. יש אין-ספור אירועים במשחק כדורגל שתורמים לכיבוש שערים, אך כשמנסים לחזות את התוצאה, אין ספק שהבעיטה לשער היא האירוע החשוב ביותר.

heat-map-inarticle.jpg

זוהי גישה פשוטה שמשתמשת במדד שמוגדר על ידי Opta בתור "הזדמנות גדולה" - סיטואציה שבה אפשר לצפות באופן סביר מהשחקן לכבוש שער - וכן בבעיטות לשער שנבעטו מחוץ לרחבה ומתוכה.

במדד הזה, לפי שיעורי כיבוש השערים מחמש העונות האחרונות בליגה האנגלית, הערך של הזדמנות גדולה בתחזית השערים הוא 0.387 (38.7% סיכוי להבקיע). בנוסף, לבעיטות מתוך הרחבה יש ערך של 0.070 ולבעיטות מחוץ לרחבה יש ערך של 0.036.

ניתוח מפורט של נתוני הבעיטות לשער

לאור הגודל של מגרש הכדורגל, ולאור הזוויות השונות שמהן ניתן לבעוט לשער וההשפעה שיש להן על ההסתברות להבקיע, מודל המנתח לעומק גם את מיקום הבעיטה ייצר תחזית שערים שונה. 

grid-inarticle.jpg

למרות שהמודל הזה לחיזוי שערים דומה למודל הבסיסי של אנדרו ביזלי, הוא מבוסס על ניתוח מעמיק יותר של המיקום שממנו נבעטת הבעיטה לשער. כלומר, למיקום ניתן ערך משלו בתחזית השערים. הדרך הקלה ביותר לעשות זאת היא לחלק את טווחי הבעיטות לשער לאזורים שונים.

היתרון של מודל כזה הוא שנלקחים בחשבון ההבדלים בין שחקן שבועט ישירות מול השער (סיכוי גבוה מאוד להבקיע) לבין שחקן שבועט מזווית חדה מאוד (סיכוי נמוך מאוד להבקיע). בנוסף, נלקחים בחשבון האיבר שאיתו השחקן ניסה לכבוש - אם זו הייתה בעיטה (קל יותר להבקיע) או נגיחה (קשה יותר להבקיע).

המודל של פול ריילי הוא דוגמה טובה למודל כזה, שמשתמש בגישה קצת יותר מתקדמת לניתוח של נתוני מיקום הבעיטה כחלק מתחזית השערים.

התחשבות במהלך ההתקפה

כמובן שלא רק מיקום הבעיטה והאיבר שאיתו השחקן ניסה לכבוש משפיעים על הסיכוי שהקבוצה תבקיע. לשטף המשחק שקדם לבעיטה לשער יש השפעה על איכות הסיכוי.

במקום רק לתת ערך תחזית שערים לבעיטה, המבוסס על המיקום שלה, חלק מהמודלים בודקים איך ההזדמנות נוצרה (מסירת רוחב, מסירת אורך, התקפה מתפרצת וכו') ומנתחים לעומק איך הבעיטה לשער נבעטה (בעיטה אחרי כדרור מוצלח, בעיטה של כדור שנהדף על ידי השוער וכו').

pass-inarticle.jpg

כמובן שכדי ליצור ולתחזק סוג כזה של מודל צריך הרבה יותר נתונים ומשאבים. המודל של 11tegen11 הוא אחת מהדוגמאות לתחזית שערים שמתחשבת במהלך הרחב יותר של ההתקפה, ומקצה ערכים שונים לבעיטות לשער בהתאם.

ההשפעה של ההגנה על תחזית השערים

שלושת הסוגים הקודמים של מודלים לחיזוי שערים מאפשרים להעריך בצורה טובה יחסית את כמות השערים שקבוצה תכבוש במשחק מסוים או לאורך עונה שלמה. עם זאת, יש משתנים נוספים שתורמים להסתברות שתקרה הזדמנות לכבוש שער.

במקום רק לתת ערך תחזית שערים לבעיטה, המבוסס על המיקום שלה, חלק מהמודלים בודקים איך ההזדמנות נוצרה ומנתחים לעומק איך הבעיטה לשער נבעטה.

כדורגל הוא לא רק התקפה. ההגנה והקטנת הסיכוי של היריבה לכבוש שער חשובות לא פחות. מגנים טובים יכולים להכריח שחקן לבעוט בדרך שונה או לבצע שינוי של הרגע האחרון שיקשה עליו לכבוש שער.

בנוסף לניתוח המהלך ההתקפי - מהאופן שבו ההזדמנות נוצרה ועד למיקום הסופי של הבעיטה לשער - שימוש בקרבה של מגני היריבה ובאופן שבו היא משפיעה על איכות הבעיטה מוסיף רמה נוספת של פירוט למודל לחיזוי שערים.

כלומר, בחינת המיקום שבו השוער והמגנים עמדו ביחס למיקום שממנו נבעטה הבעיטה עשויה לייצר תחזית שערים מדויקת יותר מכל שאר המודלים.

איזה מודל לחיזוי שערים הוא המדויק ביותר?

עכשיו, אחרי שהסברנו על המודלים השונים לחיזוי שערים, נוכל לבדוק איזו שיטה מייצרת את התוצאות המדויקות ביותר. בטבלה הבאה השווינו בין הפרש השערים בפועל של כל קבוצה בליגה האנגלית בעונת 2016/17 לבין תחזית הפרש השערים באמצעות המודלים השונים שציינו בכתבה.

הפרש שערים בפועל לעומת תחזית להפרש שערים

קבוצה

הפרש שערים בפועל

תחזית הפרש שערים לפי מודל 1

פער

תחזית הפרש שערים לפי מודל 2

פער

תחזית הפרש שערים לפי מודל 3

פער

ארסנל

‎+33

‎+12.5

‎-20.5

‎+17

‎-16

‎+15.39

‎-17.61

בורנמות'

‎-12

‎-6.80

‎+5.20

‎-15

‎-3

‎-13.76

‎-1.76

האל סיטי

‎-43

‎-33.80

‎+9.20

‎-35

‎+8

‎-38.88

‎+4.12

ברנלי

‎-16

‎-19.20

‎-3.20

‎-26

‎-10

‎-21.06

‎-5.06

צ'לסי

‎+52

‎+25.90

‎-26.10

‎+31

‎-21

‎+31.91

‎-20.09

קריסטל פאלאס

‎-13

‎-1.50

‎+11.50

‎-5

‎+8

‎-6.05

‎+6.95

אברטון

‎+18

‎+5

‎‎-13

‎+1

‎-17

‎+1.82

‎-16.18

סנדרלנד

‎-40

‎-27.40

‎+12.60

‎-26

‎+14

‎-30.56

‎+9.44

לסטר סיטי

‎-15

‎-7.60

‎+7.40

‎-7

‎+8

‎-6.65

‎+8.35

ליברפול

‎+36

‎+25.30

‎-10.7

‎+33

‎-3

‎+31.87

‎-4.13

מנצ'סטר סיטי

‎+41

‎+41.80

‎+0.80

‎+44

‎+3

‎+51.13

‎+10.13

מנצ'סטר יונייטד

‎+25

‎+25

0

‎+24

‎-1

‎+29.48

‎+4.48

מידלסבורו

‎-26

‎-21

‎+5

‎-25

‎+1

‎-22.46

‎+3.54

סאות'המפטון

‎-7

‎+6.60

‎+13.60

‎‎+8

‎+15

‎+8.15

‎+15.15

סטוק סיטי

‎-15

‎-0.60

‎+14.40

‎-2

‎+13

‎+0.45

‎+15.45

סוונסי סיטי

‎-25

‎-21.70

‎+3.30

‎-20

‎+5

‎-27.34

‎-2.34

טוטנהאם

‎+60

‎+32.50

‎-27.50

‎+30

‎-30

‎+31.04

‎-28.96

‎ווטפורד

‎-28

‎-12.20

‎+15.80

‎-13

‎+15

‎-16.14

‎+11.86

ווסט ברומיץ' אלביון

‎-8

‎-11.80

‎-3.80

‎-7

‎+1

‎-8.52

‎-0.52

ווסטהאם

‎-17

‎-11.10

‎+5.90

‎-7

‎+10

‎-9.83

‎+7.17

הדרך הטובה ביותר לבדוק את רמת הדיוק של כל אחת מהגישות האלה היא לחשב את שורש ממוצע הריבועים של הסטיות (RMSD) שנקרא לפעמים גם שורש ממוצע הריבועים של הטעויות (RMSE). עושים זאת על ידי העלאה בריבוע של הפער בין הפרש השערים בפועל לתחזית הפרש השערים של כל הקבוצה, חישוב הממוצע של כל הערכים והוצאת שורש לממוצע.

רמת הדיוק של המודלים לחיזוי שערים

תחזית הפרש שערים לפי מודל 1

תחזית הפרש שערים לפי מודל 2

תחזית הפרש שערים לפי מודל 3

שורש ממוצע הריבועים של הסטיות

12.92

12.55

12.01

כמו שאפשר לראות, שלוש הגישות השונות ייצרו תחזיות דומות יחסית להפרש השערים בליגה האנגלית בעונת 2016/17. למרות הרמות השונות של הנתונים שבהן כל מודל השתמש, יש הפרש של 0.91 בלבד בין שורשי ממוצעי הריבועים של הסטיות.

עם זאת, עונה אחת (עם 380 משחקים) לא מהווה מדגם מספיק גדול כדי לקבוע בוודאות שגישה אחת טובה יותר מהאחרות. בנוסף, סביר שאם נחשב את שורש ממוצע הריבועים של הסטיות לכל משחק ומשחק נוכל לקבל הערכה טובה יותר לרמת הדיוק של כל מודל, ולקרבה של התחזית שהוא ייצר למספר השערים שנכבשו בפועל.

רוצים להעמיק את הידע על תחזית שערים?

אם אתם רוצים להעמיק את הידע שלכם על תחזיות שערים ולהשתמש בידע הזה להימורים, אנדרו ביזלי כתב איך אפשר להשתמש בתחזית שערים כדי להמר על הליגה האנגלית בכדורגל.

תוכלו גם לעקוב אחרי פול ריילי או 11tegen11 בטוויטר ולקרוא על יום הדיונים של פינקל בנושא תחזיות שערים, שנערך ב-10/9/2017.

discussion-day-expected-goals-inarticle.jpg

משאבי הימורים - משפרים את יכולות ההימור שלך

משאבי ההימורים של פינקל הם אחד מהאוספים המקיפים ביותר של עצות מקצועיות להימורים שאפשר למצוא באינטרנט. אנו מספקים עצות לכל רמות הניסיון, במטרה אחת פשוטה - לשפר את היכולת שלך להמר בצורה מושכלת.