close
ספט 19, 2017
ספט 19, 2017

המלכודות של שיטות להימורי ספורט: מִתאם לעומת סיבתיות

מודלים להימורי ספורט: מהו ניתוח רגרסיה?

שימוש במודל ליצירת תחזית הימורים

המלכודות של ניתוח רגרסיה

המלכודות של שיטות להימורי ספורט: מִתאם לעומת סיבתיות

חשוב ליצור שיטת הימורים אם רוצים להרוויח בטווח הארוך מהימורים. עם זאת, הרבה פעמים המהמרים מבלבלים בין אסטרטגיה לניהול הכסף לבין שיטת הימורים, ובין מתאם לסיבתיות בתוצאה. מהי שיטת הימורים ואיך מבדילים בין מתאם לסיבתיות? ננסה לענות על כך בכתבה הבאה.

מהי שיטת הימורים?

בניגוד לשיטה לחישוב גובה ההימור או אסטרטגיה לניהול הכסף, שבהן מחשבים על איזה חלק מהכסף כדאי להמר בכל פעם, שיטה להימורי ספורט היא תחזית מובנית המבוססת על ניתוח כמותי של נתוני עבר, ומטרתה לנצח את השוליים של סוכנות ההימורים ולמצוא תוחלת חיובית.

הרבה פעמים המהמרים מבלבלים בין אסטרטגיות לניהול הכסף לבין מודלים או שיטות להימורים. נסו לחפש באנגלית "betting systems" בגוגל ותראו שרוב תוצאות החיפוש הן בעצם על אסטרטגיות כמו מרטינגייל, לבושר או פיבונאצ'י. בפועל, אלו שני דברים שונים לחלוטין.

אסטרטגיה לניהול הכסף פשוט משנה את אופי הסיכון הנלווה להימורים. היא לא יכולה להפוך שיטת חיזוי לא מוצלחת לשיטה מנצחת בטווח הארוך. מנגד, שיטת הימורים מנסה למצוא את ההסתברויות "האמיתיות" של התוצאות השונות בתחרויות ספורט.

מודלים להימורי ספורט: ניתוח רגרסיה

הדרך הנפוצה ביותר ליצור שיטה להימורי ספורט היא באמצעות ניתוח סטטיסטי של הרגרסיה. לא צריך לפחד מהשם שלה אם סטטיסטיקה היא לא בדיוק הצד החזק שלכם. זו בסך הכל שיטה להערכת הקשר בין משתנים.

ניתוח רגרסיה הוא כלי שימושי ליצירת שיטת הימורים, אבל החולשה המרכזית שלו היא חוסר היכולת להבדיל בין מתאם לסיבתיות.

הדרך הפשוטה לבצע ניתוח רגרסיה היא באמצעות רגרסיה לינארית, שבה לוקחים בחשבון רק שני משתנים, כמו למשל מספר השערים שקבוצה כובשת (המשתנה הבלתי תלוי) ותדירות הניצחונות במשחקים (המשתנה התלוי). 

בספר הראשון שלי Fixed Odds Sports Betting: Statistical Forecasting & Risk Management (יחסי זכייה קבועים בהימורי ספורט: תחזיות סטטיסטיות וניהול סיכונים), הסברתי על מודל של רגרסיה פשוטה, המבוסס על עדיפות השערים היחסית בין שתי קבוצות ב-6 המשחקים האחרונים ביניהן.

באמצעות מדגם גדול של משחקים (במקרה הזה, 8 עונות בין 1993 ל-2001), אפשר ליצור תרשים פיזור המציג את המתאם בין דירוגי המשחקים שחושבו (הפרש השערים של הקבוצה הביתית ב-6 המשחקים פחות הפרש השערים של קבוצת החוץ ב-6 המשחקים), לבין תדירות התוצאה של כל משחק. בתרשים הבא אפשר לראות את ההתפלגות של דירוגי המשחקים (המשתנה הבלתי תלוי) לעומת הניצחונות הביתיים (המשתנה התלוי).

correlation-and-causation-inarticle.jpg

למרות שנקודות הנתונים שבתרשים נראות די מפוזרות, ניתן לזהות מגמה לינארית ברורה שמקשרת בין שני המשתנים: ככל שהקבוצה הביתית טובה יותר מקבוצת החוץ (על סמך הפרש השערים ב-6 המשחקים האחרונים ביניהם), כך יש יותר סיכוי שהקבוצה הביתית תנצח במשחק.

קו הרגרסיה שמשורטט בתרשים למעשה מתאר קשר אידאלי בין עדיפות שערים יחסית לבין תדירות הניצחונות הביתיים, בלי כל הרעש או האקראיות של המזל.

אפשר לתאר את הקו הזה באמצעות משוואה, מכיוון שזה מודל פשוט של רגרסיה לינארית: y = mx + c. במשוואה הזו y הוא המשתנה התלוי (ההסתברות לניצחון), x הוא המשתנה הבלתי תלוי, m, דירוג המשחק, הוא העקומה או השיפוע של הקו (ומדד לעוצמת הקשר) ו-c הוא הקבוע, או הנקודה שבה הקו מצטלב עם ציר ה-y (כלומר, שבה x=0). בדוגמה הזו המשוואה היא למעשה:

% ניצחונות ביתיים = 46.5 + (‏דירוג המשחק כפול 1.56)

כשדירוג המשחק הוא אפס (כלומר, הקבוצה הביתית וקבוצת החוץ הן פחות או יותר שוות מבחינת הפרש שערים), ההסתברות לניצחון היא 46.5%. הנתון הזה נשמע די אינטואיטיבי, לאור העובדה שכ-46% ממשחקי הכדורגל מסתיימים בניצחון ביתי. כאשר לקבוצה הביתית יש הפרש שערים נטו שגדול בעשרה שערים מזה של קבוצת החוץ בששת המשחקים האחרונים, לפי מודל הרגרסיה היא מנצחת ב-62% מהפעמים. עם עדיפות של 20 נקודות ההסתברות הזו עולה ל-78%. 

ניתוח הרגרסיה שלנו גם יכול לומר לנו איזה חלק מהשונות בתדירות הניצחונות יכול להיות מוסבר על ידי מודל ההימורים הזה. במקרה הזה, מדובר ב-86%. אפשר לראות זאת בטיב ההתאמה בין קו הרגרסיה לנתונים. הוא מלמד אותנו שיש מתאם חזק בין שני המשתנים.

שימוש במודל ליצירת תחזית הימורים

כדי להפוך את מודל הרגרסיה שלנו לשיטת הימורים שימושית, אנחנו צריכים לחזות משחקים עתידיים ולהשתמש בתחזיות כדי לזהות הימורים עם תוחלת חיובית.

אסטרטגיה לניהול הכסף פשוט משנה את אופי הסיכון הנלווה להימורים. היא לא יכולה להפוך שיטת חיזוי לא מוצלחת לשיטה מנצחת בטווח הארוך.

כמו ברוב השיטות ליצירת מודלים, הנחת היסוד היא שהעבר הוא המפתח לחיזוי העתיד. אם משחקים קודמים עם דירוג של 10+ הסתיימו בניצחון ביתי ב-62% מהפעמים, ההנחה היא שלקבוצה ביתית עם עדיפות שערים של 10 נק' על פני היריבה תהיה הסתברות של 62% לנצח במשחק. 

אחר כך נוכל לתרגם את ההסתברויות האלה ליחסי זכייה "אמיתיים" ולמצוא תוחלת חיובית אצל סוכנות הימורים שמציעה יחסי זכייה טובים יותר. כשהשתמשתי במודל הזה על עונת 2001/2 בליגה האנגלית בכדורגל הצלחתי להשיג רווח של 2.1% מ-526 הימורים עם יחסי הזכייה הטובים ביותר לניצחון ביתי. לעומת זאת, אם הייתי מהמר באופן עיוור שכל המשחקים באותה עונה יסתיימו בניצחון ביתי, הייתי מפסיד 3.7%.

מתאם לעומת סיבתיות

הימורים על עונה אחת עם קצת יותר מ-500 משחקים לא מבטיחים לנו שעונה אחרי עונה נרוויח. זה אולי נשמע כמו מספר שמחזק את האמינות של שיטת ההימורים שלנו, אבל מי שקורא באופן קבוע את משאבי ההימורים שלנו יודע שהמציאות שונה.

הכתבה של פינקל על חוק המספרים הקטנים היא תזכורת לכך שאפילו מדגמים של 1,000 הימורים יכולים לחשוף דפוסים מטעים של הסתברות, שלמעשה אין להם אחיזה בסיבתיות, אלא נובעים לגמרי מיד הגורל. כך למשל, למרבה הצער, שימוש במודל שהצגתי על חמש העונות הבאות יניב הפסדים בכל עונה.

מודל הרגרסיה הפשוט הזה, המבוסס על עדיפות השערים, הצליח למצוא לאילו קבוצות ביתיות היה יותר סיכוי לנצח, אבל הוא לא הבטיח למצוא קבוצות שיהיה להן יותר סיכוי לנצח מאשר ההסתברות שסוכנות ההימורים נתנה להן.

לצערי, הרבה פעמים מהמרי ספורט מפרשים לא נכון את הדיוק והתוקף של היסטוריית ההימורים, ומבלבלים בין מתאם לסיבתיות.

המודל שלי הצליח לחזות בצורה טובה, אבל לא טוב יותר מהמודלים שבהם השתמשו סוכנויות ההימורים כדי לקבוע את יחסי הזכייה, ולא טוב יותר ממודלים שבהם השתמשו מהמרים אחרים, שעזרו לחדד ולשנות את יחסי הזכייה האלה.

אם המודל שלי פשוט ישכפל את מה שהמודלים של סוכנויות ההימורים עושים, לא יהיה לי רווח עקבי והוא פשוט ישקף את הגחמות של האקראיות. בעצם, הוא לא נשען על אף מתאם בר תוקף. התחזיות של המודל שלי לא "גרמו" לרווחים, בגלל שהוא לא היה מדויק יותר ממודלים אחרים שעשו את אותו דבר.

דיוק לעומת תוקף

ברור שמודל המבוסס על רגרסיה לינארית של שני משתנים הוא לא שיטת ההימורים המתוחכמת ביותר למציאת תוחלת. רגרסיה מרובה, שבה משתמשים ביותר משתנים בלתי תלויים, משפרת את דיוק התחזית. עם זאת, חשוב להיות מודעים לכך שזה לא מעיד בהכרח על תוקף סטטיסטי.

במודל מדויק המדידות קרובות זו לזו, למשל כמו בקו הרגרסיה הלינארית של המודל שהצגתי קודם. אך דיוק לא מבטיח תוקף. תוקף סטטיסטי הוא המידה שבה התוצאות קרובות לערך "האמיתי". על הדיוק יכולות להשפיע טעויות אקראיות, ואילו על התוקף טעויות שיטתיות (הנקראות גם הטיות). 

כדי שלשיטת הימורים יהיה תוקף, כלומר כדי שהיא באמת תעשה את מה שהיא אמורה לעשות (כמו מציאת תוחלת חיובית פעם אחר פעם), צריך להיות לה גם דיוק וגם תוקף. תוקף מעיד הן על היכולת לחזות והן על עקביות. כלומר, זוהי המידה שבה הסיבה המשוערת היא באמת הסיבה שגרמה לתוצאה, והמידה שבה במדידות חוזרות ונשנות נגיע לאותה מסקנה.

לצערי, הרבה פעמים מהמרי ספורט מפרשים לא נכון את הדיוק והתוקף של היסטוריית ההימורים, ומבלבלים בין מתאם לסיבתיות. הטעות שלהם היא שהם מאמינים שהרווח שלהם "נובע" משיטת ההימורים כשהרבה פעמים הוא פשוט נובע ממזל.

המלכודות של ניתוח רגרסיה

ניתוח רגרסיה הוא כלי שימושי ליצירת שיטת הימורים, אבל החולשה המרכזית שלו היא חוסר היכולת להבדיל בין מתאם לסיבתיות. ניתוח רגרסיה יכול לעזור לנו לזהות את הקשר בין שני משתנים, למשל מספר השערים שנכבשו ונספגו לעומת ההסתברות לנצח במשחק, אבל הוא לא אומר לנו אם דבר אחד גרם לאחר.

ניתוח רגרסיה יכול להראות לנו שכשברצלונה מפסידה, ליונל מסי לא כובש אף שער. עם זאת, אסור לנו להסיק שברצלונה הפסידה בגלל שליונל מסי לא כבש אף שער.

בלי לבסס את הסיבתיות והתוקף כחלק משיטת ההימורים, חשוב שנדע שיכול מאוד להיות שהיא לא יותר טובה מהמודלים שכל אחד אחר משתמש בהם כדי ליצור תחזית. בתחרות שמבוססת על יכולת יחסית, כמו הימורי ספורט, לא משלמים לנו אם הצלחנו לחזות את העתיד, אלא אם הצלחנו לעשות זאת טוב יותר מכולם.

משאבי הימורים - משפרים את יכולות ההימור שלך

משאבי ההימורים של פינקל הם אחד מהאוספים המקיפים ביותר של עצות מקצועיות להימורים שאפשר למצוא באינטרנט. אנו מספקים עצות לכל רמות הניסיון, במטרה אחת פשוטה - לשפר את היכולת שלך להמר בצורה מושכלת.