Στοίχημα και στατιστική πάνε μαζί. Είναι λογικό. Οτιδήποτε αφορά σε πρόβλεψη οφείλει να βασίζεται κάπου. Και αυτό το κάπου έχει όνομα: «Στατιστική». Ολοένα και περισσότερος κόσμος το αποδέχεται καθημερινά. Τουλάχιστον οι μη τζογαδόροι. Προσωπικά το έχω ασπαστεί και προσπαθώ να δουλεύω πάνω σε αυτό.
Έχει περάσει αρκετός καιρός από την τελευταία φορά που δημοσιεύτηκε άρθρο μου σε αυτόν εδώ τον ιστότοπο. Το διάστημα αυτό έκανα παύση όσον αφορά το αντικείμενο στοίχημα. Είναι κάτι απαραίτητο και φυσικό. Πως το λέει εκείνη η φράση, ότι πρέπει να αδειάσεις το ποτήρι και να το ξαναγεμίσεις. Κάτι παρόμοιο. Ακόμα βρίσκομαι σε αυτή την παύση. Αφορμή της έκτακτης παρούσας αρθρογραφίας μου στάθηκε πρόσφατο άρθρο που αφορά στο bet-minute.
Προσωπικά την βρίσκω φρέσκια και θετική προσπάθεια στον χώρο της γενικότερης συμβουλευτικής γύρω από το στοίχημα. Εννοείται δεν γνωρίζω κάτι αναφορικά με τον αλγόριθμο που έχουν κατασκευάσει και λειτουργούν οι υπεύθυνοι. Για την ακρίβεια δεν είμαι σε θέση καν να επεξηγήσω τι είναι ένας αλγόριθμος κτλ. Όμως το αντικείμενο, η προσφορά στατιστικών με ωθεί στο να γράψω το παρόν.
Οι γνώσεις μου φτάνουν να μιλήσω μέχρι την γραμμική παλινδρόμηση και ευχαριστημένος να είμαι. Και όχι με κατανόηση εις βάθος. Τα πρακτικά κοιτάω.
Ας ξεκινήσω την υποτιθέμενη αναφορά μου λοιπόν στην παλινδρόμηση, για την οποία μπορείτε να ενημερωθείτε ίσως καλύτερα με μια αναζήτηση στο διαδίκτυο.
Τι έχω κρατήσει εγώ; Ότι «τρέχοντας» μια παλινδρόμηση θα μου φανερώσει αν κάποια γεγονότα βασίζονται σε δεδομένα. Με άλλα λόγια πόσο σχετίζονται τα γεγονότα στα δεδομένα, πόσο επηρεάζονται.
Για παράδειγμα παρασκευάζω παγωτό. Πόσο σχετίζεται η πώληση με την ημερομηνία; Εμφανές παράδειγμα αυτό βέβαια. Αμέσως καταλαβαίνει κάποιος ότι η 15/8 έχει πολύ πιο θετική συσχέτιση από την 31/12 όσον αφορά τις πωλήσεις παγωτών.
Σε άλλο παράδειγμα μία εταιρία θα ήθελε να ξέρει την συσχέτιση κόστος διαφήμισης και συνολικές πωλήσεις. Αξίζει να ξοδεύει χρήματα για διαφήμιση; Τι επίπτωση στις συνολικές πωλήσεις μπορεί να έχει κάθε επιπλέον ευρώ που ξοδεύεται για διαφήμιση.
Επιστροφή στο αντικείμενο μας όμως. Και συγκεκριμένα αγορά 2,5 τερμάτων. Over-Under δηλαδή. Διαβάζεις ότι η γηπεδούχος έχει 1,23 τέρματα υπέρ και 0,85 κατά ενώ η φιλοξενούμενη 1,56 και 1,24 αντίστοιχα. Θέλω άμεση απάντηση. Τι το παίζεις; Έλα αφού ξέρω ότι σου είναι «ευκολάκι». Ωραία, την έχεις την απάντηση. Το ξέρω. Αλλά να σου πω την αλήθεια δεν με ενδιαφέρει. Αυτό που όμως με ενδιαφέρει είναι η αιτιολογία και πάρα πολύ μάλιστα. Γιατί διάλεξες αυτό που διάλεξες; Τι βλέπεις πίσω από τα νούμερα; Κάτι πρέπει να βλέπεις για να πάρεις την απόφαση σου.
Η παλινδρόμηση είναι αυτή που μπορεί να δει πίσω από τα νούμερα, αν υπάρχει κάτι που να αξίζει. Σε ότι γράφω από δω και πέρα θα επιθυμούσα επιβεβαίωση ή διόρθωση από κάποιον που το έχει σπουδάσει το αντικείμενο. Εγώ απλά έξυσα επιφανειακά για να πάρω τα πρακτικά κομμάτια.
Η ερώτηση που έθεσα ήταν: «πόσο σχετίζονται οι μέσοι όροι τερμάτων υπέρ και κατά των αντιπάλων με το σύνολο τερμάτων που θα επιτευχθούν στην αναμέτρηση».
Το δείγμα μου είναι αναμετρήσεις της Premier League από το 2010-2011 εώς το 2013-2014. Ειδικότερα απέκλεισα τα 8 πρώτα παιχνίδια. Επακριβώς το δείγμα μου είναι 1186 αναμετρήσεις.
Ακολουθεί η «ΕΞΟΔΟΣ ΣΥΜΠΕΡΑΣΜΑΤΟΣ»
Η εικόνα από πάνω είναι τα αποτελέσματα της παλινδρόμησης. Θα αναφερθώ στα υπογραμμισμένα με κίτρινο.
Πριν ξεκινήσω, μια σύντομη επεξήγηση. Για να τρέξουμε κάποια παλινδρόμηση εννοείται έχουμε «χ» και «ψ» ακριβώς όπως σε μία συνάρτηση. Τα «χ» είναι ανεξάρτητες μεταβλητές ενώ τα «ψ» είναι εξαρτημένα και ειδικότερα από τα «χ». Στόχος της παλινδρόμησης είναι να τοποθετήσει όσον το δυνατόν καλύτερα τα «ψ» σε μία ευθεία γραμμή. Κάθε γραμμή έχει την συνάρτηση της π.χ :ψ=α+βχ. Όσο μεταβάλλεται η τιμή του «χ» το ίδιο κάνει και αυτή του «ψ».
Αν τα «ψ» πατάνε ακριβώς πάνω στην γραμμή τότε η τιμή του «Προσαρμοσμένου R Τετραγώνου» όπως φαίνεται πάνω αριστερά στην εικόνα θα είναι 1, μονάδα. Αυτό σημαίνει 100% συσχέτιση.
Άλλη πρόταση που χρησιμοποιείται για την επεξήγηση της τιμής «Προσαρμοσμένου R Τετραγώνου» είναι ότι μας λέει πόσο τοις εκατό του «ψ» εξηγείται από το «χ».
Στο παράδειγμα μου μπορούμε να πούμε ότι τα «χ» μου, επεξηγούν το 72% χοντρικά του «ψ». Τα «χ» μου κατά σειρά είναι:
- Μέσος όρος τερμάτων υπέρ γηπεδούχου(H.G.F)
- Μέσος όρος τερμάτων κατά γηπεδούχου(H.G.A)
- Μέσος όρος τερμάτων υπέρ φιλοξενούμενου(A.G.F)
- Μέσος όρος τερμάτων κατά φιλοξενούμενου(A.G.A)
Επόμενη παρατήρηση είναι η τιμή της «Σημαντικότητας F». Δεν γνωρίζω παρά μόνο ότι πρέπει να είναι < του 0,05 και εδώ είναι ίση με το 0.
Επόμενη στάση είναι ότι όταν έτρεξα την παλινδρόμηση στο excel επέλεξα ο σταθερός όρος να είναι 0. Είναι ο συντελεστής της «Τεταγμένης επί της αρχής». Δεν γνωρίζω αν έχει συνέπειες στην ποιότητα των αποτελεσμάτων αυτή μου η επιλογή. Εδώ είναι που παρακαλώ για τα φώτα κάποιου πιο ειδικού.
Εν συνεχεία μας ενδιαφέρει οι τιμές P για τα «χ» μας να είναι και αυτά <0,05 και επίσης στο εύρος «Κατώτερο 95%-Υψηλότερο 95% να μην περιέχεται το 0. Δηλαδή δεν πρέπει το κατώτερο να έχει π.χ τιμή -0,5 και το υψηλότερο 1,2 διότι το 0 εμπεριέχεται (null hypothesis).
Με τα συγκεκριμένα αποτελέσματα μπορούμε να συνεχίσουμε πλέον με την διατύπωση της συνάρτησης μας:
Ψ=(0,582* H.G.F)+(0,413* H.G.A)+(0,385* A.G.F)+ (0,636* A.G.A).
Θυμίζω το «ψ» είναι το σύνολο τερμάτων που θα επιτευχθούν.
Αν επιστρέψω στο παράδειγμα των τιμών που έδωσα παραπάνω ότι η γηπεδούχος έχει 1,23 τέρματα υπέρ και 0,85 κατά ενώ η φιλοξενούμενη 1,56 και 1,24 αντίστοιχα η απάντηση είναι ότι βάσει της συνάρτησης που δημιουργήσαμε με την παλινδρόμηση έχουμε:
Ψ=(0,582* 1,23)+(0,413* 0,85)+(0,385* 1,56)+ (0,636* 1,24)=2,45
Τώρα μπορούμε να πάρουμε μια απόφαση. Και στο σημείο αυτό αφαιρώ το φράχτη του ορίου των 2,5 τερμάτων. Στον πραγματικό κόσμο του στοιχήματος προσωπικά θα επέλεγα να ποντάρω στο 2-3 τέρματα ή στο Under 3,5 ή στο over 2,0 και πάντα συναρτήσει των αποδόσεων.
Θεωρητικά η συνάρτηση μας προσφέρει περίπου 70% επαλήθευση στα εξαγόμενα αποτελέσματα της. Και για να δώσω ένα θεωρητικό πάλι ποσοτικό παράδειγμα, στις 100 φορές που θα δώσει 2,45 τέρματα στις 70 περίπου να επαληθευτεί. Φυσικά δεν εννοώ ότι στα 70 παιχνίδια θα σημειωθούν 2,45 τέρματα στην πραγματικότητα αλλά είναι δυνατόν τα 70 παιχνίδια να επαληθεύσουν το 2-3 τέρματα. Τώρα αν θα ήταν δυνατόν όλα αυτά τα 2-3 τέρματα να προσφέρονται σε απόδοση 1,50 θα βάζαμε και ένα 5% επί του τζίρου κέρδος στην τσέπη.
Έτσι λοιπόν εγώ δεν σου απαντώ τι θα το έπαιζα το παιχνίδι με τα εν λόγω στατιστικά. Σου απαντώ γιατί το ποντάρω όπως το ποντάρω.