Φτάσαμε λοιπόν στο τέταρτο και τελευταίο άρθρο της σειράς που αναφέρονται στη διπλωματική εργασία της Πολυτεχνικής σχολής του ΑΠΘ γύρω από τα νευρωνικά δίκτυα και την εφαρμογή τους στο στοίχημα. Μια αξιέπαινη προσπάθεια του τμήματος Ηλεκτρολόγων Μηχανικών, που αφήνει ελπίδες όχι τόσο για τη σωστή πρόβλεψη των αγώνων ποδοσφαίρου, όσο για την επιτυχία μας στο στοίχημα!

Έτσι κι αλλιώς, είναι αδύνατον να φτάσουμε ποτέ στην 100% σωστή πρόβλεψη. Δεν είναι αυτός ο στόχος μας άλλωστε, αφού τότε όλα τα στοιχήματα θα ήταν value!

Ο σκοπός μας είναι να γίνουμε καλύτεροι παίκτες του στοιχήματος και νομίζω ότι η μελέτη των νευρωνικών δικτύων μας βοήθησε.

Καλή η θεωρία όμως και οι αμπελοσοφίες. Τι γίνεται στην πράξη;

Από τη θεωρία στην πράξη των νευρωνικών δικτύων

Το ερώτημα που… καίει πλέον είναι: Πώς μπορώ να εφαρμόσω όλα αυτά τα θαυμαστά περί νευρωνικών δικτύων στο στοίχημά μου;

Δύσκολα θα έλεγα, ενώ θα πρέπει να βάλετε βαθιά το χέρι στην τσέπη.

Ας δούμε γιατί.

Τα νευρωνικά δίκτυα εκπαιδεύονται και κατασκευάζονται μέσω εφαρμογών ή προσθηκών σε άλλα προγράμματα όπως το Excel. Εσείς καλείστε για παράδειγμα να συμπληρώσετε ένα φύλλο Excel, με τα στατιστικά που σας ενδιαφέρουν και στη συνέχεια το plugin των νευρωνικών δικτύων θα αναλάβει δράση. Στη συνέχεια θα πρέπει βέβαια, και πάλι εσείς, να μελετήστε και να αξιολογήστε τα αποτελέσματά τους.

Με λίγα λόγια, τρία είναι τα βήματα της κατασκευής των νευρωνικών δικτύων:

  1. Συλλογή στατιστικών για τη χρονική περίοδο που σας ενδιαφέρει. Εξυπακούεται πως όσο μεγαλύτερο δείγμα, τόσο καλύτερα τα αναμενόμενα αποτελέσματα.
  2. Εκπαίδευση και δημιουργία νευρωνικού δικτύου, βάσει των παραπάνω στατιστικών.
  3. Αξιολόγηση των αποτελεσμάτων. Αυτό σημαίνει σύγκριση με τις διαθέσιμες αποδόσεις των αγώνων που έχετε συγκεντρώσει και καταγραφή των αποτελεσμάτων. Μια διαδικασία, γνωστή ως backtesting.

Το πρώτο και τρίτο βήμα είναι δική σας δουλειά και μάλιστα όχι εύκολη. Ξεκινήστε να βρείτε στατιστικά κι αποδόσεις για τα προηγούμενα 2 χρόνια. Αφού τα βρείτε, πρέπει να τα «περάσετε» στο Excel ή στο αγαπημένο σας πρόγραμμα καταγραφής και μάλιστα σε χρήσιμη μορφή. Αφού εκπαιδευτεί το δίκτυο, θα πρέπει να δημιουργήστε το σύστημά σας με βάση τις προβλέψεις του δικτύου. Αυτό σημαίνει διαχείριση κεφαλαίου, ορισμός πονταρίσματος, τρέχον κεφάλαιο ανά πάσα στιγμή, σχεδιασμός γραφήματος της επίδοσης του συστήματος κι άλλα.

Βέβαια εφόσον φτάσετε σε εκείνο το σημείο, πλέον θα είστε τόσο ανυπόμονοι για το τελικό αποτέλεσμα, που θα έχετε επαρκές κίνητρο.

Τι γίνεται όμως κατά το δεύτερο βήμα;

Εκπαίδευση και κατασκευή νευρωνικού δικτύου

Η δημιουργία του νευρωνικού δικτύου είναι εύκολη δουλειά, όσο περίεργο κι αν σας ακούγεται. Μάλιστα θα έλεγα ότι είναι… πανεύκολη, αφού θα γίνει μόνη της! Απλά θα είναι το πιο δαπανηρό σε χρήματα σκέλος του συστήματός σας.

Διότι εξίσου δαπανηρά αλλά σε μονάδες χρόνου, θα είναι τα άλλα δύο βήματα που προείπαμε. Κι ο χρόνος είναι χρήμα.

Για το δεύτερο βήμα όμως της εκπαίδευσης και δημιουργίας του νευρωνικού δικτύου, θα χρειαστεί να αγοράσετε κάποια εφαρμογή που θα σας κάνει τη δουλειά.

Αυτόματα.

Για αυτό είπα ότι το δεύτερο βήμα είναι πανεύκολο. Δεν έχετε να κάνετε τίποτα παραπάνω, από το να αγοράσετε μια εφαρμογή εκπαίδευσης νευρωνικών δικτύων.

Οι τιμές αυτών των εφαρμογών ποικίλλουν αλλά δύσκολα θα βρείτε τιμές κάτω από 100 ευρώ. Μάλιστα κάποιες λύσεις προσφέρονται έναντι τετραψήφιων ποσών!

Εφόσον θέλετε να ακολουθήσετε κατά γράμμα το μοντέλο της διπλωματικής εργασίας που μελετήσαμε στα προηγούμενα άρθρα, σας ενδιαφέρει η κατασκευή Fuzzy και SVM νευρωνικών δικτύων. Συνήθως οι πάροχοι τέτοιων προγραμμάτων αναφέρουν τη μοντελοποίηση που ακολουθούν και περιλαμβάνουν τα παραπάνω μοντέλα (NeuroSolutions), αλλά δεν λείπουν και οι εξαιρέσεις (Alyuda).

Μπορείτε να ρίξετε μια ματιά στους συνδέσμους που ακολουθούν. Δεν πρόκειται για affiliate συνδέσμους, οπότε δεν κερδίζω τίποτα αν τελικά αγοράσετε κάτι. Κλικάρετε άφοβα (γνωρίζω την τάση των χρηστών του ίντερνετ να αποφεύγουν να ανταμείβουν τους δημιουργούς/bloggers, μπλοκάροντας διαφημίσεις, αποφεύγοντας συνδέσμους, κλπ.).

Αξίζει τον κόπο να ασχοληθεί κανείς με νευρωνικά δίκτυα στο στοίχημα;

Στο δια ταύτα τώρα. Γιατί αυτό μας ενδιαφέρει. Θα βγάλουμε λεφτά στο στοίχημα από την εργασία και το νευρωνικό δίκτυο του Δημήτρη Ιωάννου;

Όλα τα υπόλοιπα είναι απλά θόρυβος για τους περισσότερους.

Από το θόρυβο αυτόν, πρέπει να επικεντρωθούμε σε ένα μονάχα νούμερο.

Το ROI ή yield όπως το λένε αρκετοί στο στοίχημα.

Το ROI είναι τεράστιο.

ΤΕΡΑΣΤΙΟ.

[quote type=”center”]Τ Ε Ρ Α Σ Τ Ι Ο![/quote]

Δεν ξέρω αν αντιλαμβάνεστε τι θέλω να πω. Να το πω πιο λιανά: με τέτοιο ROI θα βγάλουμε ένα σκασμό λεφτά στο στοίχημα!

Χαμόγελα βλέπω.

Μη χαίρεστε, υπάρχουν τρία εμπόδια στο δρόμο σας:

  • Το νευρωνικό δίκτυο ή το (πιθανολογώ) φύλλο σε Excel που δημιουργήθηκε για χάριν της εργασίας, απλά δεν το έχουμε. Το έχει ο δημιουργός της εργασίας (υποθέτω). Αν το είχαμε, τουλάχιστον θα επιχειρούσαμε ένα σωρό πράγματα, όπως να ελέγξουμε άλλα πρωταθλήματα αλλά κυρίως να κάνουμε forward testing. Δηλαδή να δούμε πώς θα τα πήγαινε τις επόμενες 2-3 αγωνιστικές. Το forward testing είναι απαραίτητο, ακόμα κι αν τα αποτελέσματα του back testing είναι τόσο ενθαρρυντικά, όσο αυτά του μοντέλου που μελετάμε. Όμως, αφού δεν το έχουμε, πρέπει να το φτιάξουμε.
  • Χρειαζόμαστε λεφτά. Όχι για το αρχικό κεφάλαιο, αυτό μπορεί να είναι τόσο μικρό όσο αντέχει η τσέπη μας. Λεφτά για το λογισμικό. Αφού δεν έχουμε έτοιμο το μοντέλο/σύστημα του Δημήτρη, υποχρεούμαστε να το κατασκευάσουμε. Από την αρχή. Που σημαίνει ότι θα χρειαστεί να εκπαιδεύσουμε το δίκτυο. Οπότε, βλέπε βήμα νούμερο 2 πιο πάνω.
  • Είστε τζογαδόροι. Ελάτε, πείτε την αλήθεια. Ακόμα κι αν σας είχα στο τέλος του άρθρου μια έκπληξη, ας πούμε ένα Excel με τα πάντα μέσα από νευρωνικά δίκτυα, έτοιμο να το δουλέψετε για το αυριανό σας στοίχημα… θα μένατε πιστός σε αυτό; Δε θα παρεκκλίνατε καθόλου; Δε θα ποντάρατε έτσι, ένα δυο στοιχήματα μωρέ, για τη «μαγιά»; Θα ήσαστε τόσο πειθαρχημένος; Θα κάνατε σωστή διαχείριση του κεφαλαίου σας; Θέλετε να μου πείτε, ότι αν το σύστημα έβγαζε επιλογή με απόδοση 1,65, θα την αποφεύγατε; Επιτρέψτε μου να αμφιβάλλω. Το τρίτο εμπόδιο είστε εσείς ο ίδιος. Ή μήπως φταίει κάποιος άλλος που χάνετε τόσο καιρό στο στοίχημα;

Αν νικήσετε τα εμπόδια αυτά, που σημαίνει να συλλέξετε στατιστικά και δεδομένα, να αγοράσετε λογισμικό για την δημιουργία κι εκπαίδευση των νευρωνικών δικτύων και να αναπτύξετε αρετές όπως πειθαρχία κι επιμονή, τότε ναι. Αξίζει. Αφού το ROI είναι τεράστιο. Το ‘παμε;

Και για να απαντήσω στο σχόλιο του Betakos, δε χρειάζεται καν να γνωρίζετε τη θεωρία όλων αυτών που συζητάμε. Αρκεί να ακολουθήσετε τη μεθοδολογία. Δηλαδή, να μαζέψτε τα συγκεκριμένα στατιστικά για τα προηγούμενα 8+ χρόνια, να φτιάξετε αυτόματα ένα δίκτυο fuzzy ή SVM και να εφαρμόσετε ένα σταθερό ποντάρισμα.

Υπόψιν ότι ένα νευρωνικό δίκτυο που θα φτιάξετε με τα δεδομένα των προηγούμενων 5 ετών, είναι διαφορετικό από εκείνο με δεδομένα των προηγούμενων 6 ετών. Ακόμα κι αν τα στατιστικά είναι ακριβώς τα ίδια. Για αυτό άλλωστε, αφού κατασκευαστεί ένα νευρωνικό δίκτυο, το ΣΩΖΟΥΜΕ. Αν εκπαιδευτεί ξανά με έστω και ένα δεδομένο επιπλέον, πιθανόν να πάρουμε διαφορετικά αποτελέσματα.

Πόσα λεφτά μπορώ να κερδίσω στο στοίχημα με τα νευρωνικά δίκτυα;

Στη Premier League των 200 στοιχημάτων ανά χρονιά, με βάση το αρχικό μοντέλο νευρωνικών δικτύων του 7,29% ROI, κερδίζουμε 7,29 ευρώ για κάθε 100 ευρώ που στοιχηματίζουμε. Απλά πράγματα. Είτε στοιχηματίζετε 10 αγώνες από 10 ευρώ, είτε 100 από ένα ευρώ, είτε έναν αγώνα από 100 ευρώ, μακροχρόνια το καθαρό κέρδος θα είναι 7 ευρώ περίπου.

Το ποσό που θα στοιχηματίσετε, το υποδεικνύει το αρχικό σας κεφάλαιο κι όχι η διαθέση και το ένστικτό σας. Το κεφάλαιο αυτό θα το χωρίσετε σε 50 ισομερή πονταρίσματα, ώστε να στοιχηματίζετε το 2% του κεφαλαίου σας. Τα έχουμε πει πολλές φορές αυτά.

Οπότε με 5.000 ευρώ κεφάλαιο, θα κερδίζετε 7,29 ευρώ ανά στοίχημα. Άρα 1.450 ευρώ μέσα σε μια σεζόν της Premier League. Περίπου δηλαδή 29% αύξηση του κεφαλαίου σας σε μια χρονιά.

Στο δεύτερο, «ρεαλιστικό» μοντέλο όπου αποκλείονται χαμηλές αποδόσεις, το ROI είναι 19,5% αλλά πλέον ποντάρετε σε 100 αγώνες μιας χρονιάς. Διατηρώντας το αρχικό κεφάλαιο στα 5 χιλιάρικα, τώρα κερδίζετε 19,50 ευρώ ανά στοίχημα, ή 1.950 ευρώ ανά σεζόν του Αγγλικού πρωταθλήματος. Σχεδόν 40% αύξηση του κεφαλαίου σας.

Στην περίπτωση της Ιταλίας και της βελτιστοποίησης μέσω σύνθεσης αποφάσεων, όπου το ROI εκτοξεύθηκε στο 32,66%, η σύγκριση έχει ως εξής:

Στο αρχικό ασαφές μοντέλο στοιχηματίζουμε σε 150 αγώνες περίπου ανά χρονιά και κερδίζουμε 12,31% ανά ποντάρισμα. Με 5.000 κεφάλαιο, αυτό μεταφράζεται σε 1.850 ευρώ κέρδος ανά σεζόν της Serie A.

Κατά την «ομοφωνία» που είδαμε στο προηγούμενο άρθρο, πλέον ποντάρουμε σε 55 αγώνες ανά χρονιά με 32,66% απόδοση. Αυτό μεταφράζεται σε 1.800 ευρώ κέρδος ξεκινώντας με 5.000 κεφάλαιο.

Ακριβώς. Με μεγαλύτερο ROI, κερδίζουμε λιγότερα σε μια χρονιά.

Ωστόσο, μεγαλύτερο ROI θεωρητικά θα επιτρέπει μεγαλύτερο ποντάρισμα, αφού θα έχουμε μικρότερη διακύμανση και λόγω μεγαλύτερου hit rate. Έτσι τότε αντί για 2% θα ποντάραμε 6% και θα διπλασιάζαμε το κεφάλαιό μας μέσα σε μία μόλις χρονιά!

Αν διαβάσετε όμως την εργασία, θα δείτε ότι υπήρξαν παραδείγματα πρωταθλημάτων που για μια ολόκληρη χρονιά, το μοντέλο δεν έβγαλε καθόλου κέρδος! Η διακύμανση/variance που λέγαμε. Σταθήκαμε άτυχοι εκείνη τη χρονιά. Για σκεφτείτε να ποντάρετε με ένα επιβεβαιωμένο κερδισμένο σύστημα και για μια ΟΛΟΚΛΗΡΗ χρονιά να μην κερδίζετε χρήματα!

Ελπίζω να σας βάζω σε σκέψεις με αυτά.

Παρατηρήσεις και προσωπικά σχόλια

Ας πω και μερικά δικά μου σχόλια κλείνοντας αυτή τη σειρά άρθρων. Καταρχήν, όπως έχω γράψει και στα προηγούμενα κείμενα, αξίζουν συγχαρητήρια στο τμήμα Ηλεκτρολόγων Μηχανικών του Πολυτεχνείου του ΑΠΘ για την εργασία αυτή. Και προσωπικά, δεν έχω και την καλύτερη άποψη για τα πανεπιστήμια. Αλλά αυτό θα το αφήσω να το αναλύσω στην αυτοβιογραφία μου το 2051.

Δεν περίμενα να συναντήσω πανεπιστημιακή εργασία για το στοίχημα από Έλληνες δημιουργούς, πόσο μάλλον τόσο καλοφτιαγμένη. Μέχρι σήμερα και για τουλάχιστον 10 χρόνια διαβάζω εργασίες/μελέτες ξένων πανεπιστημίων κι ερευνητών. Ακόμα και οι περισσότερες από εκείνες αναμασούν τα ίδια πράγματα. Άλλωστε, κάτι που έμαθα στο Πολυτεχνείο ήταν ότι τουλάχιστον το 80% μιας εργασίας είναι αντιγραφ… Απαπα, πιπέρι!

Ξαναγράφεις τη θεωρία από άλλα βιβλία με δικά σου λόγια, χαραμίζεις μισές και πλέον σελίδες για το σκοπό αυτό, έπειτα περιγράφεις τι έκανες και τι δυσκολίες αντιμετώπισες, για να φτάσεις στο ζουμί που είναι φυσικά τα συμπεράσματα. Όπως βέβαια γίνεται και στα άρθρα των προγνωστικών που διαβάζετε. Ή μάλλον, που δεν διαβάζετε, αφού πηγαίνετε κατευθείαν στο τέλος των άρθρων, βλέποντας το σημείο και μόνο αν συμφωνήσετε, θα ρίξετε μια ματιά και στο κείμενο που προηγήθηκε.

Καλά τα λέω;

Έτσι η κάθε εργασία στο τέλος έχει 3-4 σελίδες που προσθέτουν πραγματικά στη συνολική έρευνα ενός θέματος. Όλα τα προηγούμενα, λίγο πολύ τα διαβάσαμε κι αλλού. Στην περίπτωση της εργασίας του Δημήτρη Ιωάννου ωστόσο, τα συμπεράσματα μπορεί να είναι 2-3 σελίδες, αλλά κατά τη γνώμη μου αρκετές από τις σελίδες πριν από αυτά, περιέχουν χρήσιμη πληροφορία. Κι αυτή τη πληροφορία σας παρουσίασα στα προηγούμενα 3 άρθρα με όσο πιο απλά λόγια μπορούσα.

Αυτό δε σημαίνει ότι δεν έχω τις ενστάσεις μου.

Η παραδοχή να αποκλείσουμε αποδόσεις κάτω του 1,90 ή 1,70 επειδή «δε υπάρχουν σίγουρα στοιχήματα στο ποδόσφαιρο», ας μου επιτρέψει ο αγαπητός Δημήτρης να πω ότι δεν συνάδει με την ποιότητα της υπόλοιπης εργασίας. Σύμφωνοι, τα αποτελέσματα ευνοούν την παραδοχή αυτή. Καμία αντίρρηση. Αντίρρηση έχω με τη δικαιολόγηση της παραδοχής, ειδικά όταν πρόκειται για διπλωματική εργασία και θα συμφωνήσω με το σχόλιο του Shadowcaster.

Να πω ένα εύκολο παράδειγμα: Είστε μετεωρολόγος και το μοντέλο σας προβλέπει 95% βροχή για αύριο. Έχετε την ευκαιρία να στοιχηματίσετε στο 1,20 ότι θα βρέξει αύριο. Αν δε θέλετε να στοιχηματίσετε είναι είτε γιατί είστε δειλός, είτε γιατί το 95% δεν είναι 95%.

Κι αν κάτι είναι 100% σίγουρο ότι θα συμβεί, όχι μόνο θα πρέπει να στοιχηματίσετε στο 1,01, αλλά πρέπει να ποντάρετε ΤΑ ΠΑΝΤΑ!

Κακή εντύπωση μου έκανε και η ανορθογραφία σε αρκετά μέρη της εργασίας. Ναι, όντως, τα αποτελέσματα μετράνε στο τέλος. Όχι, δεν είμαστε φιλόλογοι και δε θα κριθεί η εργασία από την ορθογραφία της. Απλά, δεν περίμενα να βρω τόσα λάθη σε μια εργασία αυτού του επιπέδου.

Λίγα λόγια για την καθεαυτή πρόβλεψη του μοντέλου τώρα, απαντώντας σε κάποιες ερωτήσεις ταυτόχρονα.

Το μοντέλο των νευρωνικών δικτύων υπολόγισε σημεία κι όχι πιθανότητες

Τα νευρωνικά δίκτυα υπολόγισαν το τελικό σημείο των αγώνων ποδοσφαίρου. Το 1, Χ, 2. Δεν το υπολόγισαν «στεγνά», αν και φαίνεται έτσι. Σε προηγούμενο κείμενο εξήγησα ότι στην ουσία το μοντέλο προβλέπει τιμές από το μηδέν ως τη μονάδα. Αναλόγως το πρωτάθλημα υπό εξέταση, οι τιμές αυτές χωρίζονται σε τρεις περιοχές. Οι τρεις περιοχές στο τέλος, αντιπροσωπεύουν τα τρία σημεία των αγώνων όπως τα βλέπει το ανθρώπινο μάτι.

Το νευρωνικό δίκτυο δηλαδή προβλέπει άπειρες τιμές μεταξύ 0 και 1. Για να απαντήσω σε άλλο σχόλιο του Betakos και πιθανόν να λύσω και απορία σας, ενδεχομένως να είναι δυνατή η συσχέτιση των τιμών αυτών με πιθανότητες. Μια εντελώς απλοϊκή σκέψη αποτελεί π.χ. το 0,394 να σημαίνει 39,4% πιθανότητα να βγει άσος. Πολύ πιθανόν να υπάρχει κάποια άλλη περιπλοκότερη μέθοδος, κατά την οποία οι τιμές δεν μεταφράζονται σε «ξερά» σημεία, αλλά σε πιθανότητες με άλλα λόγια.

Αν πράγματι υπήρχε αυτή η δυνατότητα, τότε θα ήταν πολύ ευκολότερη η σύγκριση των πιθανοτήτων με τις τρέχουσες αποδόσεις, σύμφωνα με τη θεωρία του value betting.

Όμως στην παρούσα εργασία δε συμβαίνει αυτό. Αυτός είναι κι ένας λόγος που πραγματοποιήθηκε η παραδοχή του αποκλεισμού των μικρών αποδόσεων. Εφόσον δεν υπολογίζετε πιθανότητες κι αποκλείοντας κάποια στοιχήματα/αποδόσεις καταλήγετε σε καλύτερα αποτελέσματα, γιατί να μην τα διαγράψετε;

Εξακολουθώ να έχω τις αντιρρήσεις μου για τη μέθοδο αυτή, που εγκυμονεί τον κίνδυνο του curve-fitting. Προσπαθώντας να βελτιστοποιήσουμε πολύ την πρόβλεψή μας, από ένα σημείο και μετά «ταιριάζουμε» πλέον τα αποτελέσματα στα δεδομένα μας κι όχι το αντίστροφο. Από την άλλη, τα λεφτά που θα βγάλει το τεράστιο ROI, θα διαλύσει τους φόβους μας!

Δε θυμάμαι, σας μίλησα για το τεράστιο ROI;

Επίσης, προσοχή χρειάζεται κατά την απόρριψη κάποιων στοιχημάτων/αποδόσεων. Παρατηρώ στα σχόλια προηγούμενων άρθρων την τάση των παικτών να αποκλείουν αποδόσεις, αφού καταλήξουν σε μια πιθανότητα επαλήθευσης των προγνωστικών τους (hit rate). Έχοντας δηλαδή ένα σύστημα με 50% πετυχημένα προγνωστικά, σκέφτονται να αποφύγουν αποδόσεις κάτω του 2,00 που δεν έχουν value θεωρητικά και να βγουν πολλάκις κερδισμένοι.

Φοβάμαι ότι αυτή η τακτική είναι λάθος.

Το σύστημα που κατασκευάσατε δεν παίρνει υπόψη του τις αποδόσεις ως μεταβλητές εισόδου κι έτσι στη ουσία δημιουργείτε αυτομάτως ένα νέο φίλτρο/κριτήριο, που δεν υπήρχε νωρίτερα. Επιπλέον, το σύστημα καταλήγει στο 50% hit rate λαμβάνοντας υπόψη όλους τους αγώνες, ακόμα κι εκείνους που οι εταιρίες στοιχημάτων προσφέρουν σε αποδόσεις 1,50 ή και χαμηλότερα. Αφαιρώντας αυτούς τους αγώνες, πλέον το σύστημα ΔΕΝ θα έχει 50% hit rate! Για του λόγου το αληθές, ανατρέξτε στους πίνακες της εργασίας που δημοσιεύθηκαν, για να διαπιστώσετε πώς το ίδιο μοντέλο κάνει λιγότερες σωστές προβλέψεις, όταν αγνοούνται χαμηλές αποδόσεις («ρεαλιστικό» μοντέλο ή «real world»).

Τέλος, η εργασία παράγει το δικό της σύστημα στοιχήματος και βασίζεται σε συγκεκριμένη μέθοδο. Άλλα συστήματα είναι δυνατόν να αντικρούουν κάποια συμπεράσματα, όπως εκείνο που αναφέρει ο Cashkanter στο δικό του σχόλιο. Κάποια συστήματα λαμβάνουν υπόψη τα κόρνερ, άλλα τα shots on goal, άλλα διαπιστώνουν ότι κανένα από τα δύο αυτά στατιστικά δεν κάνει διαφορά στη βιωσιμότητα του συστήματος.

Κάθε σύστημα είναι διαφορετικό.

Για αυτό άλλωστε, δεν μπορώ να σας απαντήσω ξεκάθαρα αν το σύστημα που επινοήσατε είναι καλό ή όχι! Μόνο αν μου παρουσιάσετε στοιχεία σαν αυτά της εργασίας, μπορεί να βγει κάποιο συμπεράσμα.

Το συμπέρασμα που βγάζω από όλα τα παραπάνω είναι ότι το στοίχημα κερδίζεται. Ένα σύστημα από αυτά που κερδίζουν, έχει να κάνει με τα νευρωνικά δίκτυα. Είναι αδύνατον να αμφισβητήσει κανείς τα 10ετή δεδομένα που παρουσιάστηκαν στην εργασία του Δημήτρη και τα αποτελέσματά του.

Το συμπέρασμα όμως που θέλω να συγκρατήσετε από τις χιλιάδες λέξεις που διαβάσατε είναι το πόσο δύσκολο είναι να κερδίσετε στο στοίχημα. Όχι, δε θέλω να σας αποθαρρύνω. Θέλω να σας κάνω ρεαλιστές. Να δείτε το στοίχημα όπως πραγματικά είναι, ακόμα και σε αποδόσεις κάτω του 1,70! Διότι το real world περιλαμβάνει όλα τα στοιχήματα, μικρών ή μεγάλων αποδόσεων.

Το μόνο σίγουρο, εκείνο που 100% συμβαίνει και θα στοιχημάτιζα με κλειστά μάτια είναι ότι ο τζόγος δεν είναι το εύκολο χρήμα που νομίζει ο κόσμος. Αν από τα τελευταία 4 άρθρα εξακολουθείτε να το πιστεύετε, σας εύχομαι καλή τύχη, αν και η τύχη μόνο τυφλή δεν είναι!

Ο Jim συνηθίζει να μετράει φύλλα στο Blackjack, να παίζει στοίχημα και πόκερ, αλλά και να επενδύει στις χρηματιστηριακές αγορές του κόσμου.

18 Comments

  1. Nick Papadakis on

    Πολύ ενδιαφέρον.
    Στους παίκτες ανθρώπους που ξέρουν τις ομάδες-άλογα-σκυλιά (ότι παίζουν) βασικά υπάρχει ένας μηχανισμός bio-feedback που λειτουργεί ΣΑΝ νευρωνικά δίκτυα.
    Είναι αλήθεια ότι στον παλιό ιππόδρομο τουλάχιστον οι τακτικοί έχαναν ιπποδρομία μόνο αν πάθαιναν καμιά γρίππη το χειμώνα και δεν την έπιανε η ασπιρίνη !
    Τα computers με την κατάλληλη τροφοδοσία και επεξεργασία μπορούν βέβαια κι αυτά να κάνουν δουλειά. Βασικά υπολογίζεις πιθανότητες από πολλές και διάφορες πηγές και τις παντρεύεις μεταξύ τους με τη μέθοδο της μεγίστης πιθανοφάνειας, ώστε να προκύψει μία υπερ-πιθανότητα. Οι μπούκ βέβαια τα επεξεργάζονται και αυτοί …
    Στην όλη διαδικασία παίζουν μεγάλο ρόλο και οι “σημειωτές”, αυτοί που συγκεντρώνουν τα δεδομένα και γίνεται η τροφοδοσία του συστήματος.

  2. Βασίλης on

    Μια ερώτηση σχετικά με τις αποδόσεις. Όταν αναφέρετε απόδοση 1,90 ενοοείτε του ΟΠΑΠ ή ένα μέσο όρο εταρειών από το ιντερνετ, γιατί από ότι ξέρετε υπάρχει διαφορά. Μια απόδοση στον ΟΠΑΠ 1,80, σε άλλη εταιρεία τη βρίσκεις και με 2,10.

  3. GiannisIordanou on

    Εκτός της πολύ ενδιαφέρουσας αυτής σειράς άρθρων, υπάρχουν σκέψεις για την πρακτική πλευρά της διπλωματικής ;

  4. Κατ’ αρχήν ευχαριστούμε για τα πολύ ωραία άρθρα.
    Θα ήθελα να πω λίγο τη γνώμη μου, ως απόφοιτος πληροφορικής με αγαπημένο μάθημα την Τεχνητή Νοημοσύνη (και φυσικά τα ΝΔ).
    Το έχω γράψει και αλλού: Τα νευρωνικά δίκτυα δεν κάνουν τίποτε παραπάνω, από το να βρίσκουν την εξάρτηση μίας εξόδου από μία είσοδο και μάλιστα μπορούν να βρουν και τις συσχετίσεις μεταξύ των εισόδων οι οποίες ΔΕΝ είναι γραμμικές (κάτι το οποίο ήταν αδύνατο παλαιότερα).Η είσοδός σου μπορεί να είναι από το χρώμα της φανέλας μέχρι το τι καιρό κάνει στο ματς.Ο φοιτητής βρήκε 10 εισόδους, αν θυμάμαι καλά.Θεωρώ ότι μπορεί να είναι και λίγες αυτές οι είσοδοι όμως είχε πετύχει διάνα,αφού είχε τέτοιο ROI.
    Επίσης θα πρέπει να αναφερθεί (κάτι το οποίο δεν έγινε απ’ ότι διάβασα) ότι όλοι οι αγώνες θα πρέπει να έχουν κάτι κοινό μεταξύ τους για να μπορέσουν να αποτελέσουν δείγμα.Δε μπορεί να βάζεις στο ίδιο τσουβάλι αγώνες του 1,40 ο άσσος και 2,40 ο άσσος και να περιμένεις από το δίκτυο να εκπαιδευτεί και να προβλέψει σωστά.Οι αποδόσεις είναι ένα σημείο που μπορεί να γίνει η ομαδοποίηση, πχ αγώνες από 1,90-2,30 ο άσσος.
    Εργαλεία που μπορεί να χρησιμοποιήσει κάποιος για τα ΤΝΔ, είναι δωρεάν και είναι το Weka και το Rapid Miner.Χρειάζονται όμως λίγο διάβασμα για να τα χρησιμοποιήσεις.Μάλσιτα το RM σου βγάζει και το ποσοστό επιτυχίας κάθε σημείου (κάτι που αναφέρθηκε στα άρθρα).
    Επίσης αν κάποιος έχει απορία, είμαι πρόθυμος να βοηθήσω.

    • Θα ήθελα να πω κι εγώ την γνώμη μου, ως (αρκετά παλιός) απόφοιτος Πληροφορικής με πτυχιακή στα Νευρωνικά Δίκτυα.

      Κατ’αρχάς, τα Ν.Δ. είναι ακατάλληλα για υπολογισμό πιθανοτήτων, λόγω του σχεδιασμού τους. Ο σχεδιασμός τους είναι για να βρίσκουν με ποιον τρόπο οι αρχικές παράμετροι επιδρούν στο τελικό αποτέλεσμα.

      Στο στοίχημα όμως, το αποτέλεσμα είναι “πιθανοτικό”, δηλ. με ίδιες αρχικές παραμέτρους μπορεί να έχουμε ΔΙΑΦΟΡΕΤΙΚΟ αποτέλεσμα. Η δομή ενός ΝΔ δεν “χωράει” πιθανοτικά αποτελέσματα, αλλά μόνον απόλυτα (“ντετερμινιστικά”).

      Κατά δεύτερον, η εν γένει υλοποίηση μου φαίνεται αρκετά προβληματική.

      Δεν υπολογίζονται πιθανότητες, αλλά “προβλέπεται” ένα σημείο.

      Με τι πιθανότητα όμως;

      Από ποια απόδοση και άνω αξίζει να παιχτεί;

      Πιθανότατα τα κερδοφόρα αποτελέσματα είναι “παραπλανητικά” (όχι σκόπιμα, δεν κατηγορώ κανέναν, έχω πέσει σε παρόμοια λάθη ο ίδιος πολλές φορές)

      Εννοώ ότι…Αν βάλεις ένα χταπόδι να βγάζει σημεία, όπως σε ένα παλιό Μουντιάλ, και παίζει με γκανιότα 2-3%, δεν θα μπει και πολύ μέσα, σε όσα ματς κι αν στοιχηματίσει.

      Εάν τώρα αφαιρέσεις τα ματς με αποδόσεις κάτω του 1,70 ή άνω του 2,60, διότι συνέβη σε αυτά να χάσει το χταπόδι πολλά λεφτά, το χταπόδι θα βγεις και στο συν !

      Εάν στην συνέχεις αφαιρέσεις τις Χ πρώτες και Υ τελευταίες αγωνιστικές, θα βγει ένα εντυπωσιακό συν.

      Δυστυχώς, όλα αυτά είναι μια πλάνη…και συγνώμη για την απαιδιοδοξία.

      • Σαν παλιός ΠΛΗ, νομίζω θα γνωρίζεις ότι οι έξοδοι εμφανίζονται σα σημεία σε επίπεδο δισδιάστατο, 3 διαστάσεων, 4 ή ν διαστάσεων.Όταν από τα x vectors, τα y/x έχουν ομαδοποιηθεί και βρίσκονται στην ίδια ομάδα , είναι δύσκολο για το νευρωνικό να σου απαντήσει ότι “από τα 100 δείγματα, τα 30 μου έδειξαν ότι θα είναι άσσος;
        Στο Weka δεν είναι τόσο προφανές αυτό, σε προτρέπω να δουλέψεις με το Rapid Miner που βγάζει ποσοστιαία αποτελέσματα κατευθείαν.

        • Δεν συμφωνώ ότι χρειάζεται οι αγώνες να έχουν κοινά χαρακτηριστικά. Πχ θα μπορούσαν να υπάρχουν εξίσου αγώνες με κίνητρο και χωρίς κίνητρο. Απλά θα πρέπει αυτή η πληροφορία (ύπαρξη κινήτρου στην προκειμένη περίπτωση) να υπάρχει σαν παράμετρος εισόδου.

          • Το ίδιο λέμε, ότι θα πρέπει να υπάρχει και “Κίνητρο” ως είσοδος.
            Για εμένα ακόμα καλύτερα (το έχω δοκιμάσει), να βγάζει εκτός τις τελευταίες αγωνιστικές.
            Αφού δε χρειάζεται να έχει κοινά χαρακτηριστικά το σετ των vectors (όπως λες), για πες μου γιατί παίρνει τα πρωταθλήματα ξεχωριστά το καθένα και δεν τα κάνει ένα ωραιότατο αχταρμά;

          • Θα μπορούσε να τα παίρνει και όλα μαζί. Σε αυτή την περίπτωση θα έπρεπε να περιλαμβάνει μια εξτρά είσοδο, το πρωτάθλημα (κωδικοποιημένο). Πιθανότατα θα χρειαζόταν μεγαλύτερη χωρητικότητα (περισσότερους νευρώνες στα ενδιάμεσα επίπεδα) και θα ήταν αρκετά πιο δύσκολο στην εκπαίδευση. Θα είχε μικρότερη ακρίβεια στις προβλέψεις, αλλά και μεγαλύτερη σταθερότητα.

            Ουσιαστικά είναι σαν να έχεις πχ. 5 ΝΔ σε ένα. Η είσοδος που αντιστοιχεί στο πρωτάθλημα, ενεργοποιεί σαν διακόπτης το κατάλληλο τμήμα του ΝΔ που κάνει τις προβλέψεις για αυτό το πρωτάθλημα.

          • Συμφωνούμε απόλυτα ως εδώ!
            Αφού λοιπόν η είσοδος “Πρωτάθλημα” δυσκολεύει τη μάθηση, γιατί μία αντίστοιχη είσοδος “Απόδοση άσσου” να μην τη δυσκολεύει;Το να δώσεις αποδόσεις άσσου σε ένα range από 1,10 – 15,00 ,απλά θα καταλήξεις να μπερδέψεις το νευρωνικό και να μη μάθει καλά.
            Για μένα το βέλτιστο είναι να “δεις” ποιά είναι τα κοινά σε αγώνες και να γίνει εκπαίδευση με χαλαρά όρια όπως είπα.
            Το καλύτερο όμως απ΄ όλα είναι οι σωστές είσοδοι, ποιά αίτια δηλαδή επηρεάζουν στην πραγματικότητα την έκβαση του αγώνα.

          • Η απόδοση 1,10 αντιστοιχεί σε πιθανότητα 90% ή 0.9 , ενώ η απόδοση 15,00 σε πιθανότητα 7% ή 0.07 . Οι τιμές 0.0 έως 1.0 είναι τιμές που μπορεί να χρησιμοποιήσει ένας νευρώνας. Δεν θα έχει πρόβλημα το ΝΔ, αν και πράγματι εάν τα κατηγοριοποιήσει κανείς με βάση την απόδοση πχ του άσσου, θα έχει ευκολότερη εκπαίδευση. Αλλά θα έχει και πολύ λιγότερα δείγματα για να χρησιμοποιήσει στην εκπαίδευση.
            Φυσικά, οι σωστές είσοδοι επηρεάζουν πολύ. Οι μπουκ χρησιμοποιούν πολύ περισσότερες εισόδους, πχ διαιτητής, καιρός, κίνητρο, απουσίες, …. και φυσικά, το φόρτωμα στα σημεία, πχ δυνατά πονταρίσματα σε “μη εμπορικά” ματς μπορεί να είναι ένδειξη για “inside information”

          • Διαλεγμενα δεδομενα ωστε να βολευουν, να ειναι κοντα οι αποδοσεις? Σχεδων rand()%3 για το αποτελεσμα? Και οταν καταλαβουμε την αδυναμια, αρχιζουμε να προσθετουμε ή αφαιρουμε inputs που νομιζουμε οτι θα δικαιωσουν αυτο που θελουμε να παρατηρησουμε.. Οι μπουκ ειναι πολυ πιο μπροστα. Ειναι σαν να προσπαθεις να καψεις τον ηλιο με ενα καθρεφτη και μεγεθυντικο φακο. Συμφωνω με Σακης σε ολα.

          • Χμ, δε θα το έλεγα αυτό.Υπάρχουν περιοχές ανεξερεύνητες για μένα που αξίζει να παλέψεις με τους μπουκ.

          • Σάκη και Soto ευχαριστούμε για τα σχόλια σας. Το συγκεκριμένο ζήτημα με έχει απασχολήσει αρκετά χωρίς να έχω βρει ικανοποιητική απάντηση.Σίγουρα όσο πιο ομοιογενή τα δεδομένα τόσο καλύτερη η πρόβλεψη αλλά αυτό εμποδίζει τη δημιουργία μεγάλου σετ δεδομένων, που είναι εξίσου σημαντική παράμετρος.( Ποιο θεωρείται ότι είναι πιο σημαντικό? Μέγεθος δείγματος ή ομοιογένεια των δεδομένων?).
            Οπότε το ερώτημα μου είναι: 1)Η εισαγωγή ενός input που θα κωδικοποιεί τα δεδομένα ( ανά πρωτάθλημα ή ανά αγωνιστικό τρίμηνο ή με βάση την απόδοση του άσου ή και τα τρία μαζί) μπορεί να βοηθήσει το νευρωνικό στη ομαδοποίηση των δεδομένων ή θα το “μπερδέψει”?

          • Η ομοιογένεια είναι το βασικό για μένα χωρίς να είναι απαραίτητο να έχεις για παράδειγμα είσοδο μόνο 1,40 ή μόνο 1,60 κλπ.Δείγματα, θεωρώ ότι 3-4 χρονιές από κάθε πρωτάθλημα είναι αρκετές.

  5. Μπορείς, αλλά τα δίκτυα θα καταλήγουν σε αριθμητικές τιμές, οπότε θα πρέπει κάπως να αντιστοιχείς το π.χ. 23 με ένα σημείο. Πώς θα το κάνεις, αυθαίρετα; Την ίδια στιγμή, η εργασία παρουσιάζει και δικαιολογεί μια καλή τεχνική. Γιατί να μην την ακολουθήσεις;

  6. “Αν πράγματι υπήρχε αυτή η δυνατότητα, τότε θα ήταν πολύ ευκολότερη η σύγκριση των πιθανοτήτων με τις τρέχουσες αποδόσεις, σύμφωνα με τη θεωρία του value betting.”
    Σκέφτηκα να δοκιμάσω τη δυνατότητα που προσφέρει η συνάρτηση poisson στο excel.. Τη δοκιμάζω στη φετινή αγωνιστική χρονιά της Α’ Βραζιλίας, έχοντας προσθέσει επιπλέον τα κόρνερ και τα shots on goal.
    Δοκίμασα να προσθέσω και το DDGT (τη διαφορά των μέσων όρων διαφοράς συνολικών τερμάτων της γηπεδούχου και της φιλοξενούμενης), αλλά εκεί αντιμετώπισα πρόβλημα. Όταν τα γκολ που έχει δεχθεί μία από τις δύο ομάδες είναι περισσότερα από αυτά που σημειώσει, τότε το αποτέλεσμα βγαίνει αρνητικός αριθμός και η συνάρτηση επιστρέφει λάθος.

Leave A Reply

Time limit is exhausted. Please reload CAPTCHA.

Exit mobile version