Pengantar Model Campuran – Analytics.Bet

{displaystyle {frac {1}{{frac {1}{sigma _{0}^{2}}}+{frac {n}{sigma ^{2}}}}}left( {frac {mu _{0}}{sigma _{0}^{2}}}+{frac {sum _{i=1}^{n}x_{i}}{sigma ^ {2}}}kanan),kiri({frac {1}{sigma _{0}^{2}}}+{frac {n}{sigma ^{2}}}kanan) ^{-1}}

Saya sedang mengobrol dengan seorang teman tentang model Inferensi Bayesian yang telah saya bantu dia buat. Saya mencoba menjelaskan kepadanya bagaimana cara kerjanya – jawabannya adalah “itu sulit untuk dipahami”. Dan dia benar – pria itu cukup cerdas, hanya saja dia belum pernah mengalami pemikiran seperti ini sebelumnya.

Saya memiliki banyak kritik terhadap sistem pendidikan aktuaria. Ada terlalu banyak ujian, terlalu sulit, terlalu mahal dan tujuan utamanya tampaknya adalah untuk menciptakan hambatan masuk ke profesi untuk menjaga gaji tetap tinggi – sebuah taktik yang berhasil dengan baik di abad ke-20 tetapi sekarang berbahaya bahwa ada semua jenis ilmuwan data di luar sana yang bersaing dengan kita. Namun, ada satu mata pelajaran yang tampaknya lebih banyak dibahas dalam kurikulum aktuaria daripada di tempat lain, dan itu membawa saya sejauh ini baik dalam karir dan hobi saya sehingga hampir membuatnya layak untuk menanggung semua hal lainnya. Ini disebut “teori kredibilitas”.

Teori kredibilitas adalah seperangkat alat untuk membantu Anda mengatasi masalah umum ukuran sampel kecil. Ada banyak masalah dunia nyata di mana Anda memiliki kumpulan data tetapi tidak sebesar yang Anda inginkan, dan menerima data dan menolaknya akan menjadi keputusan yang buruk. Ini membuka seluruh spektrum di antaranya dengan menyediakan serangkaian rumus untuk memberi tahu Anda berapa banyak bobot, antara 0% dan 100%, yang harus Anda berikan ke kumpulan data yang Anda amati. Seperti siswa yang baik, saya mempelajari rumus, menghafalnya dan menerapkannya untuk lulus ujian. Butuh waktu sepuluh tahun bagi saya untuk mendapatkan pemahaman penuh tentang apa yang sebenarnya mereka maksudkan dan bagaimana mereka dapat digunakan untuk mengukur proses belajar dari informasi. Ini, pembaca yang budiman, adalah upaya saya untuk menyelamatkan Anda dari sepuluh tahun itu dengan menjelaskan dasar teori kredibilitas; model campuran.

Untuk mengilustrasikan konsep tersebut, kami akan membuat model untuk memprediksi Poin Tambahan (EPA) quarterback NFL per game. Jika saya benar-benar tertarik untuk memodelkan kinerja QB, saya akan membuat beberapa pilihan yang sedikit berbeda, tetapi kami benar-benar di sini untuk menjelaskan cara kerja model campuran dan ini adalah cara paling mudah untuk melakukannya.

Untuk memodelkan EPA quarterback tertentu dalam permainan apa pun, kami akan menggunakan teman lama kami yang andal, distribusi Normal. Untuk membangun distribusi normal, Anda memerlukan dua bahan – rata-rata (sebut saja M) dan standar deviasi (sebut saja S).

EPA per game ~ Normal (M, S)

S adalah ukuran varians acak yang merupakan bagian alami dari sepak bola NFL. Terkadang QB yang bagus memiliki game yang buruk, dan terkadang QB yang buruk memiliki game yang bagus. Kami akan menyederhanakan model dengan mengasumsikan bahwa semua quarterback memiliki nilai S yang sama.

M adalah nilai rata-rata atau yang diharapkan dari EPA; dengan demikian, akan lebih tinggi untuk quarterback yang lebih baik dan lebih rendah untuk quarterback yang lebih buruk. Tapi bagaimana kita membedakan antara quarterback yang lebih baik dan lebih buruk? Kami tahu bahwa Drew Brees (rata-rata EPA 7,28 selama 292 pertandingan) adalah quarterback yang baik dan kami cukup yakin bahwa Mark Sanchez (rata-rata EPA -2,10 selama 84 pertandingan) adalah pemain yang buruk, tetapi bagaimana dengan Drew Lock (rata-rata EPA 5,18 lebih dari 5 pertandingan) atau Tua Tagovailoa (0 pertandingan)?

Inilah bagian yang sulit – kita tidak tahu apa M setiap quarterback. Dunia nyata tidak seperti video game di mana Anda dapat melihat profil pemain dan membaca peringkat keahliannya. M adalah contoh dari sesuatu yang disebut “variabel laten” – sesuatu yang pasti nyata tetapi tidak dapat diamati secara langsung, hanya secara tidak langsung. Melihat EPA rata-rata karir pemain, Anda mendapatkan beberapa indikasi tentang apa M mereka, tetapi Anda melihatnya melalui kabut keacakan game-to-game yang meningkat secara bertahap seiring dengan peningkatan ukuran sampel.

Contoh lain dari variabel laten:

  • Keterampilan mengemudi Anda (secara tidak langsung diamati oleh frekuensi kecelakaan mobil dan/atau tilang Anda)
  • Kecerdasan Anda (secara tidak langsung diamati dari nilai sekolah, tes IQ, prestasi kerja, tes bakat, dll)
  • Kemampuan golf Anda (secara tidak langsung diukur dengan handicap Anda, yang merupakan rata-rata dari skor Anda sebelumnya yang disesuaikan dengan tingkat kesulitan lapangan)

Jadi mari kita rekap.

EPA untuk quarterback dalam permainan ~ Normal (M quarterback itu, S yang dibagikan setiap quarterback).

Baik M dan S tidak diketahui. S mudah diketahui karena hanya ada satu S dan kami memiliki ribuan game bersejarah yang dapat kami gunakan untuk memperkirakannya. M sulit untuk diketahui karena ada begitu banyak Ms – satu untuk setiap quarterback yang pernah bermain – dan untuk beberapa dari mereka kami memiliki sangat sedikit data untuk dikerjakan (atau tidak ada sama sekali).

Sekarang, inilah bagian yang menyenangkan: Kami akan memodelkan M untuk setiap quarterback menggunakan distribusi Normal LAINNYA:

M_M Quarterback ~ Normal (M_M Quarterback, M_S Quarterback)

Anda dapat menganggap ini sebagai distribusi dari semua kemungkinan quarterback (hipotetis). Beberapa sangat baik, beberapa sangat buruk, sebagian besar rata-rata.

Jika kita mengetahui M_M dan M_S, kita mengetahui segala sesuatu yang perlu diketahui tentang M. Jadi, model kita memiliki tiga parameter: M_M, M_S dan S. Ini disebut “model campuran normal-normal”.

Sebelum kita menyesuaikan parameter ini, mari kita bicara tentang apa artinya.

M_M adalah perkiraan terbaik kami tentang tingkat keterampilan quarterback.

S adalah varians acak game-to-game dalam kinerja quarterback mana pun.

Apa itu M_S? Baik S dan M_S adalah standar deviasi, apa perbedaan di antara mereka?

M_S adalah standar deviasi dari perkiraan kami tentang M. Artinya, ini mewakili tingkat kepercayaan kami di sekitar perkiraan M_M.

S2 disebut “proses varians” sementara M_S2 disebut “varians parameter”.

M_M dan M_S keduanya merupakan ukuran dari keyakinan. M_M adalah jawaban atas pertanyaan “seberapa baik kami percaya quarterback ini, berdasarkan informasi yang tersedia bagi kami?” M_S adalah jawaban atas pertanyaan “seberapa yakin kita dengan keyakinan itu”? Untuk Brees, “dia sangat bagus” dan “kami sangat percaya diri dalam penilaian itu”. Untuk Tagovailoa, “rata-rata, kurasa?” dan “tidak percaya diri sama sekali, mungkin dia adalah Brees berikutnya, mungkin dia adalah Sanchez berikutnya”.

Jadi inilah keajaiban dari semuanya… baik M_M dan M_S bisa mempelajari. Saat quarterback mengumpulkan lebih banyak game dan kami mengumpulkan lebih banyak informasi, dua hal terjadi.

  • M_M diperbarui untuk mencerminkan informasi baru. Jika M_M adalah 3 EPA per game dan orang kami memasang 20 EPA dalam sebuah game, perkiraan baru kami tentang M_M untuk game berikutnya akan lebih dari 3. Jika dia memasang -10, perkiraan baru kami akan lebih kecil.
  • M_S menyusut, karena perkiraan baru kami tentang M_M akan didasarkan pada lebih banyak informasi daripada perkiraan M_M sebelumnya. Ukuran sampel yang lebih besar berarti lebih percaya diri, yang berarti M_S lebih rendah.

Tapi mari kita tidak maju dari diri kita sendiri. Sebelum kita mulai memperbarui, kita perlu menetapkan titik awal. Bagaimana kita bisa memperkirakan EPA quarterback per game tanpa mengetahui sejarah quarterback itu? Kita dapat menggunakan hal-hal lain yang kita ketahui, seperti posisi draft quarterback dan di mana mereka berada dalam karir mereka (QB cenderung meningkat secara signifikan antara tahun pertama dan kedua).

Karena kita bekerja dengan distribusi normal, regresi linier biasa akan berhasil di sini…hampir. Satu-satunya pemikiran yang harus saya lakukan adalah mengubah regresi saya untuk memperkirakan varians proses (antar game untuk quarterback yang sama) dan varians parameter (antara quarterback) pada waktu yang sama.

Ini memberikan yang berikut:

Estimasi awal M_M = 3,224 – 0,478 * log (posisi draft) – 1,737 * (tahun pemula)

Perkiraan awal M_S = 3.030

S = 10,034

Untuk Drew Brees (draf ke-32, bukan tahun pemula), perkiraan awal adalah M_M = 1,567 dan M_S = 3,030.

Untuk Tua Tagovailoa (draf ke-5, tahun pemula), perkiraan awal adalah M_M = 0,718 dan M_S = 3,030. Karena kami tidak memiliki data kinerja Tua, ini juga merupakan perkiraan terakhirnya!

Sekarang, bagaimana kita mengambil perkiraan ini dan memperbaruinya dengan kinerja sebenarnya seorang quarterback? Saya telah menulis sebelumnya tentang Teorema Bayes dan Prioritas Konjugasi, tetapi berkat Wikipedia seseorang telah melakukan semua aljabar dan kalkulus sehingga kita tidak perlu melakukannya. Halaman Wikipedia tentang Conjugate Priors adalah Alkitab saya. Melihat campuran Normal-normal, (perkiraan M_M yang diperbarui, perkiraan yang diperbarui M_S2) diberikan oleh:

{displaystyle {frac {1}{{frac {1}{sigma _{0}^{2}}}+{frac {n}{sigma ^{2}}}}}left( {frac {mu _{0}}{sigma _{0}^{2}}}+{frac {sum _{i=1}^{n}x_{i}}{sigma ^ {2}}}kanan),kiri({frac {1}{sigma _{0}^{2}}}+{frac {n}{sigma ^{2}}}kanan) ^{-1}}

Menerjemahkan dari nomenklatur Wikipedia ke kami:

μ0 adalah perkiraan awal kami dari M_M

σ0 adalah perkiraan awal kami dari M_S

adalah S

n adalah jumlah pertandingan yang kami amati dari quarterback

xSaya adalah total EPA yang kami amati dari quarterback

Berikut tampilan untuk beberapa QB yang dipilih:

Anda dapat melihat “belajar” beraksi di sini – quarterback veteran memiliki M_S yang jauh lebih kecil yang berarti kami dapat mematok mereka dengan tingkat kepercayaan yang jauh lebih tinggi daripada quarterback yang kurang berpengalaman. Anda dapat memvisualisasikan proses “belajar” ini dengan mengambil satu quarterback, katakanlah Drew Brees, dan menghitung ulang M_M dan M_S-nya sepanjang kariernya satu pertandingan pada satu waktu:

Garis biru menunjukkan bagaimana M_M Brees berevolusi dari game 1 ke game 291. Garis oranye dan abu-abu menunjukkan “interval kepercayaan 95%”, yaitu rentang dari M_M – 2*M_S hingga M_M + 2*M_S. Lihat bagaimana rentang secara bertahap menyempit dari waktu ke waktu? Itu karena M_S menyusut seiring bertambahnya ukuran sampel kami.

Sekali lagi, maksud di sini bukan untuk mengajari Anda cara memodelkan EPA quarterback, ini untuk menunjukkan kepada Anda bagaimana model campuran bekerja…jadi ada beberapa nuansa yang sengaja saya tinggalkan (seperti, bagaimana menangani quarterback yang tidak dirancang atau bagaimana menangani penyimpangan ke atas secara keseluruhan di EPA liga-lebar selama 20 tahun terakhir) demi menjaga hal-hal sesederhana dan sejelas mungkin. Dan sekali lagi, konsep-konsep ini TIDAK mudah untuk dipahami, terutama beberapa kali pertama Anda menemukannya. Tapi, saya akan mengatakan itu pasti sepadan dengan usaha karena ini membuka seluruh dunia kemungkinan untuk membangun model yang dapat menangani ukuran sampel kecil, besar atau nol dan yang memasukkan informasi baru saat muncul.

Jika Anda telah sampai sejauh ini, pembaca yang budiman, selamat! Saya akan meninggalkan Anda dengan satu trik lagi … “distribusi prediktif” (yaitu, distribusi EPA quarterback dalam permainan BERIKUTNYA) dari campuran normal-normal juga normal! Mudah-mudahan Anda sudah menebak sekarang bahwa artinya adalah M_M yang direvisi. Tapi berapa standar deviasinya? Itu mematuhi sesuatu yang disebut “hukum varians total”:

Varians total = varians proses + varians parameter

Dimana varians adalah standar deviasi kuadrat. Ingatlah bahwa S2 adalah varians proses dan M_S2 adalah varians parameter.

Inilah bagan kami di atas, dengan distribusi prediktif ditambahkan:

Lihat bagaimana deviasi standar prediktif semuanya cukup dekat satu sama lain? Dalam istilah matematis, ini berarti bahwa untuk satu hasil permainan, varians proses mendominasi varians parameter. Dalam istilah non-matematis, ini diterjemahkan menjadi salah satu ekspresi paling terkenal dalam sejarah NFL:

“Pada hari Minggu tertentu, tim mana pun di NFL dapat mengalahkan tim lain mana pun.”

Hak cipta dalam konten blog ini dimiliki oleh Plus EV Sports Analytics Inc. dan semua hak terkait dilindungi undang-undang tersebut.