Пријестоље: Платформа спортског предвиђања

Тхроне је платформа за спортско предвиђање помоћу машинског учења. Корисницима пружа такмичења у живом такмичењу, податке, функције, модуле за тестирање и много више функција како би се олакшала употреба квантитативних метода у спорту. Овај пост представља Тхроне, његову мотивацију и начин на који можете започети.

Спорт + Машинско учење

Моје прво излагање кориштењу статистике и машинском учењу за спортске податке било је као постдипломац. Била ми је потребна апликација за коришћење нелинеарних метода државног простора, што би обично подразумевало пројекат који укључује финансијске временске серије, али осећао сам се као да радим нешто другачије. Па сам уместо тога погледао како користим ове технике за вађење сигнала на спортским подацима - како можемо извући способност тимова из података и њихову еволуцију током времена?

Дикон-Цолес (1996) је основни рад у спортском предвиђању фудбала

Врло брзо ми је постало јасно да је то интересовање мање нејасно него што сам мислио, и да постоји прилично утврђен академски и комерцијални интерес за то поље. Слично томе, постојала је и добро успостављена сцена блоговања у спортској аналитици. Дакле, било је пуно постојећих садржаја за рад. Али приметио сам горљив проблем.

Препреке за стварање квантитативних спортских модела су велике. Нарочито:

  • Подаци су скупи, како у директним трошковима тако и у временским трошковима (вађење и одржавање). Подаци такође долазе из различитих извора што значи изградњу цевовода и извршавање напорних, али пресудних задатака подударања ИД-а.
  • Знање о домену је важно, што значи да морате уложити време да стекнете интуицију за оно што су прави алати за проблем. Они који се не знају обично имају потицај да шуте, како би одржали икакву предност коју би могли имати на тржиштима предвиђања.
  • Инфраструктура је скупа, на пример, изградња адекватног модула за тестирање унапред како би се разумео извор ваших недостатака и модела, праћење перформанси у односу на јавни репер за разумевање перформанси уживо и израчунавање дневних функција како бисте могли да предвидите последње догађаје.

Али с обзиром да је постојало интересовање за предвиђање спорта статистичким методама, природно је било питати могу ли се ове препреке за улазак смањити како би се повећала приступачност терену. Мој одговор је био Тхроне: платформа за спортско предвиђање користећи статистику и машинско учење.

Представљамо престо

Бодовање се заснива на релативном губитку дневника корисника код јавности, што одређује хипотетички раст банкрота

Суштина престола је да он домаћин такмичења за предвиђање уживо за спортове, укључујући НФЛ, НБА, НХЛ, Премиер лигу и друге популарне лиге. Учествовање је једноставно као подношење вероватноће на платформи, која ће потом снимити вашу изведбу у односу на друге кориснике.

Такмичења за машинско учење нису нови концепт - и то само по себи није иновација. Али фокус на спорт даје Тхронеовим такмичењима посебан укус који је различит од постојећих предвиђања:

  • Оцењујете вас само на ливе перформансама - ми вам дајемо историјске податке и неке бесплатне функције, али вас не оцењују на основу задржаних скупа података. Оцијењени сте само према својим предвиђањима за надолазеће догађаје. То је у супротности са платформама које процењују на основу тестног скупа за вишекратну употребу.
  • Резултат се заснива на релативном губитку дневника (цросс ентропи разлика) - процењујемо вас у односу на скуп јавно доступних предвиђања, што значи да имате директног противника за надметање и упоређивање модела са. Ово је посебно корисно за разумевање како ваш модел може пропасти.
  • Инжењеринг значајки је најважнији - многа такмичења вам дају низ непознатих функција и захтијевају да се на њима обучавају алгоритми црне кутије. Алгоритми црне кутије могу бити ефикасни, али Тхроне наглашава стварање хипотеза, што укључује дизајнирање функција са доменом знања о спорту како би се створили модели који могу наћи ивице пред јавношћу.
Свој учинак биљежимо на основу јавних мјерила

Живи стил предвиђања такмичења такође ствара снажне подстицаје за изградњу одређених врста модела, нарочито:

  • Производна премија - познато решење Нетфлик Призе заправо није имплементирано јер је било претешко ставити у производњу. Будући да Тхроне процењује на основу предвиђања уживо, мораћете да направите моделе који су одрживи за производна окружења.
  • Премија интерпретабилности - шта се дешава ако ваш модел почне лоше да делује предвиђања уживо? Често су нам потребни модели да буду интерпретативни тако да можемо пронаћи и исправити недостатке модела. Решења за црне кутије можда и даље делују, али у окружењу за живо предвиђање постоји већи нагласак на једноставнијим, али интерпретативним моделима.
  • Временска премија робусности - природа спорта, укључујући правила, стратегије и врсте играча, мења се током времена. Модели морају да одговарају не-стационарно директно или да буду опремљени тако да имају довољно робусне шаре да би стекли сталну предност. Корисници морају поштовати временску димензију података.
Препоручујемо вам да ролните сопствене функције, али Тхроне вам даје главу са картицама за откључавање функција

Као платформа, Тхроне вам такође даје алате за помоћ у конструисању ваших модела:

  • Подаци: дајемо вам пуне историјске податке о резултатима за сваки спорт који обично обухватају 10+ година резултата за сваку лигу.
  • Карактеристике: слободно направите сопствене функције, али ми имамо функције за почетак. Ако дајете добра предвиђања, наградићемо вас КСП-ом који можете користити да бисте добили наше унапред изграђене функције - представљене као колекционарске картице.
  • Поновно тестирање: дајемо вам бесплатан повратни поступак тако да можете процијенити перформансе вашег модела у односу на јавност и стећи осјећај гдје ваш модел може успјети или пропасти.
Модул за тестирање уназад омогућава вам да процените свој модел пре него што направите предвиђања уживо

Све ове функције су нашим регистрованим корисницима бесплатне за приступ.

Наравно, ако не желите учествовати у такмичењима, већ само желите да се играте са неким бесплатним спортским подацима, то је такође сјајно! Молим те нокаутирај се!

Почетак

Регистровати се лако: само се повежите на веб страницу користећи свој постојећи ГитХуб налог и спремни сте за преузимање података, прављење модела и подношење предвиђања. Имамо добар спектар спортова и такмичења које можете изабрати, а ми ћемо повећати број такмичења у наредним месецима подложним интересу заједнице.

Овде имамо водич за почетак рада како користити доступне податке за прављење и слање предвиђања. За додатна питања везана за овај уводни чланак, овде састављам ФАК.

Имамо и Слацк канал на којем с нашом заједницом можете опћенитије разговарати о платформи и спортском предвиђању и добијати савјете других корисника о започињању с изградњом модела.

Лично, ово је пројекат изграђен у слободно време у последњих 12 месеци. Изузетно сам узбуђен што видим како људи користе платформу, а такође сам узбуђен због могућности које успешна заједница усредсређена на спортско предвиђање и аналитику може да створи.

Идемо!

Росс