RapidMiner数乐鱼平台进入据科学竞赛3:梦幻足球

sgenzersgenzer 管理员,版主,员工,RapidMiner认证分析师,社区经理,成员,大学教授,PM版主职位:2959年社区经理
2018年12月编辑 帮助

你好,快速矿工FFL-Logo.png

是的,在这里!设置如下:

“梦幻足球”是一款在线游戏,用户可以从目前的NFL球员名单中选择一个由9名美国橄榄球运动员组成的“梦幻球队”。这可以是每个赛季一次(“赛季游戏”)或每周一次(“每日幻想”或“DFS”)。一旦玩家选择了一支梦幻球队,玩家的得失就取决于他们的球员在NFL赛季中的表现。这些玩家必须在同一支NFL球队;事实上,他们通常是来自不同球队的球员。本次比赛将侧重于DFS,而不是赛季比赛。

在线玩DFS主要有两大网站平台:DraftKingsFanDuel.在任何一个平台上,目标都是一样的:最大化“幻想点”(FPTS),同时保持在给定的“工资预算”(Salary)之内。当你的梦幻球队的球员在一周的比赛中表现出色时,就可以获得FPTS。

因此,这里的关键思想是寻找价值一个球员:DK薪水vs FPTS。我们将此值定义为每1000美元工资的FPTS,或“FPTS_Ratio”。

这项挑战的目标是,给定所有历史球员信息和DK工资(截至并包括2017年12月18日的比赛),预测2017年NFL赛季第16周(12月23日至25日)所有球员的FPTS_Ratio具有最低的均方根误差(RSME)。

获得NFL足球统计数据很容易做到现在由于免费提供nflscrapR-data数据集由卡内基梅隆大学的罗恩·尤尔科、山姆·文图拉和马克斯·霍洛维茨共同创作张贴在Kaggle.com上.它有很好的文档,很容易从GitHub页面.任何时候都将使用此存储库的精确克隆。

此外,我们还包含了一个单独的数据集“RotoGuru-DK.csv”,其中包含了从2014年第1周到2017年第5周每周的DraftKings FPTS和工资(来源:rotoguru.com):

很明显,《梦幻足球》玩家使用的大部分信息是非结构化数据——尤其是网站文本。因此,允许在您的模型中使用以下外部资源:http://www.espn.com/fantasy/footballhttps://football.fantasysports.yahoo.comhttps://www.dailyfantasysports101.com:)

所有参赛作品均需张贴在这个线程中使用整个过程的XML使用提供的流程模板如果以其他形式提交,将不被接受。

提交截止日期为2017年12月19日23:59:59 UTC。

NFL将从12月23日开始进行第16周比赛,一直持续到12月25日。当应用于第16周的数据集时,具有最低的三个RSMEs的模型将成为比赛的获胜者。这是最终的测试集-在提交之前没有人可以访问它。获奖者将在2017年12月25日之后的某个时候在比赛的帖子中公布。

RapidMiner将为获奖者颁发以下奖品:

1地点:750美元(VISA借记卡/礼品卡)

2nd地点:250美元(VISA借记卡/礼品卡)

3.理查德·道金斯地点:100美元(VISA借记卡/礼品卡)

4th地点:RapidMiner“闪电”t恤

5h地点:RapidMiner“闪电”t恤

6th地点:RapidMiner“闪电”t恤

注意:这只是一个总结。比赛和规则的完整描述附在这篇文章后面。开始前请仔细阅读!!

差不多就是这样。祝大家好运,祝最好的建模者获胜!

斯科特

标记:
MariusHelf 女士8125527706

答案

  • sgenzersgenzer 管理员,版主,员工,RapidMiner认证分析师,社区经理,成员,大学教授,PM版主职位:2959年社区经理

    大家好,梦幻足球快速矿工

    希望这次挑战进展顺利。这个帖子一直很安静,所以如果你喜欢,请开始聊天!

    正如你可能已经注意到的,RapidMiner Studio 8.0今天发布了。卫矛! !所以很明显,您可以使用RapidMiner Studio 8.0以及7.6.1,7.6.2或7.6.3提交您的参赛作品。

    祝大家好运!

    斯科特

  • sgenzersgenzer 管理员,版主,员工,RapidMiner认证分析师,社区经理,成员,大学教授,PM版主职位:2959年社区经理
    大家好,提醒一下,比赛还有四天就结束了。所有的解决方案必须张贴在这个线程使用提供的过程模板(见原始帖子)。其他参赛作品将不获接纳。祝大家好运!!

    斯科特

  • maros_plsikmaros_plsik 成员职位:4贡献我

    你好,所有人:)

    让我自我介绍一下——我是一名来自欧洲的大学生,最近对数据科学及其相关的事情非常感兴趣。乐鱼平台进入我想我至少应该尝试一下这个挑战,因为它似乎准备得很充分,我认为它可以帮助我学到很多东西。

    我知道这个挑战很快就结束了,但我想尝试至少建立一些简单的,功能性的模型。

    我有一个问题——RotoGuru-DK数据集是完整的吗?它提到它包含了从2014年第1周到2017年第5周每周的游戏。但它只包含每年的前9周,而10-17周不包括在内。这是对的还是错的?

    谢谢你的回答,也谢谢你在挑战上的出色表现:)

  • sgenzersgenzer 管理员,版主,员工,RapidMiner认证分析师,社区经理,成员,大学教授,PM版主职位:2959年社区经理

    你好@maros_plsik-啊哈,你说得对。我想那份数据文件可能是我搞错了。用这个代替吧。

    斯科特

    maros_plsik
  • florian_zieglerflorian_ziegler 成员职位:2贡献我

    你好,斯科特,

    我还有一个问题。因为我们不允许改变灰色块,所以我们也不允许对DK工资属性做任何数据输入,对吗?因为我的模型在数据输入方面表现得更好。模板处理将所有工资为0的球员排除在外。

    致以最亲切的问候

    弗洛里安

  • sgenzersgenzer 管理员,版主,员工,RapidMiner认证分析师,社区经理,成员,大学教授,PM版主职位:2959年社区经理

    你好@florian_ziegler-不,你可以的。把它放到第5步。

    斯科特

  • florian_zieglerflorian_ziegler 成员职位:2贡献我

    所以,这是我的意见。我只使用了RotoGuru-DK数据集,但也许,这个模型仍然可以做出一些很好的预测。:)

  • yzanyzan 成员职位:66独角兽

    我不确定它是否符合所有的要求。如果有需要修改的地方,请告诉我。

  • maros_plsikmaros_plsik 成员职位:4贡献我

    我也在提交我的解决方案。问题是,我已经在我自己的空窗口中创建了整个过程(不是在您提供的模板中),现在我遇到了从我的过程到模板的所有操作符的问题。我已经上传了我的文件,我要把它重写到模板,希望它会在几分钟内完成。我希望你没事。谢谢理解。

    < ?xml version="1.0" encoding="UTF-8"?> <过程version = " 8.0.001”>

    <过程扩展= " true " >


    < /操作符>





    <列出关键= " filters_list " >

    < / >列表


    < /操作符>
















    < /操作符>

















    <列出关键= " comparison_groups " / >


    < /操作符>



















    <过程扩展= " true " >


















    <列出关键= " expert_parameters " / >
    < /操作符>




    > < /过程
    < /操作符>

    <列出关键= " function_descriptions " >


    < / >列表

    创建FPTS_Ratio属性
    < /操作符>



    <列出关键= " set_additional_roles " / >
    设置FPTS_Ratio为目标
    < /操作符>



    <列出关键= " rename_additional_attributes " / >
    < /操作符>


    < /操作符>





    <过程扩展= " true " >


    < /操作符>





    <过程扩展= " true " >



    < /操作符>

    <列出关键= "属性" >



    < / >列表
    < /操作符>

    <列出关键= "属性" >



    < / >列表
    < /操作符>

    <列出关键= "属性" >



    < / >列表
    < /操作符>



    <列出关键= " rename_additional_attributes " >








    < / >列表
    < /操作符>
















    <列出关键= "列" / >
    < /操作符>



    < /操作符>



    <列出关键= " rename_additional_attributes " / >
    < /操作符>












    > < /过程
    < /操作符>




    < /操作符>







    > < /过程
    < /操作符>




    < /操作符>

    <列出关键= " function_descriptions " >



    < / >列表

    < /操作符>

    <过程扩展= " true " >


    < /操作符>




    <列出关键= " filters_list " >

    < / >列表


    < /操作符>













    < /操作符>















    < /操作符>















    < /操作符>
















    < /操作符>



















    <过程扩展= " true " >


















    <列出关键= " expert_parameters " / >
    < /操作符>




    > < /过程
    < /操作符>

















    <列出关键= " comparison_groups " / >


    < /操作符>

    <过程扩展= " true " >




    <列出关键= " filters_list " >

    < / >列表


    < /操作符>















    < /操作符>




    <列出关键= " filters_list " >

    < / >列表


    < /操作符>














    < /操作符>















    < /操作符>





    < /操作符>













    < /操作符>



    <列出关键= " rename_additional_attributes " / >
    < /操作符>















    < /操作符>





    < /操作符>













    < /操作符>



    <列出关键= " rename_additional_attributes " / >
    < /操作符>




    < /操作符>



















    > < /过程
    < /操作符>









    > < /过程
    < /操作符>
















    > < /过程
    < /操作符>
    > < /过程
    < ?xml version="1.0" encoding="UTF-8"?> <过程version = " 8.0.001”>

    <过程扩展= " true " >


    < /操作符>





    <列出关键= " filters_list " >

    < / >列表


    < /操作符>
















    < /操作符>

















    <列出关键= " comparison_groups " / >


    < /操作符>



















    <过程扩展= " true " >


















    <列出关键= " expert_parameters " / >
    < /操作符>




    > < /过程
    < /操作符>

    <列出关键= " function_descriptions " >


    < / >列表

    创建FPTS_Ratio属性
    < /操作符>



    <列出关键= " set_additional_roles " / >
    设置FPTS_Ratio为目标
    < /操作符>



    <列出关键= " rename_additional_attributes " / >
    < /操作符>












    > < /过程
    < /操作符>
    > < /过程
    < ?xml version="1.0" encoding="UTF-8"?> <过程version = " 8.0.001”>

    <过程扩展= " true " >




    <列出关键= " filters_list " >



    < / >列表


    < /操作符>













    < /操作符>


    <过程扩展= " true " >


















    <列出关键= " expert_parameters " / >
    < /操作符>

















    < /操作符>


















    <列出关键= " expert_parameters " / >
    < /操作符>

















    < /操作符>













  • maros_plsikmaros_plsik 成员职位:4贡献我

    终于!该进程在模板中。

    还有两件事:

    Scott,有没有办法把操作符从一个过程文件复制到另一个过程文件?除了从一个.xml复制部分到另一个->如果文件的版本不同,这仍然是相当多的工作。

    2)使用模板非常简单,但我发现它相当有限。我的过程首先分为两个部分(玩家和防御- GID>7000)。我在这个过程中得到了相当好的结果,但不幸的是,整个数据集只能使用一个模型,所以我不得不禁用大约一半的操作符,包括一个模型。尽管如此,这次挑战还是准备得很充分,我希望将来会有更多的挑战:)

  • sgenzersgenzer 管理员,版主,员工,RapidMiner认证分析师,社区经理,成员,大学教授,PM版主职位:2959年社区经理

    好了,比赛结束了。谢谢大家的意见!请继续关注我们的赢家!

    斯科特

  • sgenzersgenzer 管理员,版主,员工,RapidMiner认证分析师,社区经理,成员,大学教授,PM版主职位:2959年社区经理

    大家好,首先谢谢大家@maros_plsik@yzan@florian_ziegler欢迎提交。我可以确认它们都有效(是的,即使是你的)@yzan虽然它锁定了我的机器几个小时!),因此这只是一个得分的问题。第16周昨天结束了,所以我将在今天和明天继续工作,以发布最终的RSMEs。

    有趣的边注:我使用了你的每个模型,并让它在游戏开始前给我第16周的预测fptsratio,并为每个模型选择了一个梦幻足球队。我的算法有些模糊,因为除了FPTSRatio之外,还有其他选择团队的因素——特别是预算。你看,如果你选择纯粹的FPTSRatio。事情是这样的:

    @yzan

    根据为每个插槽选择最佳FPTSRatio的模型,我得到:

    QB N. Peterman(预期FPTSRatio = 3.652,薪资= 4500美元)

    RB K.亨特(预期FPTSRatio = 2.663,工资= 8400美元)

    后卫格利(预期FPTSRatio = 2.655,工资= 9100美元)

    WR - d -布莱恩特(预期fpds = 2.647,年薪= 6000美元)

    WR K. Wright (FPTSRatio = 2.410,薪资= 3800美元)

    英镑(预期FPTSRatio = 2.351,薪资= 6600美元)

    首席财务官奥尔森(pred FPTSRatio = 2.507,薪资= 5200美元)

    FLEX M. Gordon (pre - FPTSRatio = 2.654,薪资= 7200美元)

    DST底特律雄狮队(预期FPTSRatio = 4.949,工资= 2900美元)

    总工资:53,700美元

    所以我超过了3700美元(这就是事情变得有趣的地方),DraftKings列出了其中三个由于受伤而“有问题”的球员:T.格利,S.斯特林和M.戈登。所以我否决了预测模型,选择了排名第二的玩家来填补这些空缺,并使薪水降至5万美元以下:

    yzan.pngyzan的模型适用于第16周的DraftKings

    事情是这样的:

    截图2017-12-26 10:56.04 AM.png改良yzan模型第16周的结果

    所以基本上我们被杀了。:)然而,如果我没有否决“有问题”球员的模型,只是继续削减工资,直到我的工资降至5万美元以下,再加上取消N.彼得曼(如果我对足球有所了解,我就会知道他这周没有机会上场),我会得到这样的结果:

    QB M.特鲁比斯基(预期市盈率= 3.100,年薪= 4700美元)-> 18.12 FPTS

    RB M.戈登(预期ftsr = 2.654,年薪= 7200美元)-> 21.8 ftsr

    RB C.麦卡弗里(预期薪资比率= 2.483,年薪= 6400美元)-> 7.8

    帕克(预期市盈率= 2.340,年薪= 4200美元)-> 11.3

    WR K. Wright(预期FPTSRatio = 2.410,工资= 3800美元)-> 6.7 FPTS

    WR S. Sterling(预期薪资比率= 2.351,薪资= 6600美元)-> 9.5

    TE G. Olsen(预期FPTSRatio = 2.507,薪资= 5200美元)-> 5.7 FPTS

    FLEX T. Gurley(预期FPTSRatio = 2.655,工资= 9100美元)-> 55.6 FPTS

    DST底特律雄狮队(预扣分率= 4.949,工资= 2900美元)-> 12分扣分

    总工资:5万美元

    总幻想分数:148.52 -从7553位上升到1450位

    好吧,那还是很糟糕。但有趣的是……几乎所有第16周的顶级球员都被三个模型中的至少一个预测为非常高的FPTSRatio。在这里解释太长了,但当我看到结果时,我认出了几乎所有做得很好的名字。此外,您必须注意到,所有三个模型的RSME都在1.0-2.0范围内,正如您在上面看到的那样,这产生了巨大的差异。发人深思。

    无论如何,感谢大家举办了一个非常有趣的比赛。最终结果很快就出来了……


    斯科特

  • sgenzersgenzer 管理员,版主,员工,RapidMiner认证分析师,社区经理,成员,大学教授,PM版主职位:2959年社区经理

    下面是第三项比赛的最终结果:梦幻足球。

    第一名:@maros_plsik- rsme = 1.394

    2:@yzan- rsme = 1.417

    3日:@florian_ziegler- rsme = 1.539

    祝贺你们所有人。我们会尽快发放VISA礼品卡。

    敬请期待第四场比赛……:)

    斯科特

  • maros_plsikmaros_plsik 成员职位:4贡献我

    嘿,所有的,

    非常感谢你的比赛和你的工作,@sgenzer:).祝贺你们获得第二和第三名,@yzan@florian_ziegler

    期待下一次比赛。

    最好的问候,

    马络

    sgenzer
  • sgenzersgenzer 管理员,版主,员工,RapidMiner认证分析师,社区经理,成员,大学教授,PM版主职位:2959年社区经理

    不客气。请帮我们宣传一下——我们不能总是让同一个人赢!:)

    斯科特

    maros_plsik
登录注册置评。