赞
踩
• 使用 Scikit-Learn 预测葡萄酒质量——训练机器学习模型的分步教程
• R: caret – 由 caret 包的作者提供的网络研讨会
• UCI 机器学习存储库 ——350 多个可搜索的数据集,涵盖几乎所有主题。您一定会找到您感兴趣的数据集。
• Kaggle 数据集——Kaggle 社区上传的 100 多个数据集。这里有一些非常有趣的数据集,包括 PokemonGo 产卵地点和圣地亚哥的墨西哥卷饼。
• data.gov ——美国政府发布的开放数据集。如果您对社会科学感兴趣,可以去看看。
在《点球成金》一书中 ,奥克兰 A 队通过分析球员球探彻底改变了棒球运动。他们建立了一支有竞争力的球队,而只花费了洋基队等大型市场球队支付薪水的 1/3。
首先,如果你还没有读过这本书,你应该去看看。这是我们的最爱之一!
幸运的是,体育界有大量数据可供使用。球队、比赛、比分和球员的数据都可以在线跟踪和免费获取。
对于初学者来说,有很多有趣的机器学习项目。例如,您可以尝试……
• 体育博彩……根据每场新比赛前的可用数据预测盒子得分。
• 人才球探…… 使用大学统计数据来预测哪些球员将拥有最好的职业生涯。
• 综合管理… 根据他们的优势创建球员集群,以建立一个全面的团队。
体育也是练习数据可视化和探索性分析的绝佳领域。你可以使用这些技能来帮助您决定要在分析中包含哪些类型的数据。
• 体育统计数据库 ——体育统计和历史数据,涵盖了许多职业运动和一些大学运动。干净的界面使网页抓取更容易。
• Sports Reference – 另一个体育统计数据库。界面更杂乱,但可以将单
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。