# 112-1 運動數據分析專題 ## 組員(按照學號排序) * 41247008S 鄭兆宏 * 41247010S 呂凱崴 * 41247013S 王修佑 ## 專題敘述 * 主題方向:**分析 10 年 (2013~2022) 內 MLB 各隊例行賽數據,預測 2023 各隊奪冠機率**。 * 議題細目:如題。 * 分析方法: 1. 用爬蟲蒐集資料 2013~2022 年的各隊例行賽數據。 2. 資料篩選(篩選對球隊有影響的球員): * 野手:平均每場打席數 $PA÷G ≥ 2.5$ * 野手:每個位置取出賽數 $P$ 在中位數以上的選手 * 投手:出場局數 $> K$($K$ 為中位數)。 3. 資料標記(各隊當年名次)。 4. ML 跑下去分析,分析不同 ML 模型資料。 5. * 預期結果: * 預測出 2023 各隊名次。 --- ## 資料來源 * [MLB 官方網站](https://www.mlb.com/stats/)。 * [MLB savant](https://baseballsavant.mlb.com/)。 * 資料擷取。 * https://github.com/whyhugo/Data-Analysis-in-Sports/blob/main/mlb_stats_crawler.ipynb [name=Hugo] * 名次標記 https://docs.google.com/spreadsheets/d/1i3aWRTlKh-qYP3_PKCt7Pm_XyFR9WagKsh82DIF5nAc/edit?usp=sharing ### 資料指標筆記 - Batted BallEvents (BBE)是指打進場內的球的次數。 - --- ## 初探結果 > 目標:找出資料分析指標 * 抓取2022年冠軍球隊以及沒有進季後賽的第一隊。 * 比較數據找出差異,進而找出重要資料。   --- ## 程式需求 * Python爬蟲 * Python資料分析 ---
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up