使用拖拽式工具在线运行本案例请登录
篮球是目前世界上最流行的运动之一,NBA是世界上观众最多的赛事之一。实验利用可视化组件,根据40名球员的每分钟助攻数、身高、打球时间、年龄和每分钟得分来分析球员的身体素质对得分能力的影响。
1. 读数据表
首先,使用读数据表组件读取原始数据,并查看各字段基本情况。
数据集中包括五列数据,分别是每分钟助攻数、身高、打球时间、年龄和每分钟得分,这些信息能比较全面的描述球员的身体素质和进攻能力。
2. 字段基本统计信息
查看数据集中各个字段的样本数、均值、标准差、最小值、四分位数等基本信息。
数据集中所有的字段包含45个样本数,因此数据集不存在缺失值的情况。通过结合均值、标准差、最小值和下四分位数可以发现字段assists_per_minute最大值为0.3437,但是均值只有0.16左右,字段points_per_minute最小值为0.3097,但是均值有0.48,因此可以后续用箱线图探究这两个字段中数值的合理性。同样,通过查看数据基本信息可以初步判断出其他字段的数据较为合理。
判断完字段的合理性之后对数据大致的波动性以及离散程度进行预估,五个字段的标准差相对均值较小,说明数据的波动性不大。从均值数据可以看出,数据集选取的球员在28岁左右,身高在192cm左右,与联盟平均数据相吻合,说明数据集比较具有代表性。
3. 助攻数据箱线图
通过箱线图验证字段assists_per_minute数据的合理性。
从此箱线图中可以看出字段assists_per_minute的最大值、最小值以及四分位数。图中只显示一个异常点,可能是因为某位球星的数据过好,可以确认字段assists_per_minute所录入的数据均合理。
4. 得分数据箱线图
通过箱线图验证字段points_per_minute数据的合理性。
从此箱线图中可以看出字段assists_per_minute的最大值、最小值以及四分位数。图中只显示3个异常点,可能是因为某些球星的数据过好,可以确认字段points_per_minute所录入的数据较为合理。
5. 身高直方图
读取数据集、查看各个字段的基本信息以及验证各个字段的数据合理性之后具体分析影响篮球运动员助攻能力和得分能力的因素,首先使用字段height的数据绘制直方图,查看球员身高的基本情况。
可以看到球员身高有分层的情况,这对应着小个控卫和高中锋的身高差别,总体上篮球运动员的身高较高。
6. 打球时间直方图
继续使用字段time_played的数据绘制直方图查看球员生涯比赛时间的基本情况。
可以看到大多数球员都有丰富的比赛经验,打球时间在35000分钟左右的球员最多。在人们印象中,比赛经验较多的球员得分能力和助攻能力都较强,接下来会使用散点图进行分析。
7. 年龄直方图
接下来使用字段age的数据绘制直方图,分析球员年龄的基本情况。
从直方图中可以得到,球员的年龄分布较为平均,联盟中中生代球员占大多数,新生代球员和老将相对来说较少,这也比较符合运动员的生涯规律。
8. 年龄与打球时间散点图
在人们的一般印象中,随着年龄的增长,球员的打球时间也会增加,现使用字段age和time_played的数据绘制年龄与打球时间散点图,探究年龄与打球时间之间的关系。
从图中可以看到,年龄与打球时间之间并没有明显的线性关系,年轻球员中也有打球时间较长的,这可能是因为被发掘的较早、能力较强,从很早就开始打球了,因此打球时间较长;而某些老将打球时间还没有比自己小几岁的球员多,可能是因为伤病、能力较弱或战术原因等。由此可以得出年龄大并不一定代表打球时间长。
9. 年龄与身高散点图
近年来,各种球类运动都有需要身高更高的运动员的趋势,如网球中高个球员网前球处理、接发球处理都更有优势;足球中技术相同,身高更高的球员更容易争到头球,在对抗中更有优势。现在使用字段age和height数据绘制年龄与身高散点图,探究年轻球员,即新发掘的球员身高是否更高。
由散点图可以得到,年轻球员并没有身高变高的趋势,但他们的平均身高也达到了193cm,可能的原因是运动员目前高度已经满足篮球的对抗要求,身高过高会影响球员的运动能力等。
10. 身高与助攻能力散点图
接下来使用字段height和assist_per_minute数据绘制身高与助攻能力散点图,初步探究影响球员助攻能力的因素。
由散点图可得,每分钟助攻数据与球员身高呈负相关,可能的原因是高个球员大多是锋线球员,而后卫球员更易刷到助攻;也有可能是高个球员的动作灵活度和准确度下降导致的。总之,由于战术原因或自身技术原因,高个球员助攻数较少。
11. 年龄与得分能力散点图
接着使用字段age和point_per_minute数据绘制年龄与得分能力散点图,初步探究影响球员得分能力的因素。
从图中可以初步判断年龄与得分能力关系不大,可能的原因是新生代球员身体素质较好,得分机会多;老将们虽然打球经验较多,但身体机能下降和伤病增多导致他们得分能力没有显著提升。
12. 高度和打球时间与助攻能力3D散点图
为了更深一步探究影响球员助攻能力的因素,使用字段height、time_played和assist_per_minute绘制3D散点图,更清晰地观察助攻能力与身高和打球时间是否相关。
通过观察3D散点图可以得出,打球时长对球员助攻能力没有过多的影响,而每分钟助攻数据与球员身高呈负相关,与之前初步分析结果相同。可能的原因是现在战术的作用大于球员个人能力的作用,而场上位置不同导致助攻个数不同。
13. 高度和打球时间与得分能力3D散点图
最后探究影响球员得分能力的因素,使用字段height、time_played和point_per_minute绘制3D散点图,观察得分能力与身高和打球时间是否相关。
通过观察3D散点图可以得出,身高对得分能力的影响不大;打球时间越长,得分能力越强。锋线球员和后卫球员都有自己的得分能力,所以身高带来的影响较小;而比赛经验可以使球员得到更多的得分机会,砍下更多分数。
爱数科(iDataScience)平台是一款拖拽式数据科学科研和教学一体化平台,集成数十行业数千数据集、科研案例模板。帮助科研人员快速使用大数据和人工智能技术开展研究。支持高校开展大数据通识课程教学。帮助非专业人员进行数据分析和生成数据分析报告。