R语言数据可视化案例(世界杯球员信息数据可视化) - 灰信网(软件开发博客聚合)

admin 100 0
R语言数据可视化案例(世界杯球员信息数据可视化) - 灰信网(软件开发博客聚合)

  在 faraway 包中包含一个名为 worldcup 的数据集(加载 faraway 包后,可通过代码“head(worldcup)”查看数据的前 5 行,该数据集是 2010 年世界杯上球员的信息数据,每个变量所表示的信息如下: Team: 国家 Position:位置,包括后卫、前锋、守门员、中场 Time: 上场总时间 Shots: 射门的次数 Passes:传球次数 Tackles:铲球次数 Saves: 救球次数

  数据概况:

  该数据集中,数据集包含595个样本,共有7个特征。其中Team,Postition是分类变量,后面的都是数值型变量,其中行名是球员名字。 导入需要的包和数据集 ,导入需要的包和数据集;

  上场时间和传球数量的关系

  运行结果

  由图形可看出,各球员上场时间多集中于 400 以内,传球次数也对应集中于 200以内,其中 Midfifielder 位置的上场时间和传球次数较为出众。同时一定程度上,上场时间越长,传球数越大。 3. 不同位置射门次数直方图

  运行结果 由图可发现,大部分球员射门次数集中于 5 个以内,其中 Defender 射门次数较少,而 Forward 射门表现较为优异,符合常理。 4. 不同队伍射门次数直方图

  运行结果 5. 不同队伍射门次数直方图

  运行结果 由图可知 Brazil 队射门次数平均较高,但无极端异常高的值,可推测其与队伍战术风格有关,以进攻为主,但各队员水平相近,表现稳定,而 Ghana 等队虽然整体平均还行,但是有一个极端高值,可推测是有球员表现尤为优异,带动队伍射门进攻。 6. 绘制球员分布国家地图可视化

  运行结果 可通过地理信息数据发现,球队主要来源于西半球,各队伍成员数量较为相近,无过于显著的差异。 其中,安装REmap时,常规方式安装会报错,可利用下面方式解决:

  绘制球员人数分布直方图

  运行结果 可发现人数分布服从近似正态分布。 8. 对不同位置人员进行上场时间与射门次数的分析

  运行结果 由图可发现,Forward 的射门次数都较高于其他位置,符合常理。 9. 国家与射门次数之间的关系

  运行结果 从整体来看,Spain 总的射门次数最多,可看出在比赛中处在上风。Honduras 较少处于劣势。 10. 每个运动员上场时间及射门次数关系

  运行结果 图形宽度代表上场时间,颜色深浅代表射门次数。可发现 Gyan,Villa 球员上场时间多,射门次数也多,是团队核心成员,而 Jong Tae-Se 上场时间中等,但射门次数较多,是很有潜力的成员。通过这个图寻找核心成员,同时挖掘潜力成员。 11. 球员上场时间分布图

  运行结果 12. #位置、射门、救球、传球、铲球之间的关系(散点矩阵图)

  运行结果 由这个图可以得到许多信息。可发现后卫数量是最多的,而门卫是数量最少的。同时可看出,四个位置的传球数,射门数等都服从偏态分布。Tackles 后卫表现突出,Shots 前锋表现突出.符合常理。

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~