这是一个很小很简单的项目,有一张包含山峰高度,首次攀登时间,攀登次数等等的世界山峰的数据,根据这些数据利用Python统计出一些信息。
数据分析一般包括四个步骤:明确分析的目的,数据收集,数据处理及展示,数据分析。
这次试验的目的是统计不同的年份登山的次数以及首次登顶时间与海拔高度的关系。数据已经有了,接下来就是进行数据处理以及展示了。在这里我用Python进行数据处理。
首先引入pandas和matplotlib包,以及为了更好的显示图片而做了一些设定
因为要用到的数据中有一些不符合要求(要求是数字的列里面包含空白,many,>>),所以要对数据进行处理。
定义主函数
接下来就是数据的展示了
图片展示
从图中可以看出1950年到1960年期间攀登高峰的次数是最多的。