2020年世界各国总人口数据分析(python)

学习python尝试的第一个分析项目,分析思路还是有些初级,重点在对工具的练习上吧~

练习了数据分析维度的思考,熟悉了数据清洗方法、数据分析方法及可视化等内容。

根据info和describe方法返回的结果,意识到很多数据列没有返回结果,原因是字段类型不为数值型,且存在“脏数据”,需解决的脏数据问题如下:

查看含有“N.A.”的列,这里利用“df==“N.A.”返回一个值都为bool类型的dataframe,用describe方法可以观察出包含特定值字段的列标签;

分析方向:考察国家人口总数前10名及倒数10名的国家排名情况,考察前十名国家人口和国土面积与各自全球总数的占比情况

针对人口总数前10名的国家,分别统计人口总数和陆地总面积占全球总数的比例

●由此可见,这10个国家的陆地总面积占总数的40%,却居住着世界60%的人口;

分析方向:观察各国人口增长率分布情况,以及人口增长率前5名及倒数5名的国家分布情况

●绝大部分国家的人口增长率在0~3%之间,少数国家的人口增长率属于负值;

●可以看到人口增长率最高的5个国家里,有4个属于非洲,另外1个在亚洲;人口增长率最低的5个国家,有3个在欧洲地区,摩纳哥另外2个则处于大洋洲和美洲地区;

分析方向:考察各国人口密度前10名的国家,并且按照人口密度划分等级,考察不同等级的分布情况;

–》按照以上等级规则对人口密度数据进行分区,并新增人口密度等级标签,完成后绘制柱形图;

●前五个国家除了土耳其,都是高度发达的国家;由于美国强大的综合实力,毫无悬念地成为了人们心目中移民的第一选择。

-》接下来考察国家的城市人口比例和年龄中位数的相关性,这里采用一元回归模型进行分析;

①相比较其他地区,亚非地区的人口数量更多,整体来看人口数量的国家分布非常不平衡,人口数量前10名的国家已经占了全球总人数的60%;

②80%以上国家人口的增长率在0~3%之间,大约10%的国家的人口增长率为负;亚非地区的人口增长率整体偏高;

③80%以上国家均属于人口中等区和人口密集区,即人口密度大于25人/平方千米;

更多精彩尽在这里,详情点击:http://dgzhidaiji.com/,摩纳哥

留下评论

您的电子邮箱地址不会被公开。 必填项已用*标注