近年来,随着中国人民生活水平的不断提高,人们不再满足于物质水平的提高,而是精神需求明显增加。旅游是最好的放松和放松方式,不仅可以欣赏美景和陶冶情操,还可以开阔眼界,增长见识。北京作为中国的帝都,是我们第一次出行的首选。下图是根据北京统计局发布的年度旅游数据绘制的。从图中可以看出,来北京旅游的外国游客数量基本上是逐年增加的。
接下来,基于近三年(2014年11月~ 2017年10月)北京天气的历史数据,我将从气温、天气和空空气质量三个方面进行分析。一年中游览北京的最佳时间是什么时候?
一.收集数据
搜索后,网站“2345天气预报”和“天气邮报”可以提供我想要的数据源。2345天气预报有6个指标参数,分别是日期、最低气温、最高气温、天气、风向风力和空空气质量指数。然而,空空气质量指数只有2016年1月以后的数据,所以2016年
用爬虫工具web dracker从这两个网站抓取我想要的数据,然后导出CSV。有两个Excel表格,内容互补成一个表格。预览如下,共1096条记录。
二、数据整理
以上数据不能直接用于分析,需要数据清洗和整理。这里主要使用excel的以下功能:
2.增加日平均气温一栏,即最高气温和最低气温的平均值;
3.将天气栏的多个值简化为两个值,即天气用“晴”替换为“晴”,其余用“雨”替换;
4.拆下风向柱;
5.将空气体质量指标栏的值简化为两个值,即如果包含“优”或“良”,则替换为“优”。其余用“污染”代替;
6.去掉三个温度列的温度值单位“℃”,通过设置单元格格式增加单位“℃”;
7.添加计数栏,将数值设置为1,用于计算天气和空空气质量。
完成后,预览如下:
三.数据分析
完成数据后,有必要开始分析。我打算从以下三个方面来分析:
1.通过北京历史气温折线图,确定哪些月份的气温最舒适,最适合出行。反正我不想出去,因为太冷或者太热了。
根据常识,25℃是人类最舒适的温度。当然,当我们旅行时,我们不能期望温度在25℃左右。毕竟,爬长城和参观帝都紫禁城是非常累人的。在这里,我们把最低温度放宽到10℃左右。
可以看出,近三年4、5、6、9、10月日平均气温在15~25℃左右,4、10月最低气温在10℃左右,最高气温在25℃以下,仍然非常适合在北京游玩。六月的最高温度超过30℃。这么高的温度旅行会有馒头的感觉吗?所以基于这些分析,4月、5月、9月、10月去北京最舒服。既不冷也不热,真凉快!
2.通过北京历史天气的柱状图叠加图,可以找出哪些月份是晴天,哪些月份是雨天。当然,我们旅行时肯定想要晴天。
印象中是中北部比南部干燥,所以北京肯定不像我们湖北那么喜欢下雨。当然,我们还是要仔细分析一下,看看北京有没有几个月的阴雨天超过一半。否则,如果没有计划,我们会带着愉悦的心情去北京,但我们会一次又一次地遇到雨和雨,而遗憾的样子可能是我们捶胸顿足,感叹“我就知道这个”。。。。”
嗯,从上面北京的历史天气来看,北京全年的阴雨月份确实很少,但每年还是有两个规律的阴雨月份,阴雨天占了整个月的一半左右,也就是6月和7月。所以两个月不要去北京,不然浪就变成落汤鸡了!
3.画出北京历史空空气质量的柱+虚线双轴图,确定哪个月份空空气质量最优良。我终于去了帝都,但我不想去那里呼吸“臭名昭著”的雾霾。
从上图可以知道,北京的空空气质量很差,确实名副其实。每年有五六个月的污染日占全月的一半以上,几乎占全年的一半。此外,污染天气主要集中在冬春季,这也符合人们的日常感受。毕竟在这个时候,大街上到处都是带着口罩出行的人,各种污染雾霾的报道充斥着各种新闻版块。
天数最多的月份是夏天,其次是秋天,很容易理解。有更多的自然雨水/空气是好的。因此,我们需要在空气质量优良的4月、5月、6月、7月、8月、9月和10月之间进行选择。
4.综合分析
基于以上对北京历史天气三个维度的分析,我们可以看到最好在4月、5月、9月和10月出行,我们将继续对这四个月进行深入分析。
从图中可以明显看出,每年4月上旬和10月下旬的最低气温很可能远低于10℃,5月下旬的最高气温很可能超过30℃,所以尽量不要选择这些时间段。
累计最近三年4、5、9、10月的晴天和晴天(共122天),累计数≥4天(所有晴天和晴天均为6天),认为是可能的优日。从饼状图中我们可以看到,这几个月我选择的天气真的很好,好天气的概率是81%。
通过每天做一个晴天和晴天的柱状叠加图,更直观的看到这四个月大部分天气是好的。
四.分析和总结
从上面的分析很容易知道,如果你想在温暖、舒适和空晴朗的时候游览大都城,一年中最合适的月份是四月、五月、九月和十月。不过童鞋4月初10月底会有点冷,算了吧。当然,5月底的白天很可能超过30℃。如果安排类似于户外爬长城,
另外,温馨提醒,请尽量避开五一、十一的高峰时段,否则,在北京每个景点排队几个小时买票或者到处人潮涌动,都会让你心情不好!!