天一色
顶级超台
顶级超台
  • 注册日期2012-01-12
  • 最后登录2018-10-15
  • 粉丝206
  • 关注52
  • 发帖数16756
  • 来自
阅读:1822回复:16

[标准探讨]换季中的滑标应该保留一位小数还是两位小数?再议换季帖中的争论

楼主#
更多 发布于:2015-11-08 06:59
我在四季追踪里一般主要看降水追击帖的,但刚才偶然进了一下换季追击帖,本想看西安、郑州入冬情况的,不料发现了一个很有意思的讨论,即换季标准中的滑标每组5日平均应该保留一位小数还是两位小数的问题。问题来自于北京滑标入冬一事,这次北京滑标有一组9.98,如果保留一位小数进到10.0入冬失败,如果保留两位小数维持9.98入冬成功。多位气象迷在帖中表达了自己的看法,以金杯和killermaxpayne讨论最为激烈,持续多楼:金杯认为应该保留两位小数因为滑动平均只是一个中间结果,而killermaxpayne认为应该保留一位小数因为日均温就保留一位应该保持一致。事实上,如果日均温保留一位小数,滑动平均的所谓“保留两位小数”就是不进行四舍五入,因为5日平均最多也只有两位小数。那么究竟是否应该四舍五入呢?以下谈谈我的看法。
1条评分, 贡献值 +4
  • 金杯
    贡献值 4
    原创帖
    2015-11-08 17:28
喜欢1 评分1

最新喜欢:

sunsiweisunsiw...
欢迎加入青藏高原气象讨论群:581920512
天一色
顶级超台
顶级超台
  • 注册日期2012-01-12
  • 最后登录2018-10-15
  • 粉丝206
  • 关注52
  • 发帖数16756
  • 来自
1楼#
发布于:2015-11-08 07:00
模拟过程
我们做一个很简单的假设,假设一天中2点、8点、14点、20点的气温互相独立,均服从正态分布,均值分别为5、5、20、10摄氏度,方差均为1(这种假设当然不符合实际,这种假设下的结果多大程度上能说明问题大家后面可以去评价),以此构建判断滑标换季需要的连续9日气温,并以此判断滑标秋冬/冬春换季情况。
 
模拟的过程是:
1. 连续9天中,每天按照第一段的方法随机生成4点气温作为原始数据。因为百叶箱里记录的气温数据全是保留一位小数的,所以把整点气温四舍五入保留一位小数作为记录数据。
2. 按照换季帖讨论中的假设,将每天4点的记录数据进行平均,将平均值再四舍五入保留一位小数,作为日均温记录数据,这样得到了连续9天的日均温记录数据。当然我们同时也将每天4点的原始数据进行平均,平均值不进行四舍五入,同样得到连续9天的日均温真实数据。
3. 按照滑动标换季的计算方法,分别针对记录数据和真实数据,将连续9天日均温数据中第1~5天,2~6天,……,5~9天分别取平均,得到连续5组滑动平均的记录数据和真实数据。这里对记录数据有两种处理方法,金杯法:5组滑动平均记录数据保持原状有两位小数;killer法:5组滑动平均记录数据均四舍五入保留一位小数。
4. 分别针对两种方法的记录数据和真实数据,判断换季情况:如果5组滑动平均均不低于10摄氏度,认为滑标入春,如果5组滑动平均均低于10摄氏度,认为滑标入冬,其他情况认为留秋或留冬。
 
按照这样的方法,我们模拟10万次,计算相对真实情况,金杯法和killer法对换季判断错误的频率。
[天一色于2015-11-08 07:24编辑了帖子]
欢迎加入青藏高原气象讨论群:581920512
回复(0) 喜欢(0)     评分
天一色
顶级超台
顶级超台
  • 注册日期2012-01-12
  • 最后登录2018-10-15
  • 粉丝206
  • 关注52
  • 发帖数16756
  • 来自
2楼#
发布于:2015-11-08 07:01
模拟结果
模拟10万次中,真实数据得到的换季情况,滑标入春2.1万次,滑标入冬2.1万次,其他情况即滑标留冬/留秋5.8万次。
 
首先看整体的错判频率,即金杯法和killer法判断出的换季情况和真实数据判断出的换季情况不一致的频率,分别为6.5%和18.4%。可见killer法比金杯法错误率要高出两倍左右。
 
之后,我们看不同情况下的错判频率。错误入春率,即真实情况并非入春的条件下,用金杯法和killer法却判断出入春的频率,分别为4.3%和13.3%。错误入冬率,即真实情况并非入冬的条件下,用金杯法和killer法却判断出入冬的频率,分别为0.048%和0.000%。遗漏入春率,即真实情况入春的条件下,用金杯法和killer法却未判断出入春的频率,分别为0.22%和0.00%。遗漏入冬率,即真实情况入冬的条件下,用金杯法和killer法却未判断出入冬的频率,分别为14.6%和37.9%。不难看出,killer法比金杯法更容易错误判断出入春,而遗漏掉入冬,金杯法比killer法更容易错误判断出入冬,而遗漏掉入春。
 
由于模拟次数较多,错判概率的计算结果较为稳定,即换用不同seed生成随机数,结果变化很小。
[天一色于2015-11-08 07:48编辑了帖子]
欢迎加入青藏高原气象讨论群:581920512
回复(0) 喜欢(0)     评分
天一色
顶级超台
顶级超台
  • 注册日期2012-01-12
  • 最后登录2018-10-15
  • 粉丝206
  • 关注52
  • 发帖数16756
  • 来自
3楼#
发布于:2015-11-08 07:01
结果讨论
无论用任何方法判断换季,相对来说明显更容易错误入春/入夏、遗漏入秋/入冬,不容易错误入秋/入冬、遗漏入春/入夏,或者说都具有一定的“热迷”倾向,这一点不难解释。一方面,CMA换季标准中规定平均气温不低于10度/22度即为春日/夏日,低于10度/22度才是冬日/秋日,即在平均气温正好处在10度和22度的临界点时,我们直接判断为更热的季节,而不是以50%的概率去随机判断出一个季节。另一方面,我们用四舍五入保留小数时,是“五入”的,即在正好出现X.5时,直接进到X+1,而不是以50%的概率去随机判断取X还是X+1。如果数据都是连续的,这并不会产生问题,但实际情况是我们的数据是离散的,而且可取的数值非常有限,这就构成了一定偏差。比如,日平均气温数据四舍五入后为10.0的有9.95、9.975、10.0、10.025四种情况,它们的平均值是9.9875,小于10。
 
那为什么killer法相对金杯法,错误入春/入夏、遗漏入秋/入冬程度更大,而错误入秋/入冬、遗漏入春/入夏程度更小呢?有人可能会问,计算滑动平均时,四舍五入后为10.0的有9.96、9.98、10、10.02、10.04,它们的平均值恰好就是10,应该不会产生偏差啊。但实际情况是,如果滑动平均时不进行四舍五入,只有10、10.02、10.04三种情况能被判断为春日组,9.96、9.98两种情况会被判断为冬日组,而四舍五入时五种情况全部被判断为春日组,所以计算滑动平均时四舍五入更容易入春,不容易入冬了。
 
所以说,现行换季标准虽然原则上没有“热迷”倾向,但只要中间进行了四舍五入,就必然带有了“热迷”的倾向,更容易入春/入夏,不容易入秋/入冬。而相对于滑动平均时不四舍五入的金杯法,滑动平均时四舍五入的killer法这种“热迷”倾向更为明显。金杯法虽然相比killer法错误入冬和遗漏入春的可能性增大,但这比起整体上的“热迷”倾向显得微不足道。而总体的错误率也是killer法更大,说明这里确实精确度越低,误差越大。可惜的是,本来是铁杆冷迷的killer和巴萨,这次却在北方换季帖坚持滑标数据要四舍五入,这无形中给我们热迷阵营助了一臂之力
[天一色于2015-11-08 08:29编辑了帖子]
欢迎加入青藏高原气象讨论群:581920512
回复(0) 喜欢(0)     评分
天一色
顶级超台
顶级超台
  • 注册日期2012-01-12
  • 最后登录2018-10-15
  • 粉丝206
  • 关注52
  • 发帖数16756
  • 来自
4楼#
发布于:2015-11-08 08:32
欢迎加入青藏高原气象讨论群:581920512
回复(0) 喜欢(0)     评分
天一色
顶级超台
顶级超台
  • 注册日期2012-01-12
  • 最后登录2018-10-15
  • 粉丝206
  • 关注52
  • 发帖数16756
  • 来自
5楼#
发布于:2015-11-08 08:35
欢迎加入青藏高原气象讨论群:581920512
回复(0) 喜欢(0)     评分
412561628
台风
台风
  • 注册日期2013-11-25
  • 最后登录2018-10-15
  • 粉丝15
  • 关注1
  • 发帖数1047
  • 来自
6楼#
发布于:2015-11-08 09:11
嗯,这个是从大量数据的概率来分析五天滑动均温在保留两位小数和一位小数时哪一组更准,有理有据。
我觉得,既然换暖季时只要求大于等于10.0或者22.0.换冷季时要求严格小于,对于换冷季已经严格了一些,那么就理应采取更准确的值让这个换冷季不因为人为取值的问题而变得“偏向热迷”,而事实上,五组滑动均温保留两位小数时,9.96和9.98算作小于10.0.而同组的10.00、10.02、10.04算作大于等于10.0,既合情,又合理。
多插一句,其实我个人的意见,对于单日四点均温法的均温也是持应保留两位小数态度的,即21.95和21.975应算春秋日,22.0算夏日
回复(1) 喜欢(1)     评分
xiaoyi22
强台风
强台风
  • 注册日期2012-03-04
  • 最后登录2018-10-15
  • 粉丝35
  • 关注22
  • 发帖数4118
  • 来自
7楼#
发布于:2015-11-08 13:04
412561628锛氞牛飧鍪谴哟罅渴莸母怕世捶治鑫逄旎略诒A袅轿恍∈鸵晃恍∈蹦囊蛔楦迹欣碛芯荨
我觉得,既然换暖季时只要求大于等于10.0或者22.0.换冷季时要求严格小于,对于换冷季已经严格了一些,那么就理应采取更准确的值让这个换冷季不因为...
鍥炲埌鍘熷笘
你要考虑基础数据啊,比如22.0的均温4个点,那是21.9 21.9 22.1 22.1 这样平均得出22.0的,你的4点的基础数据是一位数,那就应该平均后继续保持一位数。如果你基础数据是两位,比如21.85 21.94 22.05 22.14这样的准确两位数,那你均温保持两位数才是合理。而目前的气象数据基础数据就只有一位,那自然应该平均后保持一位,这样才合理
回复(0) 喜欢(0)     评分
swefinland
台风
台风
  • 注册日期2013-02-01
  • 最后登录2018-10-14
  • 粉丝40
  • 关注8
  • 发帖数2663
  • 来自
8楼#
发布于:2015-11-08 13:19
这个事情都能写个模拟测试。。。佩服。。
在我看来就是规则制定明确就好了。。。。那么点的小温度也没啥必要追究。
回复(0) 喜欢(0)     评分
killermaxpayne
台风
台风
  • 注册日期2012-06-20
  • 最后登录2018-01-26
  • 粉丝65
  • 关注34
  • 发帖数2352
  • 来自
9楼#
发布于:2015-11-08 14:54
辛苦了写了这么长的分析,但我只能说这并不关概率的问题。其实你只要了解“有效数字的运算规则”,或者是大学里面做过任何的物理或化学实验,读过仪器并计算结果的话,你就知道为何在原读数只能保留一位的情况下,计算结果必须只保留一位。就不会牵扯到概率问题上。

就像我在原帖中说的关于球的例子,6.5和6.48到底谁更准,看上去似乎6.48还更精确,而且也可以用你的模拟过程得出在大量模拟称重后6.48绝对比6.5更准。但具体到每一次,就不能这么算。(另外要注意的是6.5并不是6.50,就像换季当中的10.0并不代表10.00)。保留一位只是在现有的测量条件下所能得出的最精确且最准确的结果,多出任何一位都是没有意义的,或者说是错误的,哪怕你能够证明多出一位有极大的概率能够得出正确结果(就好比中超争冠队碰到中甲下游队,我们是否可以直接判中超队胜?因为踢无数次以后,中超队获胜的概率显然大得多?)。

其实我完全没想到关于滑动平均的计算也能引发这么激烈的讨论。因为日均温的计算早就存在这个问题,但大家基本都认可。无论是从基本运算规则(请不要把它称呼为“Killer法”。。。),还是根据NMC的规定(也不是我的规定),都是必须只保留一位小数。尽管从大量数据模拟下能计算出这种算法有“热迷”倾向,而且会导致判断换季更容易入热季而不容易入冷季。

回到滑动平均的计算上,如果作为计算结果必须保留一位这点没有任何疑问。唯一可以讨论的就是金杯提出的这个滑动平均其实只是一个中间过程,并不把它看作一个具体确定的“值”,所以不需要根据规则保留一位。

归根结底,还是NMC没有对滑动平均这一项的性质或者是计算要求做出过明确表态,才会在这点上产生不同意见分歧。在这里多讨论也没有意义,最终还是要看NMC的规定。
回复(1) 喜欢(0)     评分
上一页
游客

返回顶部