評(píng)價(jià)標(biāo)準(zhǔn)(方法)很多,從性質(zhì)上可分為兩種,一種是絕對(duì)度量,另一種是相對(duì)度量。

定義

預(yù)報(bào)評(píng)分(skill-scores of forecast)是指預(yù)報(bào)準(zhǔn)確性的定量檢驗(yàn)方法。預(yù)報(bào)評(píng)分方法是氣象學(xué)、數(shù)理統(tǒng)計(jì)和信息論綜合研究的一個(gè)課題。

目的和原則

目的

預(yù)報(bào)評(píng)分的目的在于恰當(dāng)?shù)卦u(píng)價(jià)預(yù)報(bào)質(zhì)量,進(jìn)行不問(wèn)預(yù)報(bào)方法的比較,以最終改進(jìn)預(yù)報(bào)方法。

原則

① 評(píng)分標(biāo)準(zhǔn)要客觀;

② 評(píng)分結(jié)果真實(shí)反映預(yù)報(bào)水平;

③ 評(píng)分要有可比性;

④要避免預(yù)報(bào)員為獲取高分而產(chǎn)生錯(cuò)誤的預(yù)報(bào)傾向。

評(píng)分標(biāo)準(zhǔn)

評(píng)價(jià)標(biāo)準(zhǔn)(方法)很多,從性質(zhì)上可分為兩種,一種是絕對(duì)度量,另一種是相對(duì)度量。

絕對(duì)度量

絕對(duì)度量是樣本中預(yù)報(bào)值和觀測(cè)值的函數(shù),度量預(yù)報(bào)值與觀測(cè)值之間的差異。它僅考查預(yù)報(bào)本身的準(zhǔn)確性,并未考慮技術(shù)上的優(yōu)劣,所以,這種度量不具有可比性。

常用的評(píng)分標(biāo)準(zhǔn)有預(yù)報(bào)要素場(chǎng)和實(shí)況要素場(chǎng)之間的相關(guān)系數(shù)(或其距平的相關(guān)系數(shù))、要素場(chǎng)預(yù)報(bào)的平均絕對(duì)誤差、相對(duì)誤差、均方誤差或最大誤差。此外,還有量度水平氣壓梯度歸一化預(yù)報(bào)誤差的S1評(píng)分法,基于熵的概念的信息比方法等。

相對(duì)度量

相對(duì)度量則是樣本數(shù)量以及與參考系統(tǒng)相聯(lián)系的預(yù)報(bào)和觀測(cè)的函數(shù),是一個(gè)樣本的預(yù)報(bào)質(zhì)量相對(duì)于參考系統(tǒng)得出的預(yù)報(bào)質(zhì)量的度量,從而可以顯示預(yù)報(bào)技巧,這種度量一般叫技巧評(píng)分,而參考預(yù)報(bào),一般是隨機(jī)預(yù)報(bào)、氣候預(yù)報(bào)或是持續(xù)預(yù)報(bào)。

研究歷史

1884年,美國(guó)陸軍信號(hào)兵Finley軍士對(duì)美國(guó)中東部的龍卷風(fēng)預(yù)報(bào),用他本人提出的“準(zhǔn)確率”評(píng)分方法進(jìn)行了檢驗(yàn)評(píng)估,并發(fā)表了論文,由此引發(fā)了1884 - 1893年間人們對(duì)預(yù)報(bào)評(píng)價(jià)工作的關(guān)注,推動(dòng)了預(yù)報(bào)評(píng)價(jià)概念的建立及方法的研究, Finley的預(yù)報(bào)試驗(yàn)也成為許多教科書(shū)和文章中闡述預(yù)報(bào)評(píng)分時(shí)常引用的典型案例。

在Finley的論文發(fā)表后6個(gè)月內(nèi),有3個(gè)人發(fā)表文章指出了Finley評(píng)分方法的不足,并提出了自己的評(píng)分方法:第一位是Gilbert,僅僅在兩個(gè)月后就發(fā)表了論文,提出了一種評(píng)分方法,后被Palmer等重新發(fā)現(xiàn)并命名為風(fēng)險(xiǎn)評(píng)分TS(threatscore),再被Donaldson發(fā)現(xiàn)并命名為臨界成功指數(shù)CSI(critical success index),Gilbert同時(shí)還提出了修正的CSI評(píng)分,即Gilbert技巧評(píng)分GSS(Gilbert skill score),Schaefer,Black后來(lái)也分別發(fā)現(xiàn)了這一技巧評(píng)分,后者稱(chēng)其為公平風(fēng)險(xiǎn)評(píng)分ETS(equitable threat score);第二位是Price,他提出了一種技巧評(píng)分方法,Hanssen等提出了與之近似的所謂HK判別式(Hanssen-Kuipers discriminant)或稱(chēng)Kuipers成績(jī)指數(shù)(Kuipers' s performance index),F(xiàn)lueck在1987年提出了與Peirce技巧評(píng)分相同的所謂真實(shí)技巧統(tǒng)計(jì)量TSS(true skill statistic);第三位是Doolittle,先后提出了兩種技巧評(píng)分,后一種就是現(xiàn)在使用的Heidke技巧評(píng)分HSS(Heidke skill score)。

1884— 1893年提出的這些評(píng)分方法至今仍然使用著,百余年來(lái)不斷有人重新發(fā)現(xiàn)并命名,但關(guān)于預(yù)報(bào)檢驗(yàn)的概念和方法并沒(méi)有什么改變。