程序化交易的幸存者偏差隱藏在哪里?

發表時間:2017-06-13 10:10:18

關注:1346

我們在程序化交易模型構建時,很多參數的確定,很多交易規則的確定,都是根據歷史數據上運行的結果而定的。

上一篇文章說明了回測統計中的幸存者偏差Survivorship Bias的概念,以及我們應該去留意自己的建模和回測統計中是否混入了過多的幸存者偏差結果,今天淺談一些個人尋找幸存者偏差的想法。

要坦誠說明的是,我們在 欢乐球吃球下载游戏模型構建時,很多參數的確定,很多交易規則的確定,都是根據歷史數據上運行的結果而定的。海龜交易這本書中,也談到了確定一個較好的 欢乐球吃球下载游戏,畢竟還是要參考歷史走勢(回測)的。在統計學中,回溯檢測歷史樣本也是最方便直接低成本的方案。

這里就引出了第一個幸存者偏差:歷史數據全集是否有穩定的特征可以挖掘出,并在未來繼續保持這種特征?我們大概率情況下是相信統計結果的,但是這恰巧是量化投資的基本假設中隱藏著危險的,因為萬一我們得到的某個因子,或者價格運行規律在未來無法持續了,后果會導致模型性能衰退。

對抗第一個幸存者偏差的方式是更多地依照經濟學原理和行為金融學原理,檢驗模型的各項假設是否成立。這是個說起來容易做起來難的事。我舉一個典型例子,如果我們在中大周期模型上,給予不同的股票、期貨品種,不同的模型參數,是個典型的比較危險的事情,因為參數的意義難以找到強有力解釋,特別是均線類模型的周期參數,如果你針對歷史樣本擬合得到參數,任何目標函數都難以對抗過擬合。

在找到規律前,大樣本是盡可能穩妥的建模統計回測方案

另一個方式就是盡可能的大樣本,比如針對全市場3000多只股票,20多個主流期貨品種,構建模型基礎框架。大樣本最大的好處就是避免了單品種的過擬合可能性,盡管無法預測未來,但是增加了數據的群體特征,一定程度上降低了個體特征。

如果你突破了過擬合這一關,接下來,就走到了另一個關口,在大樣本數據上,得到的績效報告中,區分幸存者和犧牲者。

誰是幸存者?很顯然,你的凈利潤,讓你腎上腺素上升的目標函數,一定是幸存者。比如說我們的模型是以在時間序列中擇時交易獲利的,凈利潤是首要目標函數。

要倍加關注平均回撤(甚至統計單品種單筆回撤),盡可能降低這個值

但是請不要忽略最大回撤,和平均回撤,他們是不會說話的犧牲者。他們代表了資產價格從最高(或最低)回到平倉點的過程中,原本的交易浮贏或者虧損。如果我們追求極高的利潤,而放寬止損條件,或者采用過激的加倉行為,會導致平均回撤很大。而日常陪伴趨勢類模型的,并不是盈利的欣喜,是回撤的困擾,所以一定要倍加關注平均回撤,盡可能降低這個值。

過了這一關后,第三關是非模型正常交易利潤,是典型的幸存者,會產生極小偏差。如果價格因為基本面或交易規則突變等因素,出現有利于模型運行的狀態,產生了一筆極大收益,我們通常要剔除這筆收益,不要輕易認為“市場價格包含一切,模型之前的信號值說明我捕捉到了這個巨大的利潤”,這種心態會讓你得到漂亮的績效報告,而實盤中難以得到類似回報。

重要節日,績效統計報告中,要遵循節前平倉的規則

一個常出現的例子是:期貨中頻交易模型,在超過3天的長假中,都應該長假前平倉,長假后若干時間段后(給市場一段時間的過度反應期)重新恢復信號值和倉位,或者依據市場運行,重新開新倉位。只有長線交易模型,才可以不平倉。

你可以這樣做試試看,模型的利潤,不出意外,產生了下降,甚至回撤還有增加。但是對應到實際情況,過節平倉是不能違背的鐵律,因為這段時間商品定價權拱手交給外盤,節后大部分品種必然快速回歸外盤定價結果,或者這段時間內該商品基本面發生變化,或者貨幣政策出現轉向,導致過節持倉的風險極大。

最后一關是有倉位調整模型的交易順序,如果你的目標函數是凈利潤,那么依照目前倉位計算動態開倉手數的模型,必定會產生偏差。因為未來數據的運行導致了未來每筆交易的出現次序不一樣,如果連續出現了不利的交易,必然導致資金快速虧損,可用于開倉的頭寸變小。

那么如果是等手數開倉的模型,就不存在這個偏差了嗎(等手數模型無論交易以何種次序出現,最終凈利潤是一致的)?答案并非如此,雖然最終凈利潤是相等的,但是如果你以夏普比率、收益風險比、Calmar比率、最大回撤等作為目標函數去優化模型,由于交易產生的次序不一致,一定會在這里發生極大偏差,要知道幸存者偏差大概率都是負面的,會給我們的實盤帶來不利影響,而且即使出現有利于實盤交易的偏差,也說明你的模型績效統計有問題。

有一定必要進行交易結果的蒙特卡洛模擬

解決這第四種偏差的方法,在公開課中我們講過《Building a Trading Strategy: After Testingand Optimization》這篇文章提到要做回測報告蒙特卡洛模擬的原因:過去的交易結果會在未來出現,只是以某種不同的、未知的順序。因此,通過以不同的順序排列這些結果,就能生成完全不同的凈值曲線。

今天僅提到一些淺顯易懂的統計回測幸存者偏差,盡快細化回測,避免這些偏差,可以讓自己的績效更有說服力,也可以讓自己的理論績效和實盤績效更加接近。對于資方而言,對建模者的更細致考核,也可以從幸存者偏差這個點切入,去設計策略評估的方式。

免責聲明:對本網站的內容,我們不提供任何形式的關于內容的正確性、有效性、穩定性、不侵犯他人權利等方面的保證;不保證網站內容所包含的文字、圖形、或其它事項的準確性或完整性,也不保證本網站的內容不存在打印、復制及其他輸入方面的錯誤。"安恒量化"可隨時更改本網站內容,但不保證在更新時通知您。用戶使用本網站服務所存在的風險和產生的一切后果 由自己承擔,本網站不承擔任何法律責任,如果本文侵犯了您的知識產權,請與我們取得聯系,我們會及時修改或刪除。

 

官方郵箱:[email protected]

工作時間:周一至周五9:00-18:00


圖片展示


     官方郵箱:[email protected]?

     工作時間 周一至周五9:00—18:00

溫馨提示:國際金融市場交易均存在高風險,并不適合每一位投資者,敬請深入研究,審慎決策。本站所有內容僅出于傳遞更多信息之目的,不構成任何投資建議。本站提供的量化交易系統策略服務僅限于服務,不接觸投資者的資金,投資者需自行承擔風險,詳情查看 【風險聲明】

官方微信