次世代均值回歸策略
發(fā)布時間:2018-05-22 | 來源: 川總寫量化
作者:石川
多品種構建的價差很難滿足一價定理、不易回歸;針對這類價差的統(tǒng)計套利策略的風險收益比很差。本文介紹一種新的均值回歸思路。
1 金融市場的均值回歸
在量化投資領域,均值回歸(mean reversion)代表著一大類策略。金融市場的均值回歸定義如下:
In finance,?mean reversion?is the assumption that a stock's?price?will tend to move to the average price over time.
我們可以把上述定義中的“股票”換成其他任何投資品。這個定義中最核心的兩個字是“價格”(而不是投資品的“收益率”):
“價格呈現(xiàn)均值回歸”等價于“收益率呈現(xiàn)序列負相關性”。這是一種非常好的、可以被拿來構建優(yōu)秀策略的特性。
“收益率呈現(xiàn)均值回歸(即收益率圍繞 0 隨機的上下波動)”等價于“價格呈現(xiàn)隨機游走”。這是投資品最差的一種形態(tài),在這種情況下不存在有效的賺錢策略(運氣除外)。
請暫停一下,花幾秒鐘體會一下上面這兩句話。它們是所有均值回歸策略的核心,也是本文的核心。先鋒基金(Vanguard)的創(chuàng)始人 John Bogle 曾教導我們說,在金融市場,均值回歸是一條鐵律。確實,投資品的價格不可能一直漲或者一直跌,拿出任何一段時間來看,它似乎總是圍繞著局部的均值上下往復波動,呈現(xiàn)出圍繞著均值的回歸運動。但是這種程度的回歸對于在統(tǒng)計上構建一個有效的量化策略并沒有太多的幫助。
在現(xiàn)實中,為了構建一個均值回歸策略,我們要求價格的時間序列滿足平穩(wěn)性。顯然,單一投資品的價格是很難滿足這個假設的。于是量化界的小伙伴們便開動腦筋,終于發(fā)現(xiàn)雖然單一投資品的價格不滿足均值回歸,但是可以把多個投資品(通常是兩個)線性組合在一起,使它們的價差滿足均值回歸。
找到一對價差滿足均值回歸的投資品是早期均值回歸策略的初衷,因此這類策略又有另外一個廣為人知的別名 —— 配對交易(pairs trading)。
配對交易就是當下市場上主流的構建均值回歸策略的方法。它通常利用協(xié)整(co-integration)或者價格距離法來找到這樣一對投資品,并認為它們的價差會在一定的區(qū)間內(nèi)往復運動,然后基于價差的統(tǒng)計特性計算閾值進行交易,因此這種策略通常又叫統(tǒng)計套利(statistical arbitrage)。本文介紹一種新的均值回歸思路。不過在此之前,還是讓我們先來看看市場上流行的這兩種投資品配對方法。
2 協(xié)整
我們都知道收益率序列滿足平穩(wěn)性,而價格序列不滿足平穩(wěn)性。收益率滿足平穩(wěn)性僅僅說明價格呈現(xiàn)隨機游走,它對于構建賺錢的投資策略沒什么用。我們想要的是價格序列呈現(xiàn)出平穩(wěn)性。但凡事都有一個例外:雖然單一投資品的價格不滿足平穩(wěn)性,但有時把多個投資品(通常是兩個)線性組合在一起構成一個價差序列,該序列滿足平穩(wěn)性。在數(shù)學上,如果多個非平穩(wěn)的時間序列通過線性組合得到一個平穩(wěn)的時間序列,則把滿足這種關系稱為協(xié)整(co-integration)。《小心偽回歸發(fā)現(xiàn)的假關系》一文介紹了協(xié)整發(fā)生的原因。對于兩個投資品的價格序列,它們的價格都表現(xiàn)出了一定的隨機性。如果它們的隨機性來自同一個隨機過程(共同的因素),則說它們滿足協(xié)整關系,并可以通過一定的線性組合把這個共同的隨機因素剔除掉,而剩下滿足平穩(wěn)性的價差序列。在數(shù)學上,可以使用 ADF test 來檢驗一個價差序列是否滿足平穩(wěn)性。
EWA 和 EWC 是一對兒滿足協(xié)整的經(jīng)典例子。它們分別代表澳大利亞(EWA)和加拿大(EWC)股指的兩個 ETFs。由于這兩個國家的經(jīng)濟都主要依靠商品,因此可以認為這兩個股指的波動來自共同的因子。下圖為這兩個 ETFs 的價格序列(左圖)和回歸得到的價差序列(右圖)。
對價差進行 ADF 檢驗,得到的統(tǒng)計值為 -4.09(p-value 為 0.0065),小于顯著性 1% 對應的閾值 -3.96,因此在 1% 的顯著性水平下拒絕原假設。ADF 檢驗說明該價差序列滿足平穩(wěn)性,即 EWA 和 EWC 滿足協(xié)整關系。
3 價格距離方法
再來看看另一種方法:價格距離法。該方法的主要參考文獻是 Gatev et al. (2006)。該文的作者指出,尋找配對的一種方法是看兩個投資品標準化后的價格序列是否足夠接近 —— 即在尋找配對的形成期這兩個投資品標準化后的累積價差是否足夠小。關于為什么采用這種方法找配對,該文作者給出的解釋如下:
We use this approach because it best approximates the description of how traders themselves choose pairs. Interviews with pairs traders suggest that they try to find two stocks whose prices "move together".
假設形成期的長度為 T,期內(nèi)的某投資品 i 的價格序列為P_i0, P_i1, …, P_iT。在這種方法中,首先以 P_i0 為基準將價格序列轉(zhuǎn)化為對數(shù)價格(這相當于把 t 時刻的價格轉(zhuǎn)化成 0 到 t 之間的對數(shù)收益率),然后再計算 T 期內(nèi)任意兩個投資品 i 和 j 的價格偏差平方和(記為 D_ij):
在沒有任何限制的版本中,任意兩個投資品(比如兩支股票或者兩種不同的商品期貨)都會被使用這種方法來計算它們之間價格走勢的相似程度。在有限制的版本中 —— 或者說是從業(yè)務上出于防止過擬合的考慮 —— 上述計算僅僅被應用于同一行業(yè)的股票(比如不同的銀行)或者同一種類的商品期貨(比如農(nóng)產(chǎn)品或者化工),以杜絕僅僅因為巧合而沒有業(yè)務邏輯支撐的配對兒(Bianchi et al. 2009)。
當所有潛在的投資品兩兩計算價格距離之后,距離最小的那些配對兒就被認為是滿足價格一起運動,即它們的價差會在未來一段時間內(nèi)呈現(xiàn)均值回歸,因此被用來交易。交易的規(guī)則就是經(jīng)典的統(tǒng)計套利,當價差的取值較歷史均值偏離兩個標準差時,就進行做多或者做空價差的操作。下圖是 Gatev et al. (2006) 給出的一個按上述方法找出的股票配對交易的例子。
我們使用國內(nèi)商品期貨數(shù)據(jù)簡單測試過這種配對兒方法。結論是,它在形成期內(nèi)確實能找到價格走勢非常接近的商品配對兒,但是這些商品在交易期內(nèi)(即相對配對兒來說是樣本外)的走勢相當不一致。事實上,我們發(fā)現(xiàn)沒有任何業(yè)務層面的機制來約束它們繼續(xù)一起移動,因此其價差也就根本不滿足均值回歸,上述方法在國內(nèi)市場上的有效性仍然是個大大的問號。
4 配對交易的不足
均值回歸策略的特點是“收益有限、風險無限”。上述兩種使用協(xié)整和價格距離構建配對交易的策略在這方面體現(xiàn)的可謂是淋漓盡致。
來看前半句,即便是能找到兩個靠譜的投資品,使它們的價差呈現(xiàn)穩(wěn)定的均值回歸特性,基于這個價差的策略的交易次數(shù)也會非常少。這是因為只有當價差偏離到一定的程度(比如 2 個標準差之外),策略才可能進行交易,而這種偏離發(fā)生的頻率非常低。所以,這類策略通常在很長時間內(nèi)都沒有任何交易。下圖是利用 EWA 和 EWC 這兩個 ETFs 構建的配對交易(關于這個策略的更具體的描述,請參考《均值回歸:循規(guī)蹈矩,偶發(fā)癲狂》)。該策略的年化連續(xù)收益率為 8.72%,最大回撤 -9.38%。從凈值和最大回撤曲線中看出很大的一部分收益來自 2009 年;在 2013 年到 2015 年間,策略發(fā)生了長達 758 個自然日的回撤。
再來看看后半句。由于被用來配對的投資品之間很難滿足一價定理,所以沒有任何金融業(yè)務上的核心邏輯來保證價差會一直滿足均值回歸。比如 Brent 和 WTI 這兩種原油,它們的價格走勢應該非常接近。而這二者的價差(下圖)在 2011 年之前也確實呈現(xiàn)出穩(wěn)定的均值回歸特性。但是從 2011 年開始風云突變,這兩種油的走勢就不再一致,它們的價差也幾乎沒有表現(xiàn)出任何回歸的現(xiàn)象。不難想象一個交易該價差的策略在價差突破歷史閾值之后不但沒有回歸、反而持續(xù)迅速擴大時的絕望。
基于上述原因,大量的實證顯示,這類策略的收益風險比較差。既然找到多個投資品并構建一個滿足均值回歸的價差不是特別靠譜,那么有沒有更好的辦法呢?究其核心,構建一個均值回歸策略需要的是找到一個具有負的自相關性的收益率序列。正是由于投資品的絕對收益率幾乎是隨機的(沒有統(tǒng)計上顯著的負相關性),人們才退而求其用不同的投資品構建能夠回歸的價差(使價差收益率滿足負相關性)。雖然投資品的絕對收益率幾乎是隨機的,但是在正確的方法下,投資品的殘差收益率是可以用來構建均值回歸策略的。這就是均值回歸的新思路。
5 因子殘差法
Yeo and Papanicolaou (2017) 提出了針對投資品(這里特指股票)殘差收益率的均值回歸策略(該研究很大程度上受到了 Avellaneda and Lee 2010 的啟發(fā)),用幾句話來高度概括一下就是:
個股的收益率中有能夠被公共因子解釋的部分(比如市場因子、盈利因子、規(guī)模因子、估值因子等),把這些公共部分刨去之后剩下的就是殘差收益率。對所有個股的累積殘差收益率做隨機分析,找到殘差收益率的變化過程中滿足均值回歸的那些個股,進行交易。
下面我們結合上述過程中涉及到的量化模型來對每一步做一個簡要介紹。首先是通過多因子模型來求出個股的殘差對數(shù)收益率(Yeo and Papanicolaou 2017 使用了統(tǒng)計因子,即認為因子本身是觀測不到的,而是從股票的收益率中直接提取的 —— 比如利用主成分分析這類方法)。這里使用對數(shù)收益率是為了方便之后把殘差收益率直接求和得到“殘差對數(shù)價格”的隨機過程(下文略去“對數(shù)”二字)。假設 u_it 是個股 i 在第 t 期的殘差對數(shù)收益率,將 0 到 t 期內(nèi)的殘差收益率加起來就得到 t 時刻的累積對數(shù)殘差價格:
接下來,對 X_it 使用 Ornstein-Uhlenbeck (OU) 過程建模。OU 過程由 Leonard Ornstein 和 George Eugene Uhlenbeck 提出,該隨機過程滿足如下的隨機微分方程:
其中,Θ_i,μ_i,以及 σ_i 分別是針對個股 i 的模型參數(shù),W_i 是布朗運動。和標準的布朗運動相比,這個模型的不同之處在于上式右側的第一項,其中 μ_i 表示 X_it 的長均值。這一項說明,如果 X_it 大于(小于)μ_i,那么在下一時刻的增量 dX_it 會是負的(正的),從而使 t + 1 時刻的 X_i 傾向于向均值移動,而 Θ_i 則代表像均值移動的速度,因此 OU 過程滿足均值回歸特性。當然,眾多個股之中,哪些的殘差價格更好的滿足 OU 過程需要通過參數(shù)估計來確定。為此,Yeo and Papanicolaou (2017) 考慮了三個要求:
1. 入選個股的 Θ_i 必須足夠大,代表著它的殘差價格序列的均值回歸速度很快。
2. 入選個股的模型參數(shù)的誤差必須足夠小,這才能保證統(tǒng)計上的可靠性,如果估計誤差很大,那么參數(shù)是不可信的。
3. 必須隨時間的變化滾動建模,因為沒有任何機制來保證一支個股的殘差價格能夠一直滿足均值回歸。
滿足上述條件的個股則脫穎而出,它們將被用來構建最終的投資組合。在構建投資組合時,最核心的一點是:整個策略針對的都是個股殘差價格的均值回歸。因此,在投資組合中必須讓入選的個股滿足市場中性,更精確地說是滿足計算殘差收益率時使用的風格因子中性。如果無法保證這一點,即便殘差價差回歸了,但是因為在個別因子上仍有暴露,導致的股價走勢可能仍然和策略的建倉方向(多、空)不同、產(chǎn)生虧損。
具體的,在構建最優(yōu)投資組合時,Yeo and Papanicolaou (2017) 考慮了如下因素,其中第一個就是因子中性(假設一共有 p 個因子),此外還要求了 dollar 中性(即多空對應的資金量相同),以及總杠桿的限制。
上面的最后一條是開倉的方向(多、空)。在計算開倉信號時,Yeo and Papanicolaou (2017) 采用了傳統(tǒng)的統(tǒng)計套利的思路,即計算信號 S_it:
當 S_it > 1.25 時,做空該個股,之后當 S_it 回歸到小于 0.5 時平倉;當 S_it < -1.25 時,做多該個股,之后當 S_it 回歸到大于 -0.5 時平倉。最后來看看效果。下圖給出了這個均值回歸策略在不同時間段的凈值曲線。在 5 basis points 和 10 basis points 的交易成本假設下,該策略在不同的時間段(包括金融危機)均取得了正收益,效果還是很不錯的。
看到這里,有的小伙伴也許會問,即便這個思路確實新穎,但是實操起來似乎還有幾個問題:
1. 優(yōu)異的回測結果是否多少受益于回測期內(nèi)的 data mining?畢竟這么多數(shù)據(jù)一通優(yōu)化,而在現(xiàn)實中沒有必然的因素來保證殘差價格一定會實現(xiàn)均值回歸;
2. 實證中的投資組合同時多、空開倉,而在國內(nèi)市場做空受限的前提下,這個策略想要原封不動移植到 A 股上幾乎不可能。
不要忙著悲觀,也許 Yeo and Papanicolaou (2017) 文中的結果有一定 data mining 的成分,但是殘差價格這背后的回歸是有合理的解釋的 —— 來自行為金融學的解釋。殘差收益率的負相關性是由于投資者的過度反應造成的,而從某種意義上說,Yeo and Papanicolaou (2017) 是針對殘差收益率的潛在負相關性做了更加精密的定量化分析。下面就來看看來自行為金融學的例子。
6 來自行為金融學的實證
早在 1984 年,Richard Thaler(2017 年諾貝爾經(jīng)濟學獲得者,以研究行為經(jīng)濟學而聞名)和 Werner De Bondt 寫了一篇影響深遠的文章,題為“Does the stock market overreact?”(De Bondt and Thaler 1984,被引用近 8300 次)。文中,他們使用股票相對于市場的超額(殘差)收益率構建了一個贏家組合(殘差收益率為正)和一個輸家組合(殘差收益率為負)。數(shù)據(jù)顯示,這個輸家組合在未來取得了比贏家組合(定期調(diào)倉)更高的收益,如下圖所示。
這個結果說明,殘差收益率確實有一定的負相關性,這造成了之前跑輸市場的組合在之后跑贏了市場;反之亦然。這就是為什么長期來看,輸家組合遠遠跑贏了贏家組合。在計算殘差收益時,DeBondt and Thaler (1984) 僅僅使用個股的收益率減去市場的收益率,并沒有考慮其他因子甚至是個股的 β。造成這種現(xiàn)象的原因正是投資者的過度反應。
7 結語
一個均值回歸策略能否有效取決于它是否能夠保證價格時間序列回歸的機制。大量的實證顯示,純粹基于不同投資品的價格數(shù)據(jù)來找這種回歸是不太靠譜的。而行為金融學提供了全新的視角。流水的投資者,鐵打的認知偏差。這些根深蒂固的認知偏差產(chǎn)期存在于市場之中,使得投資品的價格和收益率表現(xiàn)出特定的性質(zhì)。如果這些行為偏差能夠被我們所用,從行為金融學的角度構建均值回歸策略也許會大有可為。以某個顯著的市場特性作為切入點,使用最恰當?shù)臄?shù)學工具,更加精確的實現(xiàn)一個交易目標、并獲取優(yōu)秀的風險收益,這就是量化投資的最大意義。
參考文獻
Avellaneda, M. and J-H. Lee (2010). Statistical arbitrage in the US equities market. Quantitative Finance 10(7), 761?– 782.
Bianchi, R., D. Michael, and R. Zhu (2009). Pairs trading profits in commodity futures markets. In: Proceedings of Asian Finance Association 2009 International Conference, June 30 – July 3, 2009, Brisbane, Queensland.
De Bondt, W. F. M. and R. Thaler (1984). Does the stock market overreact? Journal of Finance 40(3), 793 – 805.
Gatev, E., W. N. Goetzmann, and K. G. Rouwenhorst (2006). Pairs trading: Performance of a relative-value arbitrage rule. Review of Financial Studies 19(3), 797 – 827.
Yeo, J. and G. Papanicolaou (2017). Risk control of mean-reversion time in statistical arbitrage. Risk and Decision Analysis 6(4), 263 – 290.
免責聲明:入市有風險,投資需謹慎。在任何情況下,本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構成對任何人的投資建議。在任何情況下,本文作者及所屬機構不對任何人因使用本文的任何內(nèi)容所引致的任何損失負任何責任。除特別說明外,文中圖表均直接或間接來自于相應論文,僅為介紹之用,版權歸原作者和期刊所有。