更有效的信息聚合方法 ?

發(fā)布時(shí)間：2022-06-16 | 來源: 川總寫量化

作者：石川

摘要：協(xié)變量的高維數(shù)時(shí)代，數(shù)不勝數(shù)的公司特征都和預(yù)期收益相關(guān)，然而它們之間存在不能忽視的相關(guān)性。在這個(gè)背景下，如何更好地聚合協(xié)變量包含的預(yù)測信息?

對于資產(chǎn)定價(jià)而言，相信到現(xiàn)在你已經(jīng)接受了協(xié)變量的高維數(shù)時(shí)代（Kozak, Nagel and Santosh 2020，Giannone, Lenza and Primiceri 2021）。需要補(bǔ)充背景知識的小伙伴請參考《稀疏性幻覺》。然而，面對層出不窮的 factor zoo（Cochrane 2011，Harvey, Liu and Zhu 2016）背后的公司特征，一個(gè)自然的問題是：如何有效地聚合它們所包含的預(yù)測信息，從而形成關(guān)于預(yù)期收益率更好的預(yù)測？

在這方面，學(xué)界和業(yè)界的嘗試從未停止過。比如，最直接的方法是 Fama-MacBeth regression。當(dāng)然，一旦協(xié)變量個(gè)數(shù)激增后，這個(gè)方法就會受到各種計(jì)量經(jīng)濟(jì)學(xué)問題的困擾。又比如 rank-based approach，即根據(jù)取值高低將股票在每個(gè)公司特征上排名，然后求均值得到綜合排名。這個(gè)方法在 Stambaugh, Yu and Yuan (2015) 以及 Stambaugh and Yuan (2017) 中大放異彩，也同時(shí)出現(xiàn)在 Asness, Frazzini and Pedersen (2019) 的 QMJ 因子構(gòu)造之中。再比如各種機(jī)器學(xué)習(xí)算法，這其中以 PCA 為代表（Kelly, Pruitt and Su 2019，Kozak, Nagel and Santosh 2020），也在聚合預(yù)測信息的時(shí)候發(fā)揮了很大的作用。另外，Lettau and Pelger (2020a, b) 的 risk premium PCA 也是這類方法的拓展。《實(shí)證資產(chǎn)定價(jià)理論新進(jìn)展》一文的聚合因子信息一節(jié)對上述方法有更多的介紹。

除此之外，Light, Maslov and Rytchkov (2017) 通過將預(yù)期收益率視為隱性變量（latent variable），利用 partial least squares（PLS）提出了一種新的方法。該方法實(shí)操起來方便，在直覺上也頗具吸引力。

令? $\mathcal{F}_t$ ?表示? $t$ ?時(shí)刻所有的信息，則? $t$ ?時(shí)刻關(guān)于股票收益率的最佳預(yù)測為：

? $\displaystyle \mu_{it}=\mathbb{E}[R_{it+1}|\mathcal{F}_t].$ ?

由已實(shí)現(xiàn)收益率和預(yù)期收益率之間的關(guān)系，我們進(jìn)而有：

? $\displaystyle R_{it+1}=\mu_{it}+\varepsilon_{it+1}.$ ?

對于進(jìn)行分析的計(jì)量經(jīng)濟(jì)學(xué)家而言，預(yù)期收益率? $\mu_{it}$ ?是無法觀測的，而且他也不具備? $\mathcal{F}_t$ ?所包含的全部信息。取而代之的是，他能夠觀測并收集大量的公司特征? $X_{it}^a, a=1,\cdots,A$ ?。在此基礎(chǔ)上，Light, Maslov and Rytchkov (2017) 方法的核心假設(shè)是隱性變量? $\mu_{it}$ ?是公司特征空間中唯一和未來收益率有關(guān)的變量，即公司特征和預(yù)期收益率滿足如下關(guān)系（在擴(kuò)展的模型中，他們假設(shè)預(yù)期收益率由多個(gè)隱性因子 span 而成，感興趣的小伙伴請閱讀原文）：? $\displaystyle X_{it}^a=\delta_t^a(\mu_{it}-\bar{\mu}_t)+u_{it}^a.$ ?在該模型中，? $\bar{\mu}_t$ ?為? $t$ ?時(shí)刻預(yù)期收益率在截面上的均值，而? $\delta_t^a$ ?刻畫了公司特征和 demean 之后預(yù)期收益率的關(guān)系。

由于預(yù)期收益率是隱性變量，因此計(jì)量經(jīng)濟(jì)學(xué)家的任務(wù)就變成如何通過可觀測到的已實(shí)現(xiàn)收益率? $R$ ?和公司特征? $X$ ?來估計(jì)? $\mu$ ?。為此，Light, Maslov and Rytchkov (2017) 使用了 PLS。從直覺上說，PLS 類似 PCA，也是從一大堆變量（公司特征）中提取公共的信息。然而，它們之間的差異是，PCA 提取的目標(biāo)是最能解釋這些變量共同運(yùn)動的信息，而 PLS 的目標(biāo)則是從這些變量之中提取出信息，使得該信息和目標(biāo)（即被預(yù)測的）變量之間的協(xié)方差最大化。

The main objective of PLS is the extraction of a common factor from a set of predictive variables that has the highest covariance with the predicted (target) variable. In contrast to PCA and factor analysis, which also extract one or few factors that concisely describe the variability of data and correlations between predictors, respectively, PLS identifies a factor with the best ability to predict the target variable even though this factor may not be the most important source of common variation in the predictors.

按照 Light, Maslov and Rytchkov (2017) 自己的話說，PLS 的這個(gè)特點(diǎn)正是它相比于 PCA 的優(yōu)勢所在。因?yàn)橛行┕残畔H僅解釋了特征的共同波動但是卻和預(yù)期收益率無關(guān)，這些信息對于解釋資產(chǎn)的預(yù)期收益率來說是沒有幫助的，因此會影響 PCA 的結(jié)果，而 PLS 卻不會。為此，該文提出了一個(gè)兩步截面回歸來估計(jì)預(yù)期收益率：

在第一步中，用? $t$ ?期已實(shí)現(xiàn)收益率分別對? $t-1$ ?期每個(gè)公司特征獨(dú)立進(jìn)行截面回歸，得到每個(gè)特征各自的斜率? $\lambda_t^a$ ?。在第二步中，對每個(gè)公司? $i$ ?，將? $t$ ?時(shí)刻的公司特征? $X_{it}^a$ ?對第一部得到的? $\lambda_t^a$ ?進(jìn)行回歸，得到斜率? $\hat{\mu}_{it}$ ?。Light, Maslov and Rytchkov (2017) 證明了第二步回歸所得到的斜率的統(tǒng)計(jì)特性，指出它就是? $t$ ?時(shí)刻截面上 demean 之后預(yù)期收益率的估計(jì)（up to a scaling factor）。

值得一提的是，在上述兩步估計(jì)中，第一步僅用到了? $t$ ?和? $t-1$ ?時(shí)刻的信息，而第二步僅用到了? $t$ ?時(shí)刻的信息。因此這不僅僅是一個(gè)事后的 in-sample test，而且還是在實(shí)際投資中可以用來構(gòu)造樣本外投資組合的方法。在樣本外使用時(shí)，有兩點(diǎn)需要注意。首先，上述估計(jì)值和真實(shí) demean 預(yù)期收益率差了一個(gè) scaling factor。第二，即便沒有 scaling factor 的顧慮，上述估計(jì)也是截面上 demean 的預(yù)期收益率。所以如果基于該預(yù)期收益率的估計(jì)來進(jìn)行樣本外選股，那么 portfolio sort 無疑就是最自然的選擇，因?yàn)樗皇?scaling 或者 shift 的影響。這也正是 Light, Maslov and Rytchkov (2017) 在實(shí)證中采用的方法。此外，在實(shí)操層面，還有另外一個(gè)技巧。上述兩步法的第一步類似 Fama-MacBeth 的第二步，使用單期收益率對單期公司特征回歸（FM 是對 beta 回歸），得到? $t$ ?期的? $\lambda_t^a$ ?。考慮到單期數(shù)據(jù)噪聲比較大，因此可以使用過去一段時(shí)間的數(shù)據(jù)，并在每一期? $s\le t$ ?進(jìn)行估計(jì)，并將它們的? $\lambda_s^a$ ?取平均得到更準(zhǔn)確的? $\lambda$ ?。

在實(shí)證中，該文選擇了文獻(xiàn)中常見的 26 個(gè)公司特征作為被聚合的對象。下圖展示的就是該文的 portfolio sort 結(jié)果，其中 Panel A 在估計(jì)? $\lambda$ ?時(shí)僅使用了? $t$ ?和? $t-1$ ?期的信息；后面三個(gè) Panels 則利用了上述多期平均技巧。得到預(yù)期收益率的估計(jì)之后，根據(jù)其高低將股票分成 10 組，然后檢驗(yàn)每組以及 10 – 1 組的收益率（同時(shí)考慮等權(quán)和市值加權(quán)）。

從結(jié)果中可見：（1）無論等權(quán)還是市值加權(quán)，以 PLS 得到的估計(jì)值構(gòu)造的對沖組合總能獲得顯著的超額收益；（2）當(dāng)使用多期平均來估計(jì)時(shí)，超額收益率無論在經(jīng)濟(jì)上還是在統(tǒng)計(jì)上都更加顯著。除此之外，通過比較信息聚合和這 26 個(gè)單一變量，作者同樣指出兩點(diǎn)：（1）這些變量在預(yù)測收益率方面確實(shí)存在一些共性，這也支撐了該文提出的模型；（2）盡管如此，不同變量仍然包含了關(guān)于預(yù)期收益率的不同信息，只不過每個(gè)單一變量都是其所包含預(yù)測信息的噪聲版本。

為了說明 PLS 的過人之處，Light, Maslov and Rytchkov (2017) 將其和本文第一節(jié)提到的 Fama-MacBeth regression、rank-based approach、PCA 以及 factor analysis 進(jìn)行了對比。后面這些信息聚合方法的實(shí)證結(jié)果如下表所示。

以構(gòu)造的對沖組合超額收益率的?t-statistics 而論，PLS 方法優(yōu)于上述其他信息聚合方法，而和 PLS 最接近的要數(shù) rank-based approach。就這個(gè)結(jié)果而言，學(xué)界和業(yè)界常用的 rank-based approach 也是很有效的方法。

本節(jié)在 A 股市場對上述 PLS 方法進(jìn)行實(shí)證，看看和人們更熟悉的 rank-based approach 相比結(jié)果如何。實(shí)證中使用 BetaPlus 小組在《一個(gè)混合四因子模型》一文中介紹的十個(gè)協(xié)變量，它們包括賬面市值比（BM）、短期反轉(zhuǎn)、特質(zhì)波動率、MAX、異常換手率、SUE、ROA、應(yīng)計(jì)量、動量以及流動性沖擊。計(jì)算說明見下表。數(shù)據(jù)窗口橫跨 2000 年 1 月 1 日至 2022 年 5 月 31 日。

對于 PLS 來說，首先每月對每個(gè)指標(biāo)在截面上進(jìn)行標(biāo)準(zhǔn)化（具體數(shù)據(jù)處理方法請參考《因子投資：方法與實(shí)踐》的 3.1 節(jié)），然后采用前文介紹的兩步回歸法，估計(jì)每個(gè)月每支股票的預(yù)期收益率，并以估計(jì)值的高低作為分組排序的依據(jù)。在實(shí)證中，在兩步法的第二步中，對于? $\lambda$ ?，我們同時(shí)考慮了以下幾種情況：（1）僅用當(dāng)期? $\lambda$ ?；（2）分別使用過去 12 個(gè)月、36 個(gè)月以及 60 個(gè)月? $\lambda$ ?均值的情形。為了和 PLS 方法比較，實(shí)證中的另一種信息聚合方法采用平均 z-score 方法，即同樣每月在截面上將每個(gè)變量標(biāo)準(zhǔn)化得到 z-score，并通過其和預(yù)期收益率的關(guān)系調(diào)整其方向，然后取十個(gè)變量 z-score 的均值作為該股票當(dāng)月最終的 z-score，并以 z-score 的高低進(jìn)行分組排序的依據(jù)。由于在 PLS 方法中使用最長 60 個(gè)月的數(shù)據(jù)計(jì)算? $\lambda$ ?均值，因此為了統(tǒng)一比較，實(shí)證的窗口的起始時(shí)間較數(shù)據(jù)起始時(shí)間后移 60 個(gè)月，即從 2005 年 1 月 1 日開始。下面兩張表分別給出了等權(quán)和市值加權(quán)的結(jié)果。

觀察上述結(jié)果，可以總結(jié)出兩點(diǎn)：（1）由于估計(jì)誤差，使用當(dāng)期? $\lambda$ ?作為第二步的輸入難以取得很好的結(jié)果，而一旦采用了過去? $T$ ?期? $\lambda$ ?均值之后，PLS 方法的結(jié)果都有明顯的提升。（2）然而，無論是等權(quán)還是市值加權(quán)，即便使用了過去 60 期? $\lambda$ ?均值，PLS 方法的聚合結(jié)果都不如 z-score 均值法，這體現(xiàn)在兩種方法構(gòu)造的多空對沖組合月均收益率的差異上。但是值得一提的是，如果僅看多頭，那么當(dāng)采用市值加權(quán)時(shí)，以過去 60 期? $\lambda$ ?均值為第二步輸入的 PLS 方法和 z-score 方法十分接近。

和 Light, Maslov and Rytchkov (2017) 一文基于美股的結(jié)果相比，在業(yè)界更常用的 z-score 均值面前，PLS 兩步法似乎并沒有什么過人之處。但是，我們也不應(yīng)僅僅基于以上有限的結(jié)果就那么快對 PLS 方法在 A 股的表現(xiàn)下定論。今后可以通過更多的穩(wěn)健性分析來考察其能夠發(fā)揮的作用。

在協(xié)變量的高維數(shù)時(shí)代，如何聚合不同變量涵蓋的預(yù)測信息是非常重要的課題。在這方面，研究的思路應(yīng)著眼于剖析并有效利用不同變量所涵蓋的共有信息、每個(gè)變量所攜帶的獨(dú)有信息，以及剔除每個(gè)變量所涵蓋的巨大的噪聲。Light, Maslov and Rytchkov (2017) 為此提供了有益的思路。

然而，我們對信息聚合的追求并不能止步于此。信息聚合的目標(biāo)是為了獲得更加準(zhǔn)確的估計(jì)，因此無論是采用前文介紹的 PLS 還是其他方法（盡管這些方法的效果有所差異），聚合后的變量較單變量來說都會獲得更加顯著的超額收益。然而，這后面一個(gè)巨大的但卻往往被人們忽視的假設(shè)是，被用來信息聚合的單變量都是真實(shí)的。可是，如果某些或絕大部分協(xié)變量和預(yù)期收益率之間的關(guān)系是虛假的（p-hacking），那么聚合之后又會如何呢？是否會“錯(cuò)上加錯(cuò)”呢？如果是的話，又是否有什么更好的辦法來降低聚合的危害嗎？

我們擇日再議。

（Hint：對于這個(gè)問題，Rytchkov and Zhong (2020) 給出了答案。）

參考文獻(xiàn)

Asness, C. S., A. Frazzini, and L. H. Pedersen (2019). Quality minus junk.?Review of Accounting Studies?24(1), 34 – 112.

Cochrane, J. H. (2011). Presidential address: Discount rates.?Journal of Finance?66(4), 1047 – 1108.

Giannone, D., M. Lenza, and G. E. Primiceri (2021). Economic predictions with big data: The illusion of sparsity.?Econometrica?89(5), 2409 – 2437.

Harvey, C. R., Y. Liu, and H. Zhu (2016). … and the cross-section of expected returns.?Review of Financial Studies?29(1), 5 – 68.

Kelly, B. T., S. Pruitt, and Y. Su (2019). Characteristics are covariances: A unified model of risk and return.?Journal of Financial Economics?134(3), 501 – 524.

Kozak, S., S. Nagel, and S. Santosh (2020). Shrinking the cross-section.?Journal of Financial Economics?135(2), 271 – 292.

Lettau, M. and M. Pelger (2020a). Factors that fit the time series and cross-section of stocks returns.?Review of Financial Studies?33(5), 2274 – 2325.

Lettau, M. and M. Pelger (2020b). Estimating latent asset-pricing factors.Journal of Econometrics?218(1), 1 – 31.

Light, N., D. Maslov, and O. Rytchkov (2017). Aggregation of information about the cross section of stock returns: A latent variable approach.?Review of Financial Studies?30(4), 1339 – 1381.

Rytchkov, O. and X. Zhong (2020). Information aggregation and p-hacking.?Management Science?66(4), 1605 – 1626.

Stambaugh, R. F., J. Yu, and Y. Yuan (2015). Arbitrage asymmetry and the idiosyncratic volatility puzzle.?Journal of Finance?70(5), 1903 – 1948.

Stambaugh, R. F. and Y. Yuan (2017). Mispricing Factors.?Review of Financial Studies?30(4), 1270 – 1315.

免責(zé)聲明：入市有風(fēng)險(xiǎn)，投資需謹(jǐn)慎。在任何情況下，本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對任何人的投資建議。在任何情況下，本文作者及所屬機(jī)構(gòu)不對任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說明外，文中圖表均直接或間接來自于相應(yīng)論文，僅為介紹之用，版權(quán)歸原作者和期刊所有。

亚洲精品国产精品制服丝袜,亚洲欧美日韩精品a∨,97在线热免费视频精品视频,亚洲人成在线观看网站不卡

合格投資者聲明

更有效的信息聚合方法 ?