量化選股策略是什么?多因子模型是什么?
2015-09-28 09:59 南方財富網(wǎng) www.travelwithnise.com
量化選股策略是什么?多因子模型是什么?
[ 多因子模型是量化選股中最重要的一類(lèi)模型,其基本思想就是找到某些和收益率最相關(guān)的指標。并根據該指標,構建一個(gè)股票組合,期望該組合在未來(lái)的一段時(shí)間跑贏(yíng)或者跑輸指數。如果跑贏(yíng),則可以做多該組合,同時(shí)做空期指,賺取正向阿爾法收益;如果是跑輸,則可以做多期指,融券做空該組合,賺取反向阿爾法收益。多因子模型的關(guān)鍵是找到因子與收益率之間的關(guān)聯(lián)性 ]
基本概念
多因子模型是應用最廣泛的一種選股模型,基本原理是采用一系列的因子作為選股標準,滿(mǎn)足這些因子的股票則被買(mǎi)入,不滿(mǎn)足的則賣(mài)出。
舉一個(gè)簡(jiǎn)單的例子:如果有一批人參加馬拉松,想要知道哪些人會(huì )跑到平均成績(jì)之上,那只需在跑前做一個(gè)身體測試即可。那些健康指標靠前的運動(dòng)員,獲得超越平均成績(jì)的可能性較大。多因子模型的原理與此類(lèi)似,我們只要找到那些對企業(yè)的收益率最相關(guān)的因子即可。
各種多因子模型核心的區別第一是在因子的選取上,第二是在如何用多因子綜合得到一個(gè)最終的判斷。
一般而言,多因子選股模型有兩種判斷方法,一是打分法,二是回歸法。
打分法就是根據各個(gè)因子的大小對股票進(jìn)行打分,然后按照一定的權重加權得到一個(gè)總分,根據總分再對股票進(jìn)行篩選;貧w法就是用過(guò)去的股票的收益率對多因子進(jìn)行回歸,得到一個(gè)回歸方程,然后再把最新的因子值代入回歸方程得到一個(gè)對未來(lái)股票收益的預判,然后再以此為依據進(jìn)行選股。
多因子選股模型的建立過(guò)程主要分為候選因子的選取、選股因子有效性的檢驗、有效但冗余因子的剔除、綜合評分模型的建立和模型的評價(jià)及持續改進(jìn)等5個(gè)步驟。
候選因子的選取
候選因子的選擇主要依賴(lài)于經(jīng)濟邏輯和市場(chǎng)經(jīng)驗,但選擇更多和更有效的因子無(wú)疑是增強模型信息捕獲能力,提高收益的關(guān)鍵因素之一。
例如:在2011年1月1日,選取流通市值最大的50只股票,構建投資組合,持有到2011年底,則該組合可以獲得10%的超額收益率。這就說(shuō)明了在2011年這段時(shí)間,流通市值與最終的收益率之間存在正相關(guān)關(guān)系。
從這個(gè)例子可以看出這個(gè)最簡(jiǎn)單的多因子模型說(shuō)明了某個(gè)因子與未來(lái)一段時(shí)間收益率之間的關(guān)系。同樣的,可以選擇其他的因子,例如可能是一些基本面指標,如PB、PE、EPS 增長(cháng)率等,也可能是一些技術(shù)面指標,如動(dòng)量、換手率、波動(dòng)等,或者是其他指標,如預期收益增長(cháng)、分析師一致預期變化、宏觀(guān)經(jīng)濟變量等。
同樣的持有時(shí)間段,也是一個(gè)重要的參數指標,到底是持有一個(gè)月,還是兩個(gè)月,或者一年,對最終的收益率影響很大。
選股因子有效性的檢驗
一般檢驗方法主要采用排序的方法檢驗候選因子的選股有效性。例如:可以每月檢驗,具體而言,對于任意一個(gè)候選因子,在模型形成期的第一個(gè)月初開(kāi)始計算市場(chǎng)中每只正常交易股票的該因子的大小,按從小到大的順序對樣本股票進(jìn)行排序,并平均分為n個(gè)組合,一直持有到月www.travelwithnise.com末,在下月初再按同樣的方法重新構建n個(gè)組合并持有到月末,每月如此,一直重復到模型形成期末。
上面的例子就已經(jīng)說(shuō)明了這種檢驗的方法,同樣的可以隔N個(gè)月檢驗,比如2個(gè)月、3個(gè)月,甚至更長(cháng)時(shí)間。還有一個(gè)參數是候選組合的數量,是50只,還是100只,都是非常重要的參數。具體的參數最優(yōu)的選擇,需要用歷史數據進(jìn)行檢驗。
有效但冗余因子的剔除
不同的選股因子可能由于內在的驅動(dòng)因素大致相同等原因,所選出的組合在個(gè)股構成和收益等方面具有較高的一致性,因此其中的一些因子需要作為冗余因子剔除, 而只保留同類(lèi)因子中收益最好、區分度最高的一個(gè)因子。例如成交量指標和流通量指標之間具有比較明顯的相關(guān)性。流通盤(pán)越大的,成交量一般也會(huì )比較大,因此在選股模型中,這兩個(gè)因子只選擇其中一個(gè)。
冗余因子剔除的方法:假設需要選出k 個(gè)有效因子,樣本期共m 月,那么具體的冗余因子剔除步驟為:
(1)先對不同因子下的n個(gè)組合進(jìn)行打分,分值與該組合在整個(gè)模型形成期的收益相關(guān),收益越大,分值越高;
(2)按月計算個(gè)股的不同因子得分間的相關(guān)性矩陣;
(3)在計算完每月因子得分相關(guān)性矩陣后,計算整個(gè)樣本期內相關(guān)性矩陣的平均值;
(4)設定一個(gè)得分相關(guān)性閥值 MinScoreCorr,將得分相關(guān)性平均值矩陣中大于該閥值的元素所對應的因子只保留與其他因子相關(guān)性較小、有效性更強的因子,而其他因子則作為冗余因子剔除。
綜合評分模型的建立和選股
綜合評分模型選取去除冗余后的有效因子,在模型運行期的某個(gè)時(shí)間開(kāi)始,例如每個(gè)月初,對市場(chǎng)中正常交易的個(gè)股計算每個(gè)因子的最新得分并按照一定的權重求得所有因子的平均分。最后,根據模型所得出的綜合平均分對股票進(jìn)行排序,然后根據需要選擇排名靠前的股票。例如,選取得分最高的前20%股票,或者選取得分最高的 50 到 100 只股票等。
舉個(gè)例子:可以構建一個(gè)多因子模型為(PE,PB,ROE),在月初的時(shí)候,對這個(gè)幾個(gè)因子進(jìn)行打分,然后得分最高的50個(gè)股票作為投資組合,在下個(gè)月按照同樣的方法進(jìn)行輪流替換。持續一段時(shí)間后,考場(chǎng)該投資組合的收益率是否跑贏(yíng)比較基準,這就是綜合評分模型的建立和后驗過(guò)程。
當然這個(gè)例子是一個(gè)最簡(jiǎn)單的例子,實(shí)戰中的模型可能會(huì )比較復雜,比如沃爾評分法就是一個(gè)復雜的多因子模型,它是對股票進(jìn)行分行業(yè)比較,算每個(gè)行業(yè)的得分高的組合,然后再組合成投資籃子。
模型的評價(jià)及持續改進(jìn)
一方面,由于量選股的方法是建立在市場(chǎng)無(wú)效或弱有效的前提之下,隨著(zhù)使用多因子選股模型的投資者數量的不斷增加,有的因子會(huì )逐漸失效,而另一些新的因素可能被驗證有效而加入到模型當中;另一方面,一些因子可能在過(guò)去的市場(chǎng)環(huán)境下比較有效,而隨著(zhù)市場(chǎng)風(fēng)格的改變,這些因子可能短期內失效,而另外一些以前無(wú)效的因子會(huì )在當前市場(chǎng)環(huán)境下表現較好。
另外,計算綜合評分的過(guò)程中,各因子得分的權重設計、交易成本考慮和風(fēng)險控制等都存在進(jìn)一步改進(jìn)的空間。因此在綜合評分選股模型的使用過(guò)程中會(huì )對選用的因子、模型本身做持續的再評價(jià)和不斷的改進(jìn)以適應變化的市場(chǎng)環(huán)境。