股票池歷史數據
Ⅰ 如何用excel獲取網頁上的股票數據,並按照日期製成表格
可以通過Excel的獲取外部數據功能來實現,具體操作如下:
1、選擇你要獲取數據的網.站(不是所有的網.頁都能獲取到你想.要數據哦),復制完整網.址備用
2、打開Excel,單擊數據選項卡,選擇獲.取外部數據—自網.站按鈕,會打開一個新建Web查詢對話框。
3、輸入剛才復制的網.址,會打開相應網.頁。
4、根據提示,單擊你需要的數據表前的黃色小鍵頭,當其變為綠色對勾,代表選中狀態。
5、單擊導入按鈕,選擇數據在工作表中的存放位置,確定即可。
6、使用時,右擊數據存放區域,刷新,成功後,即為最新數據。
Ⅱ 大智慧股票池的數據在哪個位置
股票池的數據就是你伺服器接收的數據,股票池根據數據源和你使用的函數進行計算,然後將符合條件的股票預警,DATA數據文件。
Ⅲ 大智慧金色兩點半股票池的功能介紹
超贏一號:超贏一號股票池,個股五重篩選,盤中即時刷新,安全、專業、高效(非截圖)盤中深圳DDE:在盤中,您就可以查看到可動態更新的深圳DDX DDY DDZ以及DDE決策,可排序同花順BBD:我們將同花順流行的大盤/板塊BBD以及排名數據都引入到軟體中,即時更新大戶室視頻:這是專家超贏版擁有的功能,查看大智慧的官方視頻解盤 大智慧超贏一號股票池(新功能)大智慧超贏一號股票池就像很多分析師在協同工作,每位分析師嚴格按照你設定好的程序,專門負責一方面的工作,並把選出來的股票送到下一位分析師做另一方面的分析。這種分析流程不一定是單一線程,他可以有分支和交並。各個分析模塊按照你事先設定好的方式運行,比分析師更及時、更高效、更准確!所有股票都會被打上標記,以表明他目前已經通過了某個模塊的鑒定,可以查詢所有股票在股票池中的狀態。我們可以設定一些關鍵的股票池,作為買入池,並把他直接輸出到監控窗口。大智慧會事先做好的一些股票池,你可以直接利用這些池,也可以在這些池的基礎上做進一步的延伸。系統還會從收益率、波動性和流動性三個方面對股票池進行評價,你可以根據評價的結果修改各個池的篩選條件,提高股票池的質量。
官方超贏數據分析指標SVZL(主力資金持倉分析)SVSH(散戶線模型)SVZJ(資金流向決策分析)TRT順勢交易,盤中趨勢,資金流向,超贏分類持倉
SVZL的分析思路延續TopView的機構持倉、大戶持倉線分析模型,從我們對歷史數據的統計測算來看,它與現有的TopView 數據的吻合度幾乎達到了95%,並且實現了T+0,而我們知道TopView數據是延遲兩個交易日的
SVSH反映散戶進出動態,散戶線可以說是市場的第三隻眼睛,散戶數的減少說明市場籌碼的聚集,側面反映了市場的趨勢。超贏數據的SVSH精準的計算了散戶的帳戶變化和持倉變化情況
SVZJ指標跟蹤活躍資金的進出情況,計算活躍資金的對每隻股票的買賣金額數據。活躍資金不同與主力,他們的操作習慣是中短線,活躍資金的敏感度比一般市場主力要強,如果嗅到市場風聲的轉變,他們會快速賣出現在的股票。所以,跟蹤活躍資金操作我們需要注意投資風險之外,更重要的是要跟的「緊」超贏分類持倉統計統計了散戶、中戶、大戶、超大戶的持倉變動。做到跑在市場前面,我們需要把握市場各參與者的一舉一動,特別是機構投資者,了解了各分類用戶的持倉分布,更能夠做出正確判斷。SVFL同時能夠把握行情的轉折點,在一段上漲或者下跌行情到了快要結束的時候,往往各類市場參與者之間的持倉變動會變得非常明顯
順勢交易指標TRT綜合使用了多個股票分析模型,模擬個股漲跌規律,為每一隻股票提供最優買賣點提示
Ⅳ 股票池如何用python構建
股票池用python構建的方法是:使用第三方平台,目前可以使用的是聚寬,對比一下聚寬、優礦、大寬網(已經倒閉了),都大同小異,選哪個都一樣。
雖然這些平台都大同小異,但是代碼可不能簡單復制粘貼,因為底層函數庫是不一樣的,有可能在別的平台根本用不了某個函數,並且簡單復制到自己電腦中的python的話百分之百用不了。
代碼的思路是,每個月底進行調倉,選出市值最小的股票交易,去掉ST/*ST/停牌/漲停的股票,然後選擇最小市值的10隻,基準是創業板綜指,看看結果。
python構建數據獲取方法是:
這里使用為了接下來的操作需要將一定歷史范圍的股票數據下載下來,這里下載起始時間為20160101,截至時間為運行代碼的時間范圍的歷史日線數據。
這里以tushare為例, tushare獲取歷史數據有兩種方式。
第一種是以迭代歷史交易日的方式獲取所有歷史數據,假設獲取三年的歷史數據,一年一般220個交易日左右,那麼3年需要請求660多次左右,如果以這種方式的話,就下載數據的時間只需要1分鍾多點的樣子。
第二種是以迭代所有股票代碼的方式獲取所有歷史數據,股票數量有大概3800多個,需要請求3800多次,但是在積分有限的情況下一分鍾最多請求500次,也就意味著僅下載數據的時間至少需要大概8分鍾時間。
理論上,你獲取的歷史范圍超過17.3年,那麼使用第一種方式才比第二種方式快。
Ⅳ 大智慧股票池的作用是否被誇大
大智慧所謂的股票池,是大智慧技術人員精心打造的指標選股條件而已,不能說一點作用沒有,但是沒有一種系統是萬能的,所以對於其股票池,需要了解其具體的操作原理,了解構成股票池的主要指標是什麼,看是否符合自己的交易習慣並能認同,從而在股票池的基礎上自己再加以研究,選出操作股票,同時密切關注個指標的變化,一邊隨時應變。
股票池一般來講只要你運行著,就會自動把符合條件的股票納入池中,如果沒有,可能是你沒運行或股票池。
有其他問題沒有萬能的系統,依據系統炒股必虧無疑。
另,大智慧技術自持網站有好多股票池可以下載,沒必要花錢買他的。
Ⅵ 股票池是什麼
問題一:什麼叫股票池 股票池是指炒股的人設置的一個收藏夾,這個收藏夾收藏了炒股人自認為好的股票。他在炒作過程中把注意力集中在股票池裡的股票上,時刻盯梢它們。買進賣出都經常是這些股票。這樣做有很多好處,是每個股民操作股票的統一行為,只要你參與,你就會有一個股票池。
問題二:股票池是什麼意思 意思是你一共買了幾只股票,這幾只股票就是你的股票池。股票池就是你裝股票的池子。
問題三:股票池是什麼意思 如何建立股票池 股票池(stock pool):一般是指從兩地上市公司2000多支股票中,選出比較有操作意義的一些股票,放入一個池中,供投資者結合自己的情況和盤面變化,再從中選出適合自己買入的股票。股票池體現的是一種股票投資組合,也就是通常說的不要將雞蛋放在一個籃子里。
怎樣建立你的股票池?每位職業交易者都有自己的股票池。做長線有長線交易品種的股票池,做短線有短線交易品種的股票池,做中線波段的也有自己的股票池。不同的交易風格,決定了所選股票的性質和交易的時機。
1、看板塊
對於公司選擇,首先是行業問題,行業競爭激烈或窮途末路,即使是超人也無法力挽狂瀾。對於中國企業來說,幾乎沒有什麼尖端技術方面的創新能力,很難同國際巨頭同台較量,因此,盡量不要選擇帶有尖端技術含量的企業。它們所謂的發展前景可能永遠也不能實現,永遠都只是海市蜃樓或華麗的噱頭,即使後來能夠實現,市場也早就發生變化了。
對於成熟性市場里的龍頭企業可以適當考慮,這些企業具有一定的技術創新能力,能借鑒和模仿國外技術生產出適銷對路和低成本的產品,市場適應能力強,且因熟悉國情並具有一定的壟斷地位等,從而擁有一定的國內市場和部分國際市場。
對於具有壟斷性質的公司需要慎重考慮,沒有永遠的壟斷性,而壟斷本身也易滋生腐敗和落後,不利於企業長期發展。即:壟斷也是投機性的,不要因為某些國有企業在機場、港口等地方的壟斷優勢,即大量屯倉,死捂不放。
對於礦產資源類的企業可以適當考慮。一者是因為很多資源是不可再生的,本身就具有很強的壟斷性;二者是因為很多礦產類資源的開發需要特殊執照,又具有很強的開采壟斷性;三者是因為中國是一個消費潛力巨大的市場,對能源和礦產資源的需求將持續增高。
對於消費類的生產、加工、製造、營銷、服務性的企業也可以適當考慮。以前中國最大的問題是人口龐大,拖累了很多經濟指標。但是現在,龐大的人口卻使中國諸多消費性指標一躍位居世界前列。擁有巨大消費前景的企業可以考慮,但必須同時考慮競爭性和利潤率。
此外,對那些行業領域有些特別,未來市場前景較好,公司專注主營業務,創新能力和研發能力較強,產品或技術在局部市場有壟斷優勢,市場份額逐年遞增,不易受經濟經濟周期影響,股本數量比較少,公司知名度尚不高,股價偏低的公司等,也值得適當考慮。
2、看題材
很多時候,題材也可以被分成題材板塊,但只有具有中長期效益的題材才值得我們重點關注。凡是能被市場利用並促進股價上漲的因素,都可以稱之為題材。因此,應關注歷史性事件、政策變化、利率變化、物價變化、技術創新、新生事物、突發事件、業績年報等消息,但只有大背景、大題材、資金介入程度深的個股,才容易產生大行情。
3、看股質
在結合板塊選擇的基礎上,可再來通過如下方式挑選個股:
1)當季每股收益比上一年同期至少應該上漲20%(刪除一次性收益和基數太低的暴漲),同時,當季銷售收入應該至少增加20%,或最近3個季度的銷量增長率在加速。
2)每股收益年度增長率在過去3年內應保持顯著而穩定的增長,復合增長率應至少為20%,同時資產凈值回報率保持在15%以上。
3)公司的資產負債比比較低,或在過去幾年正逐漸減少。
4)公司管理層要比較精明而穩定,產品的市場佔有率要比較高;或新產品和服務具有一定的市場前景,從而使公司銷售額和收益有持續增長的穩定性基礎。
5)公司最近5年沒有什麼丑聞,尤其是財務數據不能做假。
6)最好所選股票有機構投資者的身影,但是要避免過多機構投資者扎堆的現象,同時要注意機構投資者的數量應該是在增加而不是減少;或者公司管理層有回購的動作。
7)一旦篩選出公司股票後......>>
問題四:調出股票池是什麼意思 比如你選擇了10隻股票在自選或者購買里,然後去掉一隻,那這只就稱為調出股票池,一般機構喜歡用這樣的專業詞彙,比如機構他們長期跟蹤的有20隻股票,經過調研,做出調整,對其中一隻或幾只不再關注,他們就稱為把某某股票調出股票池
問題五:股票機構內參 股票池是什麼意思 股票機構內參是指券商內部參考,一般是指導內參針對人群操作的,股票池是指券商會仔細研究的一攬子股票,這一堆股票作為一個股票池,券商自營業務所購買的股票就從這些股票池中選擇。
問題六:機構股票池是什麼意思 股票池指的是特定人群選出的一堆供自己研究和選用的個股。你選的就是你的股票池,機構選的就是機構的股票池。由於機構資金量比較大,所以在股票池建立過程中的參考條件和個人的未必一樣。所以散戶的股票池未必會比機構的股票池差。
股票池中的個股都應該進行深入研究挖掘和盤面分析,不然空有一堆代碼,達不到精選的目的,也是白搭。
祝投資順利,其它問題歡迎加我網路HI詳細詢問。
問題七:股票池是什麼?有免費的嗎?怎麼用最好呢 不知道說什麼好了!你是新手中的新手啊
問題八:通達信策略股票池是什麼 是可以提供 可自定義的程序化的自動選股的功能.
步驟是: 先放入備選池 ,選股條件 狀態池, 然後這三者的連線用 流程線 來連接.
最後就是點擊運行.
可以實現高度自動化和自定義策略來選股
問題九:A股里的高陽股票池是什麼意思 股票池即一堆股票。高陽股票池可以理解為高陽先生看好或關注的一堆股票。
問題十:證券池是什麼??? 就是各種證券類(包括金融衍生品)資產組合
今天心情好差,所以不想多說,希望理解下,
ok,goo叮 luck !
Ⅶ 大智慧股票池所參考的數據是怎麼來的,原理是什麼
原理:2個字:忽悠。
同一隻股票。給你10個軟體你會發現10個軟體的所謂「特色數據」或者「獨門數據」都是不同的。沒有定論。如資金流向。機構買賣方向。主力動向等等。不信你試試。沒10個。就試3個。
絕對的忽悠。靠這做股票還得了。開玩笑。
真正做股票的沒人看這東西。去研究所謂主力的都是傻子。或者說他本身不是傻子。但他是去忽悠傻子。這些都是忽悠給新手看的。
所謂的參考數據全部是系統自動根據公式,歷史走勢處理得出的。完全機械化的結果。篩選成功率。准確率較高的。是將技術分析。和所謂的資金流做統計對比分析。這2東西本來就不靠譜。這種參考數據的處理弊端非常大。屏棄了當時特定,或者各種特定時期經濟環境的影響。也就是說。數據處理時完全是依據「所有歷史走勢都是在同一經濟環境下」這一謬論得出的結果。不可信。驗證了一句話:歷史總是相似的。但絕不會重復。(這句話也是套用經濟增長理論和波動理論得來的)
證券的核心是宏觀經濟。連核心都沒了。談什麼參考數據。你說是忽悠嗎?
看看布郎的隨機漫步理論。你會發現一切都是浮雲。這個理論沒有被記入股票3大理論完全是當時投資者唯心的結果。很可惜。養成了後面很多痴迷的技術分析派。
本著不誤人子弟的精神。這個是最佳答案
Ⅷ 為什麼我每次打開通達信都必須進行盤後數據下載
為什麼我每次打開通達信都必須進行盤後數據下載?
如果不做盤後分析,也不離線瀏覽,那就不用下載數據的。
可以通過工具---系統設置---設置1,把「收市後退出系統提示下載日線」前面的對鉤去掉,點確定即可。
為什麼我每次打開WORD都必須重新設置頁面
是因為你的設置值與WORD的默認值不同。「文件——頁面設置——設置好你需要的頁邊距——默認」
還可以將紙張大小、方向;字體、字型大小等設好默認為你常用的。
通達信軟體下載盤後數據超級慢,重新裝後還是那樣為什麼
那個本來就慢,他是在保存大量數據。用得多了你會發現,假如你今天看了大量的股票,它盤後下載完成的速度越快,因為你看過的已經下載了,盤後下載就能少些工作。反之,今天你什麼也沒看直接下載盤後數據,那麼肯定會慢的很。
發現通達信收盤後數據下載數據第二天在條件選股系統裡面無效,必須在第二天又重新再次下載才行?
開始使用公式後就別用通達信了,通達信在公式.預警.股票池自動交易方面不專業,連全推行情都沒有,大智慧是最專業的。建議你換大智慧,條件選股做進股票池,包你好用
同花順如何進行盤後數據下載?
1、要想使用選股功能,必須每天下載完整數據到本地。如果缺失數據,那麼選出來的股票就不準確。
2、每天盤後下載,具體時間各個軟體不太一樣,一般16:00以後下載就沒問題,可以保證數據的完整性。
3、盤中下載的數據肯定不準確,比如說,11:20下載數據,這時候有的股票還是下跌的,可到15:00收盤時,有的票已經漲停了,這樣就會影響到很多指標數據。所以說,盤中下載的數據,對於全天的數據而言不準確。
4、盤前下載數據時可以的,但要注意一點,有的軟體還不到9:00就初始化了;所以,要趕早下載。
5、有條件的話,還是盤後下載吧,這樣時間比較充裕,也利於選股後進行分析。
使用通達信盤後數據下載n次了,為什麼還提示,本地日線數據太少,可能導致結果不準確?
選擇期間了沒?至少兩年的
不是當日收盤作業哦
為什麼我的NBA2K11每次打開都必須打公牛隊
啊?沒遇到過,上3DM或者虎撲上問問吧
通達信5分鍾數據
打開軟體,"系統」-「盤後數據下載」-「5分鍾數據"可以下載5分鍾歷史數據,可下載時間長達120天的數據,120天前的5分鍾數據無法保存,估計哪位達人也沒有。
為什麼我的iphone5s每次更新或下載都必須關機一下才行
正常使用沒有問題就OK, 更新固件必須要重啟,正常現象
為什麼必須進行數據質量審核和清理
看,取決於准確性、及時性和完整性。准確性是統計數據質量在統計信息客觀真實性方面的體現,是統計數據使用者的首要要求。及時性是統計數據質量在統計信息的時間價值上的體現,是對統計數據形成和提供的高速度、快節奏、強效率的要求。完整性是統計數據在統計信息的內容含量上的體現,就是要求統計部門提供的統計數據在內容上應該包括使用者所需的所有項目,不能殘缺不全。隨著我國社會主義市場經濟體系的建立和完善,經濟領域呈現經濟利益多元化、經濟格局多樣化、經濟統計現化化的趨勢,統計工作面臨的困難和挑戰越來越大。縣(市、區)統計工作如何適應新形勢的要求,發揮統計在經濟社會發展中的作用,確保統計數據可信可靠。筆者認為要抓好以下幾方面的工作:
Ⅸ 金融模型——多因子模型歸因
本文主要詳細介紹怎麼使用多因子模型對組合資產進行歸因分析,歸因分析的內容為收益歸因和風險歸因。
上圖列出了由馬克維茨均值方差理論引出的三條路,其一為資產配置,我們本文不涉及,其二為資本資產定價(CAMP)的一條路,其三為套利定價理論(APT)的第三條路。第二條路和第三條路為本文討論重點。
第二條和第三條路都是屬於多因子分析的范疇,第二條路是知道因子收益的時間序列,通過時間序列上的回歸去求因子暴露,為的是解釋個券收益的組成部分。第三條路是知道截面因子暴露去回歸截面上的因子收益,為的是挖掘有效因子,找到這個因子帶來的超額收益。
使用多因子模型進行投資組合的歸因分析,也主要包括基於凈值的歸因方法和基於持倉的歸因方法兩大類。基於凈值的歸因方法是走的第二條路,比較簡單。基於持倉的歸因方法走的是第三條路,比較復雜。
兩者的區別主要表現在三個方面:
1、基於凈值的歸因方法是時間序列回歸,基於持倉的歸因方法是截面回歸;
2、基於凈值的歸因方法主要來自CAMP(資本資產定價)模型,基於持倉的歸因方法主要來自APT(套利定價)理論。
3、基於凈值的歸因方法要求比較簡單,數據較少且較容易獲取,僅需要組合的凈值數據以及因子收益序列即可進行分析。而基於持倉的歸因方法需要知道具體的組合權重、個股因子暴露等數據,來確定組合的因子暴露。
下面詳細介紹兩大類方法。
在介紹兩個方法前,我們下面給出項目的框架如下圖:
基於凈值的歸因方法,邏輯上很簡單,它來自資本資產定價模型,用所有因子收益的時間序列去回歸組合收益的時間序列。這樣做的目的是,是把組合的收益分解在各個特定的因子上,認為組合或者個股的收益都可以被給定的特定因子收益加個股特質收益來解釋,解釋不了的部分直接扔給殘差。這里要特別注意,此時特定因子收益在一個時間截面上是一個常數,對多所有股票都一樣,這與另一種方法基於持倉的歸因方法有本質的區別。
基於這種方法,人們開發出的模型很多,如下:
1、Fama-French三因子模型
2、Carhart四因子
在 FF 三因子模型的基礎上,引入動量因子 UMD (高收益率股票組合與低收益率股票組合 收益率之差)
3、Fama五因子模型如下:
我們這里以Fama五因子模型為例,詳細介紹這種方法的實現。
Fama五因子模型如下:
因為本文主要是項目實施前的參考文檔,所以在此不介紹Fama五因子模型怎麼得來的。只需要知道Fama五因子模型是上面公式。
其中,
表示資產 i 在時間 t 的收益率,
表示時間 t 的無風險收益率,
表示時間 t 的市場收益率,
即為時間 t 的風險溢價,
為時間 t 的市值因子的模擬組合收 益率(Small minus Big),
為時間 t 的賬面市值比因子的模擬組合收益率(High minus Low),
為時間 t 的盈利因子的模擬組合收益率(Robust minus Weak),
為時間 t 的投資因子的模擬組合收益率(Conservative minus Aggressive),
為經過正交化 調整的估值因子模擬組合收益率,其餘各變數含義與三因子模型相同。
均為回歸待擬合系數,𝜖_{𝑖𝑡} 為殘差項。
有了模型,下面我們具體去實現。
我們遵循機器學習項目的步驟,將Fama五因子模型歸因分析的實現,歸結為以下流程。
數據准備>>數據預處理>>構造Fama五因子>>數據分析>>回歸分析>>歸因分析
(1) 股票池:全A股,在每個時刻t均剔除ST、PT股票,剔除停牌及上市未滿一個月的股票,剔除 BP 值為負的股票;
(2) 時間參數:2010年1月至2018年1月;
(3) 因子對應指標:
a) 市場因子指標:上證 指數;
b) 規模因子指標:總市值 = 每股股價 × 發行總股數;
c) 估值因子指標:賬面市值比 BP,即市凈率的倒數;
d) 盈利因子指標:扣除非經常性損益、攤薄的 ROE;
e) 投資因子指標:當期總資產相對上期總資產變化率;
f) 無風險利率設為零,個股收益率用 Wind 後復權收盤價核算;
g) 以自然月為頻率,計算因子值並重新分層計算對應五因子收益率。
1、所有數據按同一時間,同一股票對齊,注意這里的財報指標相關的時間要使用財報公布時間不能使用財報報告期。
2、第一步產生的NA值,用前一個值去填充(因為這里回歸的方式是時間序列回歸)。
Fama 和 French(2015)原始的方法,是沿著某兩個因子維度將股票分成 2x3=6 個組合(圖表 2,3)。在這 2 個因子維度中,其中一個固定為規模,按照中位數分為兩層, 另外一個為 BP、盈利或者投資因子,按照 30%,70%分位數分成 3 層(圖表 3)。這樣, 我們將得到 3 個 2x3 的股票資產組合(規模與 BP 兩維度分組、規模與盈利兩維度分組、 規模與投資兩維度分組)。
因子的構造方法以及計算細節見下面表 1 和 2。在圖表 2 中,我 們用 2 個字母來標記股票的分組,第一個字母表示規模大(B)或小(S),第二個字母在 BP 分層中,表示 BP 高(H)、中(N)、低(L);在盈利分組中表示強(R)、中(N)、弱(W);在投資 分組中,表示投資保守(C)、中(N)或者強(A)。
表1
表2
最後我們得到除了市場因子以外的 4 個因子 收益率為:
(1) SMB (small minus big):小市值組股票減大市值組股票平均月收益率;
(2) HML(highminuslowBP):高BP組股票減低BP組股票平均月收益率;
(3) RMW(Robustminusweakprofit):高ROE組的股票減低ROE組股票平均月收益率;
(4) CMA():總資產增長率低組股票減總資產增長率高組股票平均月收益率。
數據分析部分主要分析五因子組成數據的特性。其主要分析四部分內容:
1、五因子的均值,方差等summary統計。這樣能說明那個因子在市場的收益中起到作用。
2、求均值是否顯著異於零的假設檢驗對應的 t 統計量。目的是檢驗哪一個因子最能帶來超額的收益。
3、五因子累計收益分析,一般是規定一個日期為起始日期,形成五因子的累積凈值曲線,目的是用來分析五因子在歷史上和現在的表現,和預估未來的表現。後面歸因分析中會用到這里的累積。
4、五因子間的相關性分析。其目的是提出多吃公線性,用作下一步回歸用。
這里可以剔除多重共線性,也可以不剔除,因為Fama在原始論文中就發現了了五因子中存在多重公線性,但是Fama並沒有處理這個問題。所以這里也可以不處理。
去除多重共線性的方法為:
分別用4個因子對另一個因子進行線性回歸,可以找到共線性因子,找到共線性因子後。
用四個因子去回歸這個共線性的因子,生成的殘差,作為這個因子的新值,這樣既做可以去掉共線性,也因為是線性變化,不改變因子的方向。這種去除共線性的方法,使用與所有的多因子模型。包括APT多因子模型。
我們有了Fama五因子,將組合的收益時間序列作為因變數,直接進行回歸,即可求出模型:
在求出模型的同時,求出回歸的可決系數,檢驗模型的因子解釋的有效性。
我們由五因子的累積凈值走勢圖,可以分析出歷史和當前那個因子起到主要作用,通過上面方差的回歸系數,我們可以發現我們組合的收益來源,如果組合的主要收益來源和當前五因子收益表現最好的不一致,就要考慮進行調倉,高配表現好的因子。這就是基於凈值的收益歸因。
既然這里目標變數是組合的收益率,那麼有上面模型,我們可以由因子的風險矩陣求出組合的總風險,且每一個因子的風險貢獻都可以求出,道理和風險預算模型一致。這就是基於凈值的風險歸因。
額外的,在這個模型可以用來選股,我們選擇 很小的股票和資產,因為這種股票和資產收益和風險可以被五因子所解釋,風險小, 大的說明還有很多不能被五因子解釋的部分,風險也大。
所以,我們使用Fama多因子選股的時候,只需用五因子回歸市場上每一個股票,對生成的殘差 有小到大排序,選擇殘差 小的股票。
基於持倉的歸因方法,邏輯上比基於凈值的歸因方法要復雜的多,它來自套利定價模型(APT),用所有所有股票截面的因子的暴露序列去回歸所有股票的收益序列。這種做法的目的是找到個股收益和因子收益之間的關系,尋找有效因子,通過有效因子來選擇好的股票。
這種做法把重點放在了因子挖掘和最後資產的打分模型的選擇上。
最後的模型打分,最後主要開發出來以下模型:
分層打分法、簡單線性回歸、隨機森林、邏輯回歸、支持向量機回歸。
本文以簡單線性回歸為例,詳細介紹這種方法歸因分析的實現。
我們還是遵循機器學習的項目流程,來進行實現:
數據准備>>數據預處理>>單因子有效性檢驗>>數據分析>>回歸分析>>歸因分析
(1) 股票池:全A股,在每個時刻t均剔除ST、PT股票,剔除停牌及上市未滿一個月的股票,剔除 BP 值為負的股票;
(2) 時間參數:2010年1月至2018年1月;
(3) 因子對應指標:
a) 市場因子指標:上證 指數;
b) 行業因子指標:申萬一級行業指數。
c) 風格因子指標:市值size,PE,EBITA.(這里以這三個因子為例,APT框架的優勢就是因子可以隨便加)
1、所有數據按同一時間,同一股票對齊,注意這里的財報指標相關的時間要使用財報公布時間不能使用財報報告期。雖然這種方法是截面回歸,但是要研究每個因子的有效性,所以必須列出各個因子的歷史時間序列數據。
2、第一步產生的NA值,用截面該因子的均值填充。(這與上面的做法不一樣)。
3、若因子NA比率超過30%,則舍棄該因子。
4、對每個因子的暴露(就是因子值)分布分析,剔除3-sigma以外的公司。(最後回歸用,因為回歸對極值敏感)
5、z-score標准化所有因子。(最後回歸用,去量綱)
通常我們總認為行業和市值兩個因子對股票的收益影響較大,所以在單獨分析其他因子時,要把這兩個因子暴露引起的收益剔除掉,也就是所謂的因子中性化。經常使用的方法是,用因子暴露作為因變數,用行業因子和市值因子去回歸因子暴露,得到的殘差就是中性化後的因子。
在這個過程中,因為行業是類別變數,不能直接進行回歸,要引入啞變數的方式進行回歸。
注意:因子暴露此時已經變成中心化的,所以一下處理全在中性化因子的基礎上。
整個模型最麻煩的一步,也是最瑣碎的一步。
在剔除了極端公司和填充了因子NA值後,我們對每個單因子進行有效性檢驗。做法有以下幾種:
1、IC值檢驗
2、RIC值檢驗
3、IR檢驗
4、方差分析(ANOVA)給出p-value
5、隨機森林
這里我們要先再確認下因子收益和因子暴露的概念:
因子暴露是因子具體的值,例如60000.sh(浦發銀行)的PE(因子)值為5.62.納悶普法銀行在因子PE上的暴露就是5.62。
因子收益是用截面因子暴露去回歸個股收益時產生的各項因子的回歸系數。
為什麼這樣定義,其實原因來自上面的基於CAMP模型多因子分析。
我們有各個因子的暴露值後,可以對各個因子進行單因子檢驗,我們求當期(t期)的因子暴露值和下一期(t+1期)的個股收益的相關性數,得到當期(t期)的該因子的IC值:
其中:
這樣求出來的IC值的絕對值越大越好,求出所有因子歷史一段時間的IC值走勢。因子IC的絕對值長時間處於很大的值,說明這個因子長期有效性很強,若偶爾絕對值很大,說明因子偶爾有效,也要保留,我們剔除那些IC長期很小的因子。認為這些因子有效性不強。
RIC的用法與IC的用法完全一致,只有RIC的定義不一樣,我們求當期(t期)的因子暴露值和下一期(t+1期)的個股收益的秩相關性數,得到當期(t期)的該因子的RIC值:
其中:
RIC使用方式和IC一致。
從上面使用IC和RIC時,不是很方便,我們要看IC和RIC長期表現,這種表現是定性看的,我們需要構造一個量,定量的去衡量因子的長期表現。我們很簡單的一個想法是:用IC的均值來衡量IC的長期表現好壞,用IC的標准差來衡量表現的穩定性。
於是我們綜合兩個在一起,構造IR如下:
這里的符號IR與信息比率是一樣的,因為兩者是一個東西,可以通過數學推導得到。
我們選取IR高的因子,丟棄IR低的因子。
方差分析是用來分析多組數據之間均值是否一樣的統計分析方法,當檢驗的p值大與0.05是,說明多組之前的均值沒有差異,當p值小於0,05 時,說明各組之間存在差異。對於選因子來說,我們希望每組之前有差異。所以p-value需要小於0.05.
P值的計算方式很復雜,其思想是用組內方差處於組間方差構造統計量,進行F檢驗。可直接調用python方差分析函數。
本步主要查看上一步選出的各個因子之間相關系數,為解決下面回歸中的兩兩共線性問題,我們要合並部分因子,我們設置閥值0.6.認為相關系數在0.6 以上的因子看作同一組因子。
對同一組的因子,我們採用IC_IR加權的方式合並這些因子,將其合成一個因子。
其具體加權方式為: 。
這樣我們就得到了組合因子。但是這一步雖然剔除了兩兩間的共線性,但是未能剔除多重共線性。
本步對上面篩選出的因子,以個股收益為因變數驚喜建模,常用模型為多元線性回歸,獲得如下回歸方程:
其中: 是股票n在因子k 上的暴露。 為因子k的因子收益, 為股票n的殘差收益,既股票特有收益率。
由這個回歸方程,用最小二乘發,我們可以得到因子k的收益 。
進一步的,若現有一組合P,則這個組合P的收益率為:
其中: 為組合P中股票n的權重。
所以組合在因子k上的暴露設為 為:
所以此時,我們知道了組合的因子暴露,各因子的收益,所以可以得到組合裡面個因子的收益貢獻 :
所以,此時的多因子模型收益歸因歸因。
這里的風險歸因分析和Barra一模一樣:
由上面回歸模型得到(將其向量化表示):
其中:r為股票的收益向量,X因子的暴露矩陣,f為股票的因子收益向量,u為股票的特質收益。
則我們的組合P的波動率為:
其中: 為所有因子收益學列的協方差矩陣,𝛥為股票特質收益序列的協方差矩陣。w為持倉權重。具體推導詳見馬克維茨均值方差理論。
有了組合的風險(既波動率),就可以得到以下三個量:
組合的系統風險:
組合的特質風險:
因子𝑖對總風險的貢獻比例為(推導詳見風險預算):
以上就是多因子模型在風險歸因上的應用。
傳統的這一版多因子,另一大作用是用來選股的,我們得到以下回歸方程的時候。
最簡單的,可以把最新一期的因子帶入到回歸方程,計算出的個股的的未來收益,將其線性映射到1到100,可以直接作為分數,我們選擇分數高的股票即可。一般都是直接做前10%,做空後10%獲得超額收益。
Ⅹ wind如何下載股票的每日收盤價
下載導出方法入下:
下載Excel,打開Excel插件,安裝好wind插件,點插件-時間序列。
1.選擇你要的股票池(先在wind資料庫建立好自選股),
2.指標選擇收盤價
3.選定時間段。只要電腦還行一千隻股票十年數據都可以導出。
下載Excel,打開Excel插件,安裝好wind插件,點插件-時間序列。
1.選擇你要的股票池(先在wind資料庫建立好自選股),
2.指標選擇收盤價3.選定時間段。只要電腦還行一千隻股票十年數據都可以導出。