股票池历史数据
Ⅰ 如何用excel获取网页上的股票数据,并按照日期制成表格
可以通过Excel的获取外部数据功能来实现,具体操作如下:
1、选择你要获取数据的网.站(不是所有的网.页都能获取到你想.要数据哦),复制完整网.址备用
2、打开Excel,单击数据选项卡,选择获.取外部数据—自网.站按钮,会打开一个新建Web查询对话框。
3、输入刚才复制的网.址,会打开相应网.页。
4、根据提示,单击你需要的数据表前的黄色小键头,当其变为绿色对勾,代表选中状态。
5、单击导入按钮,选择数据在工作表中的存放位置,确定即可。
6、使用时,右击数据存放区域,刷新,成功后,即为最新数据。
Ⅱ 大智慧股票池的数据在哪个位置
股票池的数据就是你服务器接收的数据,股票池根据数据源和你使用的函数进行计算,然后将符合条件的股票预警,DATA数据文件。
Ⅲ 大智慧金色两点半股票池的功能介绍
超赢一号:超赢一号股票池,个股五重筛选,盘中即时刷新,安全、专业、高效(非截图)盘中深圳DDE:在盘中,您就可以查看到可动态更新的深圳DDX DDY DDZ以及DDE决策,可排序同花顺BBD:我们将同花顺流行的大盘/板块BBD以及排名数据都引入到软件中,即时更新大户室视频:这是专家超赢版拥有的功能,查看大智慧的官方视频解盘 大智慧超赢一号股票池(新功能)大智慧超赢一号股票池就像很多分析师在协同工作,每位分析师严格按照你设定好的程序,专门负责一方面的工作,并把选出来的股票送到下一位分析师做另一方面的分析。这种分析流程不一定是单一线程,他可以有分支和交并。各个分析模块按照你事先设定好的方式运行,比分析师更及时、更高效、更准确!所有股票都会被打上标记,以表明他目前已经通过了某个模块的鉴定,可以查询所有股票在股票池中的状态。我们可以设定一些关键的股票池,作为买入池,并把他直接输出到监控窗口。大智慧会事先做好的一些股票池,你可以直接利用这些池,也可以在这些池的基础上做进一步的延伸。系统还会从收益率、波动性和流动性三个方面对股票池进行评价,你可以根据评价的结果修改各个池的筛选条件,提高股票池的质量。
官方超赢数据分析指标SVZL(主力资金持仓分析)SVSH(散户线模型)SVZJ(资金流向决策分析)TRT顺势交易,盘中趋势,资金流向,超赢分类持仓
SVZL的分析思路延续TopView的机构持仓、大户持仓线分析模型,从我们对历史数据的统计测算来看,它与现有的TopView 数据的吻合度几乎达到了95%,并且实现了T+0,而我们知道TopView数据是延迟两个交易日的
SVSH反映散户进出动态,散户线可以说是市场的第三只眼睛,散户数的减少说明市场筹码的聚集,侧面反映了市场的趋势。超赢数据的SVSH精准的计算了散户的帐户变化和持仓变化情况
SVZJ指标跟踪活跃资金的进出情况,计算活跃资金的对每只股票的买卖金额数据。活跃资金不同与主力,他们的操作习惯是中短线,活跃资金的敏感度比一般市场主力要强,如果嗅到市场风声的转变,他们会快速卖出现在的股票。所以,跟踪活跃资金操作我们需要注意投资风险之外,更重要的是要跟的“紧”超赢分类持仓统计统计了散户、中户、大户、超大户的持仓变动。做到跑在市场前面,我们需要把握市场各参与者的一举一动,特别是机构投资者,了解了各分类用户的持仓分布,更能够做出正确判断。SVFL同时能够把握行情的转折点,在一段上涨或者下跌行情到了快要结束的时候,往往各类市场参与者之间的持仓变动会变得非常明显
顺势交易指标TRT综合使用了多个股票分析模型,模拟个股涨跌规律,为每一只股票提供最优买卖点提示
Ⅳ 股票池如何用python构建
股票池用python构建的方法是:使用第三方平台,目前可以使用的是聚宽,对比一下聚宽、优矿、大宽网(已经倒闭了),都大同小异,选哪个都一样。
虽然这些平台都大同小异,但是代码可不能简单复制粘贴,因为底层函数库是不一样的,有可能在别的平台根本用不了某个函数,并且简单复制到自己电脑中的python的话百分之百用不了。
代码的思路是,每个月底进行调仓,选出市值最小的股票交易,去掉ST/*ST/停牌/涨停的股票,然后选择最小市值的10只,基准是创业板综指,看看结果。
python构建数据获取方法是:
这里使用为了接下来的操作需要将一定历史范围的股票数据下载下来,这里下载起始时间为20160101,截至时间为运行代码的时间范围的历史日线数据。
这里以tushare为例, tushare获取历史数据有两种方式。
第一种是以迭代历史交易日的方式获取所有历史数据,假设获取三年的历史数据,一年一般220个交易日左右,那么3年需要请求660多次左右,如果以这种方式的话,就下载数据的时间只需要1分钟多点的样子。
第二种是以迭代所有股票代码的方式获取所有历史数据,股票数量有大概3800多个,需要请求3800多次,但是在积分有限的情况下一分钟最多请求500次,也就意味着仅下载数据的时间至少需要大概8分钟时间。
理论上,你获取的历史范围超过17.3年,那么使用第一种方式才比第二种方式快。
Ⅳ 大智慧股票池的作用是否被夸大
大智慧所谓的股票池,是大智慧技术人员精心打造的指标选股条件而已,不能说一点作用没有,但是没有一种系统是万能的,所以对于其股票池,需要了解其具体的操作原理,了解构成股票池的主要指标是什么,看是否符合自己的交易习惯并能认同,从而在股票池的基础上自己再加以研究,选出操作股票,同时密切关注个指标的变化,一边随时应变。
股票池一般来讲只要你运行着,就会自动把符合条件的股票纳入池中,如果没有,可能是你没运行或股票池。
有其他问题没有万能的系统,依据系统炒股必亏无疑。
另,大智慧技术自持网站有好多股票池可以下载,没必要花钱买他的。
Ⅵ 股票池是什么
问题一:什么叫股票池 股票池是指炒股的人设置的一个收藏夹,这个收藏夹收藏了炒股人自认为好的股票。他在炒作过程中把注意力集中在股票池里的股票上,时刻盯梢它们。买进卖出都经常是这些股票。这样做有很多好处,是每个股民操作股票的统一行为,只要你参与,你就会有一个股票池。
问题二:股票池是什么意思 意思是你一共买了几只股票,这几只股票就是你的股票池。股票池就是你装股票的池子。
问题三:股票池是什么意思 如何建立股票池 股票池(stock pool):一般是指从两地上市公司2000多支股票中,选出比较有操作意义的一些股票,放入一个池中,供投资者结合自己的情况和盘面变化,再从中选出适合自己买入的股票。股票池体现的是一种股票投资组合,也就是通常说的不要将鸡蛋放在一个篮子里。
怎样建立你的股票池?每位职业交易者都有自己的股票池。做长线有长线交易品种的股票池,做短线有短线交易品种的股票池,做中线波段的也有自己的股票池。不同的交易风格,决定了所选股票的性质和交易的时机。
1、看板块
对于公司选择,首先是行业问题,行业竞争激烈或穷途末路,即使是超人也无法力挽狂澜。对于中国企业来说,几乎没有什么尖端技术方面的创新能力,很难同国际巨头同台较量,因此,尽量不要选择带有尖端技术含量的企业。它们所谓的发展前景可能永远也不能实现,永远都只是海市蜃楼或华丽的噱头,即使后来能够实现,市场也早就发生变化了。
对于成熟性市场里的龙头企业可以适当考虑,这些企业具有一定的技术创新能力,能借鉴和模仿国外技术生产出适销对路和低成本的产品,市场适应能力强,且因熟悉国情并具有一定的垄断地位等,从而拥有一定的国内市场和部分国际市场。
对于具有垄断性质的公司需要慎重考虑,没有永远的垄断性,而垄断本身也易滋生腐败和落后,不利于企业长期发展。即:垄断也是投机性的,不要因为某些国有企业在机场、港口等地方的垄断优势,即大量屯仓,死捂不放。
对于矿产资源类的企业可以适当考虑。一者是因为很多资源是不可再生的,本身就具有很强的垄断性;二者是因为很多矿产类资源的开发需要特殊执照,又具有很强的开采垄断性;三者是因为中国是一个消费潜力巨大的市场,对能源和矿产资源的需求将持续增高。
对于消费类的生产、加工、制造、营销、服务性的企业也可以适当考虑。以前中国最大的问题是人口庞大,拖累了很多经济指标。但是现在,庞大的人口却使中国诸多消费性指标一跃位居世界前列。拥有巨大消费前景的企业可以考虑,但必须同时考虑竞争性和利润率。
此外,对那些行业领域有些特别,未来市场前景较好,公司专注主营业务,创新能力和研发能力较强,产品或技术在局部市场有垄断优势,市场份额逐年递增,不易受经济经济周期影响,股本数量比较少,公司知名度尚不高,股价偏低的公司等,也值得适当考虑。
2、看题材
很多时候,题材也可以被分成题材板块,但只有具有中长期效益的题材才值得我们重点关注。凡是能被市场利用并促进股价上涨的因素,都可以称之为题材。因此,应关注历史性事件、政策变化、利率变化、物价变化、技术创新、新生事物、突发事件、业绩年报等消息,但只有大背景、大题材、资金介入程度深的个股,才容易产生大行情。
3、看股质
在结合板块选择的基础上,可再来通过如下方式挑选个股:
1)当季每股收益比上一年同期至少应该上涨20%(删除一次性收益和基数太低的暴涨),同时,当季销售收入应该至少增加20%,或最近3个季度的销量增长率在加速。
2)每股收益年度增长率在过去3年内应保持显著而稳定的增长,复合增长率应至少为20%,同时资产净值回报率保持在15%以上。
3)公司的资产负债比比较低,或在过去几年正逐渐减少。
4)公司管理层要比较精明而稳定,产品的市场占有率要比较高;或新产品和服务具有一定的市场前景,从而使公司销售额和收益有持续增长的稳定性基础。
5)公司最近5年没有什么丑闻,尤其是财务数据不能做假。
6)最好所选股票有机构投资者的身影,但是要避免过多机构投资者扎堆的现象,同时要注意机构投资者的数量应该是在增加而不是减少;或者公司管理层有回购的动作。
7)一旦筛选出公司股票后......>>
问题四:调出股票池是什么意思 比如你选择了10只股票在自选或者购买里,然后去掉一只,那这只就称为调出股票池,一般机构喜欢用这样的专业词汇,比如机构他们长期跟踪的有20只股票,经过调研,做出调整,对其中一只或几只不再关注,他们就称为把某某股票调出股票池
问题五:股票机构内参 股票池是什么意思 股票机构内参是指券商内部参考,一般是指导内参针对人群操作的,股票池是指券商会仔细研究的一揽子股票,这一堆股票作为一个股票池,券商自营业务所购买的股票就从这些股票池中选择。
问题六:机构股票池是什么意思 股票池指的是特定人群选出的一堆供自己研究和选用的个股。你选的就是你的股票池,机构选的就是机构的股票池。由于机构资金量比较大,所以在股票池建立过程中的参考条件和个人的未必一样。所以散户的股票池未必会比机构的股票池差。
股票池中的个股都应该进行深入研究挖掘和盘面分析,不然空有一堆代码,达不到精选的目的,也是白搭。
祝投资顺利,其它问题欢迎加我网络HI详细询问。
问题七:股票池是什么?有免费的吗?怎么用最好呢 不知道说什么好了!你是新手中的新手啊
问题八:通达信策略股票池是什么 是可以提供 可自定义的程序化的自动选股的功能.
步骤是: 先放入备选池 ,选股条件 状态池, 然后这三者的连线用 流程线 来连接.
最后就是点击运行.
可以实现高度自动化和自定义策略来选股
问题九:A股里的高阳股票池是什么意思 股票池即一堆股票。高阳股票池可以理解为高阳先生看好或关注的一堆股票。
问题十:证券池是什么??? 就是各种证券类(包括金融衍生品)资产组合
今天心情好差,所以不想多说,希望理解下,
ok,goo叮 luck !
Ⅶ 大智慧股票池所参考的数据是怎么来的,原理是什么
原理:2个字:忽悠。
同一只股票。给你10个软件你会发现10个软件的所谓“特色数据”或者“独门数据”都是不同的。没有定论。如资金流向。机构买卖方向。主力动向等等。不信你试试。没10个。就试3个。
绝对的忽悠。靠这做股票还得了。开玩笑。
真正做股票的没人看这东西。去研究所谓主力的都是傻子。或者说他本身不是傻子。但他是去忽悠傻子。这些都是忽悠给新手看的。
所谓的参考数据全部是系统自动根据公式,历史走势处理得出的。完全机械化的结果。筛选成功率。准确率较高的。是将技术分析。和所谓的资金流做统计对比分析。这2东西本来就不靠谱。这种参考数据的处理弊端非常大。屏弃了当时特定,或者各种特定时期经济环境的影响。也就是说。数据处理时完全是依据“所有历史走势都是在同一经济环境下”这一谬论得出的结果。不可信。验证了一句话:历史总是相似的。但绝不会重复。(这句话也是套用经济增长理论和波动理论得来的)
证券的核心是宏观经济。连核心都没了。谈什么参考数据。你说是忽悠吗?
看看布郎的随机漫步理论。你会发现一切都是浮云。这个理论没有被记入股票3大理论完全是当时投资者唯心的结果。很可惜。养成了后面很多痴迷的技术分析派。
本着不误人子弟的精神。这个是最佳答案
Ⅷ 为什么我每次打开通达信都必须进行盘后数据下载
为什么我每次打开通达信都必须进行盘后数据下载?
如果不做盘后分析,也不脱机浏览,那就不用下载数据的。
可以通过工具---系统设置---设置1,把“收市后退出系统提示下载日线”前面的对钩去掉,点确定即可。
为什么我每次打开WORD都必须重新设置页面
是因为你的设置值与WORD的默认值不同。“文件——页面设置——设置好你需要的页边距——默认”
还可以将纸张大小、方向;字体、字号等设好默认为你常用的。
通达信软件下载盘后数据超级慢,重新装后还是那样为什么
那个本来就慢,他是在保存大量数据。用得多了你会发现,假如你今天看了大量的股票,它盘后下载完成的速度越快,因为你看过的已经下载了,盘后下载就能少些工作。反之,今天你什么也没看直接下载盘后数据,那么肯定会慢的很。
发现通达信收盘后数据下载数据第二天在条件选股系统里面无效,必须在第二天又重新再次下载才行?
开始使用公式后就别用通达信了,通达信在公式.预警.股票池自动交易方面不专业,连全推行情都没有,大智慧是最专业的。建议你换大智慧,条件选股做进股票池,包你好用
同花顺如何进行盘后数据下载?
1、要想使用选股功能,必须每天下载完整数据到本地。如果缺失数据,那么选出来的股票就不准确。
2、每天盘后下载,具体时间各个软件不太一样,一般16:00以后下载就没问题,可以保证数据的完整性。
3、盘中下载的数据肯定不准确,比如说,11:20下载数据,这时候有的股票还是下跌的,可到15:00收盘时,有的票已经涨停了,这样就会影响到很多指标数据。所以说,盘中下载的数据,对于全天的数据而言不准确。
4、盘前下载数据时可以的,但要注意一点,有的软件还不到9:00就初始化了;所以,要赶早下载。
5、有条件的话,还是盘后下载吧,这样时间比较充裕,也利于选股后进行分析。
使用通达信盘后数据下载n次了,为什么还提示,本地日线数据太少,可能导致结果不准确?
选择期间了没?至少两年的
不是当日收盘作业哦
为什么我的NBA2K11每次打开都必须打公牛队
啊?没遇到过,上3DM或者虎扑上问问吧
通达信5分钟数据
打开软件,"系统”-“盘后数据下载”-“5分钟数据"可以下载5分钟历史数据,可下载时间长达120天的数据,120天前的5分钟数据无法保存,估计哪位达人也没有。
为什么我的iphone5s每次更新或下载都必须关机一下才行
正常使用没有问题就OK, 更新固件必须要重启,正常现象
为什么必须进行数据质量审核和清理
看,取决于准确性、及时性和完整性。准确性是统计数据质量在统计信息客观真实性方面的体现,是统计数据使用者的首要要求。及时性是统计数据质量在统计信息的时间价值上的体现,是对统计数据形成和提供的高速度、快节奏、强效率的要求。完整性是统计数据在统计信息的内容含量上的体现,就是要求统计部门提供的统计数据在内容上应该包括使用者所需的所有项目,不能残缺不全。随着我国社会主义市场经济体系的建立和完善,经济领域呈现经济利益多元化、经济格局多样化、经济统计现化化的趋势,统计工作面临的困难和挑战越来越大。县(市、区)统计工作如何适应新形势的要求,发挥统计在经济社会发展中的作用,确保统计数据可信可靠。笔者认为要抓好以下几方面的工作:
Ⅸ 金融模型——多因子模型归因
本文主要详细介绍怎么使用多因子模型对组合资产进行归因分析,归因分析的内容为收益归因和风险归因。
上图列出了由马克维茨均值方差理论引出的三条路,其一为资产配置,我们本文不涉及,其二为资本资产定价(CAMP)的一条路,其三为套利定价理论(APT)的第三条路。第二条路和第三条路为本文讨论重点。
第二条和第三条路都是属于多因子分析的范畴,第二条路是知道因子收益的时间序列,通过时间序列上的回归去求因子暴露,为的是解释个券收益的组成部分。第三条路是知道截面因子暴露去回归截面上的因子收益,为的是挖掘有效因子,找到这个因子带来的超额收益。
使用多因子模型进行投资组合的归因分析,也主要包括基于净值的归因方法和基于持仓的归因方法两大类。基于净值的归因方法是走的第二条路,比较简单。基于持仓的归因方法走的是第三条路,比较复杂。
两者的区别主要表现在三个方面:
1、基于净值的归因方法是时间序列回归,基于持仓的归因方法是截面回归;
2、基于净值的归因方法主要来自CAMP(资本资产定价)模型,基于持仓的归因方法主要来自APT(套利定价)理论。
3、基于净值的归因方法要求比较简单,数据较少且较容易获取,仅需要组合的净值数据以及因子收益序列即可进行分析。而基于持仓的归因方法需要知道具体的组合权重、个股因子暴露等数据,来确定组合的因子暴露。
下面详细介绍两大类方法。
在介绍两个方法前,我们下面给出项目的框架如下图:
基于净值的归因方法,逻辑上很简单,它来自资本资产定价模型,用所有因子收益的时间序列去回归组合收益的时间序列。这样做的目的是,是把组合的收益分解在各个特定的因子上,认为组合或者个股的收益都可以被给定的特定因子收益加个股特质收益来解释,解释不了的部分直接扔给残差。这里要特别注意,此时特定因子收益在一个时间截面上是一个常数,对多所有股票都一样,这与另一种方法基于持仓的归因方法有本质的区别。
基于这种方法,人们开发出的模型很多,如下:
1、Fama-French三因子模型
2、Carhart四因子
在 FF 三因子模型的基础上,引入动量因子 UMD (高收益率股票组合与低收益率股票组合 收益率之差)
3、Fama五因子模型如下:
我们这里以Fama五因子模型为例,详细介绍这种方法的实现。
Fama五因子模型如下:
因为本文主要是项目实施前的参考文档,所以在此不介绍Fama五因子模型怎么得来的。只需要知道Fama五因子模型是上面公式。
其中,
表示资产 i 在时间 t 的收益率,
表示时间 t 的无风险收益率,
表示时间 t 的市场收益率,
即为时间 t 的风险溢价,
为时间 t 的市值因子的模拟组合收 益率(Small minus Big),
为时间 t 的账面市值比因子的模拟组合收益率(High minus Low),
为时间 t 的盈利因子的模拟组合收益率(Robust minus Weak),
为时间 t 的投资因子的模拟组合收益率(Conservative minus Aggressive),
为经过正交化 调整的估值因子模拟组合收益率,其余各变量含义与三因子模型相同。
均为回归待拟合系数,𝜖_{𝑖𝑡} 为残差项。
有了模型,下面我们具体去实现。
我们遵循机器学习项目的步骤,将Fama五因子模型归因分析的实现,归结为以下流程。
数据准备>>数据预处理>>构造Fama五因子>>数据分析>>回归分析>>归因分析
(1) 股票池:全A股,在每个时刻t均剔除ST、PT股票,剔除停牌及上市未满一个月的股票,剔除 BP 值为负的股票;
(2) 时间参数:2010年1月至2018年1月;
(3) 因子对应指标:
a) 市场因子指标:上证 指数;
b) 规模因子指标:总市值 = 每股股价 × 发行总股数;
c) 估值因子指标:账面市值比 BP,即市净率的倒数;
d) 盈利因子指标:扣除非经常性损益、摊薄的 ROE;
e) 投资因子指标:当期总资产相对上期总资产变化率;
f) 无风险利率设为零,个股收益率用 Wind 后复权收盘价核算;
g) 以自然月为频率,计算因子值并重新分层计算对应五因子收益率。
1、所有数据按同一时间,同一股票对齐,注意这里的财报指标相关的时间要使用财报公布时间不能使用财报报告期。
2、第一步产生的NA值,用前一个值去填充(因为这里回归的方式是时间序列回归)。
Fama 和 French(2015)原始的方法,是沿着某两个因子维度将股票分成 2x3=6 个组合(图表 2,3)。在这 2 个因子维度中,其中一个固定为规模,按照中位数分为两层, 另外一个为 BP、盈利或者投资因子,按照 30%,70%分位数分成 3 层(图表 3)。这样, 我们将得到 3 个 2x3 的股票资产组合(规模与 BP 两维度分组、规模与盈利两维度分组、 规模与投资两维度分组)。
因子的构造方法以及计算细节见下面表 1 和 2。在图表 2 中,我 们用 2 个字母来标记股票的分组,第一个字母表示规模大(B)或小(S),第二个字母在 BP 分层中,表示 BP 高(H)、中(N)、低(L);在盈利分组中表示强(R)、中(N)、弱(W);在投资 分组中,表示投资保守(C)、中(N)或者强(A)。
表1
表2
最后我们得到除了市场因子以外的 4 个因子 收益率为:
(1) SMB (small minus big):小市值组股票减大市值组股票平均月收益率;
(2) HML(highminuslowBP):高BP组股票减低BP组股票平均月收益率;
(3) RMW(Robustminusweakprofit):高ROE组的股票减低ROE组股票平均月收益率;
(4) CMA():总资产增长率低组股票减总资产增长率高组股票平均月收益率。
数据分析部分主要分析五因子组成数据的特性。其主要分析四部分内容:
1、五因子的均值,方差等summary统计。这样能说明那个因子在市场的收益中起到作用。
2、求均值是否显著异于零的假设检验对应的 t 统计量。目的是检验哪一个因子最能带来超额的收益。
3、五因子累计收益分析,一般是规定一个日期为起始日期,形成五因子的累积净值曲线,目的是用来分析五因子在历史上和现在的表现,和预估未来的表现。后面归因分析中会用到这里的累积。
4、五因子间的相关性分析。其目的是提出多吃公线性,用作下一步回归用。
这里可以剔除多重共线性,也可以不剔除,因为Fama在原始论文中就发现了了五因子中存在多重公线性,但是Fama并没有处理这个问题。所以这里也可以不处理。
去除多重共线性的方法为:
分别用4个因子对另一个因子进行线性回归,可以找到共线性因子,找到共线性因子后。
用四个因子去回归这个共线性的因子,生成的残差,作为这个因子的新值,这样既做可以去掉共线性,也因为是线性变化,不改变因子的方向。这种去除共线性的方法,使用与所有的多因子模型。包括APT多因子模型。
我们有了Fama五因子,将组合的收益时间序列作为因变量,直接进行回归,即可求出模型:
在求出模型的同时,求出回归的可决系数,检验模型的因子解释的有效性。
我们由五因子的累积净值走势图,可以分析出历史和当前那个因子起到主要作用,通过上面方差的回归系数,我们可以发现我们组合的收益来源,如果组合的主要收益来源和当前五因子收益表现最好的不一致,就要考虑进行调仓,高配表现好的因子。这就是基于净值的收益归因。
既然这里目标变量是组合的收益率,那么有上面模型,我们可以由因子的风险矩阵求出组合的总风险,且每一个因子的风险贡献都可以求出,道理和风险预算模型一致。这就是基于净值的风险归因。
额外的,在这个模型可以用来选股,我们选择 很小的股票和资产,因为这种股票和资产收益和风险可以被五因子所解释,风险小, 大的说明还有很多不能被五因子解释的部分,风险也大。
所以,我们使用Fama多因子选股的时候,只需用五因子回归市场上每一个股票,对生成的残差 有小到大排序,选择残差 小的股票。
基于持仓的归因方法,逻辑上比基于净值的归因方法要复杂的多,它来自套利定价模型(APT),用所有所有股票截面的因子的暴露序列去回归所有股票的收益序列。这种做法的目的是找到个股收益和因子收益之间的关系,寻找有效因子,通过有效因子来选择好的股票。
这种做法把重点放在了因子挖掘和最后资产的打分模型的选择上。
最后的模型打分,最后主要开发出来以下模型:
分层打分法、简单线性回归、随机森林、逻辑回归、支持向量机回归。
本文以简单线性回归为例,详细介绍这种方法归因分析的实现。
我们还是遵循机器学习的项目流程,来进行实现:
数据准备>>数据预处理>>单因子有效性检验>>数据分析>>回归分析>>归因分析
(1) 股票池:全A股,在每个时刻t均剔除ST、PT股票,剔除停牌及上市未满一个月的股票,剔除 BP 值为负的股票;
(2) 时间参数:2010年1月至2018年1月;
(3) 因子对应指标:
a) 市场因子指标:上证 指数;
b) 行业因子指标:申万一级行业指数。
c) 风格因子指标:市值size,PE,EBITA.(这里以这三个因子为例,APT框架的优势就是因子可以随便加)
1、所有数据按同一时间,同一股票对齐,注意这里的财报指标相关的时间要使用财报公布时间不能使用财报报告期。虽然这种方法是截面回归,但是要研究每个因子的有效性,所以必须列出各个因子的历史时间序列数据。
2、第一步产生的NA值,用截面该因子的均值填充。(这与上面的做法不一样)。
3、若因子NA比率超过30%,则舍弃该因子。
4、对每个因子的暴露(就是因子值)分布分析,剔除3-sigma以外的公司。(最后回归用,因为回归对极值敏感)
5、z-score标准化所有因子。(最后回归用,去量纲)
通常我们总认为行业和市值两个因子对股票的收益影响较大,所以在单独分析其他因子时,要把这两个因子暴露引起的收益剔除掉,也就是所谓的因子中性化。经常使用的方法是,用因子暴露作为因变量,用行业因子和市值因子去回归因子暴露,得到的残差就是中性化后的因子。
在这个过程中,因为行业是类别变量,不能直接进行回归,要引入哑变量的方式进行回归。
注意:因子暴露此时已经变成中心化的,所以一下处理全在中性化因子的基础上。
整个模型最麻烦的一步,也是最琐碎的一步。
在剔除了极端公司和填充了因子NA值后,我们对每个单因子进行有效性检验。做法有以下几种:
1、IC值检验
2、RIC值检验
3、IR检验
4、方差分析(ANOVA)给出p-value
5、随机森林
这里我们要先再确认下因子收益和因子暴露的概念:
因子暴露是因子具体的值,例如60000.sh(浦发银行)的PE(因子)值为5.62.纳闷普法银行在因子PE上的暴露就是5.62。
因子收益是用截面因子暴露去回归个股收益时产生的各项因子的回归系数。
为什么这样定义,其实原因来自上面的基于CAMP模型多因子分析。
我们有各个因子的暴露值后,可以对各个因子进行单因子检验,我们求当期(t期)的因子暴露值和下一期(t+1期)的个股收益的相关性数,得到当期(t期)的该因子的IC值:
其中:
这样求出来的IC值的绝对值越大越好,求出所有因子历史一段时间的IC值走势。因子IC的绝对值长时间处于很大的值,说明这个因子长期有效性很强,若偶尔绝对值很大,说明因子偶尔有效,也要保留,我们剔除那些IC长期很小的因子。认为这些因子有效性不强。
RIC的用法与IC的用法完全一致,只有RIC的定义不一样,我们求当期(t期)的因子暴露值和下一期(t+1期)的个股收益的秩相关性数,得到当期(t期)的该因子的RIC值:
其中:
RIC使用方式和IC一致。
从上面使用IC和RIC时,不是很方便,我们要看IC和RIC长期表现,这种表现是定性看的,我们需要构造一个量,定量的去衡量因子的长期表现。我们很简单的一个想法是:用IC的均值来衡量IC的长期表现好坏,用IC的标准差来衡量表现的稳定性。
于是我们综合两个在一起,构造IR如下:
这里的符号IR与信息比率是一样的,因为两者是一个东西,可以通过数学推导得到。
我们选取IR高的因子,丢弃IR低的因子。
方差分析是用来分析多组数据之间均值是否一样的统计分析方法,当检验的p值大与0.05是,说明多组之前的均值没有差异,当p值小于0,05 时,说明各组之间存在差异。对于选因子来说,我们希望每组之前有差异。所以p-value需要小于0.05.
P值的计算方式很复杂,其思想是用组内方差处于组间方差构造统计量,进行F检验。可直接调用python方差分析函数。
本步主要查看上一步选出的各个因子之间相关系数,为解决下面回归中的两两共线性问题,我们要合并部分因子,我们设置阀值0.6.认为相关系数在0.6 以上的因子看作同一组因子。
对同一组的因子,我们采用IC_IR加权的方式合并这些因子,将其合成一个因子。
其具体加权方式为: 。
这样我们就得到了组合因子。但是这一步虽然剔除了两两间的共线性,但是未能剔除多重共线性。
本步对上面筛选出的因子,以个股收益为因变量惊喜建模,常用模型为多元线性回归,获得如下回归方程:
其中: 是股票n在因子k 上的暴露。 为因子k的因子收益, 为股票n的残差收益,既股票特有收益率。
由这个回归方程,用最小二乘发,我们可以得到因子k的收益 。
进一步的,若现有一组合P,则这个组合P的收益率为:
其中: 为组合P中股票n的权重。
所以组合在因子k上的暴露设为 为:
所以此时,我们知道了组合的因子暴露,各因子的收益,所以可以得到组合里面个因子的收益贡献 :
所以,此时的多因子模型收益归因归因。
这里的风险归因分析和Barra一模一样:
由上面回归模型得到(将其向量化表示):
其中:r为股票的收益向量,X因子的暴露矩阵,f为股票的因子收益向量,u为股票的特质收益。
则我们的组合P的波动率为:
其中: 为所有因子收益学列的协方差矩阵,𝛥为股票特质收益序列的协方差矩阵。w为持仓权重。具体推导详见马克维茨均值方差理论。
有了组合的风险(既波动率),就可以得到以下三个量:
组合的系统风险:
组合的特质风险:
因子𝑖对总风险的贡献比例为(推导详见风险预算):
以上就是多因子模型在风险归因上的应用。
传统的这一版多因子,另一大作用是用来选股的,我们得到以下回归方程的时候。
最简单的,可以把最新一期的因子带入到回归方程,计算出的个股的的未来收益,将其线性映射到1到100,可以直接作为分数,我们选择分数高的股票即可。一般都是直接做前10%,做空后10%获得超额收益。
Ⅹ wind如何下载股票的每日收盘价
下载导出方法入下:
下载Excel,打开Excel插件,安装好wind插件,点插件-时间序列。
1.选择你要的股票池(先在wind数据库建立好自选股),
2.指标选择收盘价
3.选定时间段。只要电脑还行一千只股票十年数据都可以导出。
下载Excel,打开Excel插件,安装好wind插件,点插件-时间序列。
1.选择你要的股票池(先在wind数据库建立好自选股),
2.指标选择收盘价3.选定时间段。只要电脑还行一千只股票十年数据都可以导出。