当前位置:首页 » 股市行情 » ema如何用于机器学习股市预测

ema如何用于机器学习股市预测

发布时间: 2022-11-25 04:53:33

㈠ 股票问题,MACD上的DIF,EMA,DEA,DEF等是什么意思

平滑异同移动平均线MACD

MACD由正负差(DIF)和异同平均数(DEA)两部分组成,当然,正负差是核心,DEA是辅助。DIF是快速平滑移动平均线(EMA)与慢速平滑移动平均线(EMA)的差。快速和慢速的区别是进行指数平滑时采用的参数大小不同,快速是短期的,慢速是长期的。以现在常用的参数12和26为例,DIF的计算过程为:今日EMA(12)=2/(12+1)×今日收盘价+11/(12+1)×昨日EMA(12);今日EMA(26)=2/(26+1)×今日收盘价+25/(26+1)×昨日EMA(26);以上两个公式是指数平滑的公式,平滑因子分别为2/13和2/27。如果选用别的系数,则可照此法处理。DIF=EMA(12)-EMA(26)。DEA是DIF的移动平均,也就是连续数日的DIF的算术平均。此外,在分析软件上还有一个指标叫柱状线(BAR)。BAR=2×(DIF-DEA)。

macd指标又叫指数平滑异同移动平均线,是由查拉尔·阿佩尔(Gerald Apple)所创造的,是一种研判股票买卖时机、跟踪股价运行趋势的技术分析工具。

一、macd指标的原理

macd指标是根据均线的构造原理,对股票价格的收盘价进行平滑处理,求出算术平均值以后再进行计算,是一种趋向类指标。

macd指标是运用快速(短期)和慢速(长期)移动平均线及其聚合与分离的征兆,加以双重平滑运算。而根据移动平均线原理发展出来的macd,一则去除了移动平均线频繁发出假信号的缺陷,二则保留了移动平均线的效果,因此,macd指标具有均线趋势性、稳重性、安定性等特点,是用来研判买卖股票的时机,预测股票价格涨跌的技术分析指标 。

macd指标主要是通过EMA、DIF和DEA(或叫macd、DEM)这三值之间关系的研判,DIF和DEA连接起来的移动平均线的研判以及DIF减去DEM值而绘制成的柱状图(BAR)的研判等来分析判断行情,预测股价中短期趋势的主要的股市技术分析指标。其中,DIF是核心,DEA是辅助。DIF是快速平滑移动平均线(EMA1)和慢速平滑移动平均线(EMA2)的差。BAR柱状图在股市技术软件上是用红柱和绿柱的收缩来研判行情。

二、macd指标的计算方法
macd在应用上,首先计算出快速移动平均线(即EMA1)和慢速移动平均线(即EMA2),以此两个数值,来作为测量两者(快慢速线)间的离差值(DIF)的依据,然后再求DIF的N周期的平滑移动平均线DEA(也叫macd、DEM)线。
以EMA1的参数为12日,EMA2的参数为26日,DIF的参数为9日为例来看看macd的计算过程:

1、计算移动平均值(EMA)
12日EMA的算式为
EMA(12)=前一日EMA(12)×11/13+今日收盘价×2/13
26日EMA的算式为
EMA(26)=前一日EMA(26)×25/27+今日收盘价×2/27

2、计算离差值(DIF)
DIF=今日EMA(12)-今日EMA(26)

3、计算DIF的9日EMA
根据离差值计算其9日的EMA,即离差平均值,是所求的macd值。为了不与指标原名相混淆,此值又名DEA或DEM。
今日DEA(macd)=前一日DEA?8/10+今日DIF?2/10
计算出的DIF和DEA的数值均为正值或负值。

理论上,在持续的涨势中,12日EMA线在26日 EMA线之上,其间的正离差值(+DIF)会越来越大;反之,在跌势中离差值可能变为负数(—DIF),也会越来越大,而在行情开始好转时,正负离差值将会缩小。指标macd正是利用正负的离差值(±DIF)与离差值的N日平均线(N日EMA)的交叉信号作为买卖信号的依据,即再度以快慢速移动线的交叉原理来分析买卖信号。另外,macd指标在股市软件上还有个辅助指标——BAR柱状线,其公式为:BAR=2?(DIF-DEA),我们还是可以利用BAR柱状线的收缩来决定买卖时机。

离差值DIF和离差平均值DEA是研判macd的主要工具。其计算方法比较烦琐,由于目前这些计算值都会在股市分析软件上由计算机自动完成,因此,投资者只要了解其运算过程即可,而更重要的是掌握它的研判功能。另外,和其他指标的计算一样,由于选用的计算周期的不同,macd指标也包括日macd指标、周macd指标、月macd指标年macd指标以及分钟macd指标等各种类型。经常被用于股市研判的是日macd指标和周macd指标。虽然它们的计算时的取值有所不同,但基本的计算方法一样。

在实践中,将各点的 DIF和DEA(macd)连接起来就会形成在零轴上下移动的两条快速(短期)和慢速(长期)线,此即为macd图。

㈡ 股票中,EMA的计算公式是什么简单、通俗点。

EMA表示快(慢)速平滑移动线。其中快速是12日计算的,公式如下:今日:EMA(12):[2/(12+1)]*今日收盘价加[11/(12+1)]*作日EMA(12)

㈢ MACD公式中的昨日的12日EMA 是什么意思

EMA是计算指数平滑移动平均数,12日EMA是12日内平均指数的总和/12,当日的12日EMA就是当日以前12日内平均指数的总和,以此类推昨日就是昨天以前的,移动平均线也可以设置成n天的。

MACD在应用上,,先计算出快速移动平均线即12日的EMA1,和慢速移动平均线,即26日的EMA2,以这两个数值之间的差值得出DIFF,再求出DIFF的9日平滑移动平均线DEA,得出MACD=2×(DIFF-DEA)。

(3)ema如何用于机器学习股市预测扩展阅读:

注意事项:

1、MACD在低位发生第一次金叉时,股价在较多情况下涨幅有限,或小涨后出现较大的回调,造成买进的投资者出现套牢亏损情况。

2、背驰时不理是否击穿或突破前期高(低)位,高位时只要有顶背驰建议坚定卖出,不博股价能重新翻红,除非大阳或涨停,其为寻找短期买卖点的奇佳手段,短期幅度15%以上,但中线走势则要结合长期形态及其他。

3、判断第一卖点成立的技巧,是股价横盘、MACD死叉卖出,也就是说,当股价经过连续的上涨出现横盘时,5日、10日移动平均线尚未形成死叉,但MACD率先死叉,死叉之日便是第一卖点形成之时,应该卖出或减仓。

4、在绝对高点卖股票时,决不能等MACD死叉后再卖,因为当MACD死叉时股价已经下跌了许多,在虚假顶卖股票必须参考K线组合。

参考资料来源:网络-MACD指标

参考资料来源:网络-MACD线

参考资料来源:网络-EMA

㈣ 股票不能通过机器学习来预测,你知道是为什么吗

因为股票市场是非线性的,而且是变化多端的,所以是没有办法进行人为预测的。而机器一般都是被人设定好的程序,所以也没有办法对股票来进行预测。现在很多人都对理财比较感兴趣,所以大家都会对自己的财产进行合理的分配有些人就会拿出自己一些财产来进行炒股。炒股是一门学问,所以并不是每一个人都能够在故事当中获得大量的收益的。

机器只能够模拟过去的股票市场,让大家在学习股票的时候对股票行情和市场有一个基本的了解。但是机器是没有办法预测未来的,所以想要通过机器来预测股市是根本不可能的事情。所以那些想要走捷径,想通过机器预测股票行情的人还是脚踏实地的自己买一些相关的书籍和课程自己学习吧。

㈤ ema均线指标和实战方法

EMA即指数平均数指标( Exponential Moving Average, EXPMA或EMA),也是一种趋向类指标。其构造原理是:对收盘价进行加权算术平均,用于判断价格未来走势的变动趋势。与MACD指标、DMA指标相比,EMA指标由于其计算公式中着重考虑了当天价格(当期)行情的权重,决定了其作为一类趋势分析指标,在使用中克服了MACD指标对于价格走势的滞后性缺陷,同时,也在一定程度上消除了DMA指标在某些时候对于价格走势所产生的信号提前性,是一个非常有效的分析指标。

拓展资料

收盘价,几乎可以说是市场上最容易被记住的一个最重要的数据,但我们却很少注意到收盘价的盘面反馈。所谓收盘价的盘面反馈是指收盘以后停留在盘面上的挂盘状况,包括10个买卖价位及相应的挂盘数量。其实我们可以从中得到不少的信息,特别是盘中主力的信息,尽管盘中主力也许并不想告诉我们。
事实上,收盘价是市场参与者们所共同认可的价格,是一天中大家所接受的价格。而最高价是大多数人认为好的卖出价格,最低价是大多数人认为好的买进价格,而收盘价是不再进行交易的价格。
因此研判收盘价有着重要意义,无论当天股价如何振荡,最终将定格在收盘价上,有人说主力可以凭借资金实力做出收盘价,这确实是,但主力做周线,特别是月线的收盘价难度比较大,因为耗资巨大。从这个角度看,月线以及周线的收盘价最具研判意义。聪明的主力会利用自己的资金做煽风点火之人,而不是全部依赖自己的真金白银去做收盘价。
沪深股市的收盘价并不完全是最后一笔交易的成交价格,而是一个加权平均价,也叫已调整收盘价。
正常运作情况下,港股的收市价是按交易日最后一分钟内五个按盘价的中位数计算。
系统由下午三时五十九分整开始每隔十五秒录取股份按盘价一次,一共摄取五个按盘价。
现举例如下:
摄取 时间 买盘价 沽盘价 最后录得价 按盘价
第一次 下午3:59:00 $39.40 $39.50 $39.50 $39.50
第二次 下午3:59:15 $39.40 $39.50 $39.50 $39.50
第三次 下午3:59:30 $39.40 $39.50 $39.40 $39.40
第四次 下午3:59:45 $39.30 $39.50 $39.40 $39.40
第五次 下午4:00:00 $39.20 $39.30 $39.30 $39.30
按盘价排序:$39.30 $39.40 $39.40 $39.50 $39.50,则收盘价取中位数$39.40。

㈥ EMA在股票技术中的含义

EMA是一个加权平均,加权的目的在于使得某部分的收盘价的变化对趋势影响更大,区别于简单平均的一视同仁。
EMA(12),表示的是12天的加权移动平均。
W=2÷(12+1)=0.1538=2/13;
EMA(12)=(收盘价-昨日的EMA)×2/13+昨日的EMA(这个公式变化一下会更清晰)
=收盘价×2/13+昨日的EMA×(1-2/13)
=收盘价*2/13+昨日的EMA×11/13
这样意思很明显了,这个EMA(12)的计算值表示的是今天的收盘价的权重分配为2/13,之前的11天计算的EMA分配为11/13。

EMA与MA的作用相同,都是体现一段时间的趋势,区别在于EMA更注重当天收盘价对未来趋势的影响,分配权重大点,相对MA来看,就是反应快点。 但问题在于是不是反应快就是好呢?就是另外一个问题了,就如成语,欲速则不达——个人理解。

㈦ 股票中EMA是什么意思

EMA(Exponential Moving Average)是指数移动平均值。也叫EXPMA指标,它也是一种趋向类指标,指数移动平均值是以指数式递减加权的移动平均。

当要比较数值与均价的关系时,用MA就可以了,而要比较均价的趋势快慢时,用EMA更稳定;有时,在均价值不重要时,也用EMA来平滑和美观曲线。

其公式为:

EMAtoday=α * Pricetoday+ ( 1 - α ) * EMAyesterday;

其中,α为平滑指数,一般取作2/(N+1)。在计算MACD指标时,EMA计算中的N一般选取12和26天,因此α相应为2/13和2/27。

当公式不断递归,直至EMA1出现,EMA1是没有定义的。EMA1的取值有几种不同的方法,通常情况下取EMA1为Price1,另外有的技术是将EMA1取值为开头4到5个数值的均值。

从该式中可以更清楚地看出EMA加权平均的特性。在EMA指标中,每天价格的权重系数以指数等比形式缩小。

时间越靠近当今时刻,它的权重越大,说明EMA函数对近期的价格加强了权重比,更能及时反映近期价格波动情况。

所以EMA比MA更具参考价值,而EMA也不容易出现死叉和金叉,所以一旦出现要立即作出反映,对周线处理,EMA就更加稳定了。

㈧ macd公式中的ema是什么意思

ema是计算指数平滑移动平均数,12日ema指的是12日内平均指数的总和/12,当日的12日ema就是当日以前12日内平均指数的总和。以此类推昨日就是昨天以前的。移动平均线也可以设置成n天的。
macd计算公式
macd在应用上,,先计算出快速移动平均线即12日的ema1,和慢速移动平均线,即26日的ema2,,以这两个数值之间的差值得出diff,,然后再求出diff的9日平滑移动平均线dea.,最后得出macd=2×(diff-dea).

<1>计算12日和26日移动平均线ema1和ema2
当日ema(12)=前一日ema(12)×11/13+当日收盘价×2/13
当日ema(26)=前一日ema(26)×25/27+当日收盘价×2/27
<2>计算离差值(diff)
diff=当日ema(12)-当日ema(26)
<3>计算9日离差平均值dea
当日dea=前一日dea×8/10+当日diff×2/10
<4>计算macd
macd=2×(diff-dea)

离差值diff和离差平均值dea是研判macd的主要工具,,其计算方法比较烦琐,。由于目前这些数值在股市分析软件上都由计算机自动完成,。因此投资者只要了解其运算过程即可,,更重要的是掌握它的研判功能。.另外和其它技术指标一样,,由于选取的计算周期的不同,,macd指标也包括日macd、,周macd、,月macd、,年macd指标,以及5分钟,、15分钟,、30分钟,、60分钟等分时macd.、常被用于股市研判的是日macd指标和周macd指标,虽然它们计算时的取值有所不同,但计算方法基本相同。.

㈨ 股市中的指数平均数指标即EMA的含义、计算公式~~谢谢!

网络上面不是有嘛
EMA(Exponential Moving Average),指数平均数指标。也叫EXPMA指标,它也是一种趋向类指标,指数平均数指标是以指数式递减加权的移动平均。 求X的N日指数平滑移动平均,在股票公式中一般表达为:EMA(X,N),它真正的公式表达是:当日指数平均值=平滑系数*(当日指数值-昨日指数平均值)+昨日指数平均值;平滑系数=2/(周期单位+1);由以上公式推导开,得到:EMA(C,N)=2*C/(N+1)+(N-1)/(N+1)*昨天的指数收盘平均值; 算法是:若Y=EMA(X,N),则Y=〔2*X+(N-1)*Y’〕/(N+1),其中Y’表示上一周期的Y值。EMA引用函数在计算机上使用递归算法很容易实现,但不容易理解。例举分析说明EMA函数。 X是变量,每天的X值都不同,从远到近地标记,它们分别记为X1,X2,X3,….,Xn 如果N=1,则EMA(X,1)=〔2*X1+(1-1)*Y’〕/(1+1)=X1 如果N=2,则EMA(X,2)=〔2*X2+(2-1)*Y’〕/(2+1)=(2/3)*X2+(1/3)X1 如果N=3,则EMA(X,3)=〔2*X3+(3-1)*Y’〕/(3+1)=〔2*X3+2*((2/3)*X2+(1/3)*X1)〕/4=(1/2)*X3+(1/3)*X2+(1/6)*X1 如果N=4,则EMA(X,4)=〔2*X4+(4-1)*Y’〕/(4+1)=2/5*X4+3/5*((1/2)*X3+(1/3)*X2+(1/6)*X1) =2/5*X4+3/10*X3+1/5*X2+1/10*X1 如果N=5,则EMA(X,5)=2/(5+1)*X5+(5-1)/(5+1)(2/5*X4+3/10*X3+3/15*X2+3/30*X1) =(1/3)*X5+(4/15)*X4+(3/15)*X3+(2/15)*X2+(1/15)*X1 …………循环 X1 (2/3)*X2+(1/3)X1 (3/6)*X3+(2/6)*X2+(1/6)*X1 (4/10)*X4+(3/10)*X3+(2/10)*X2+(1/10)*X1 (5/15)*X5+(4/15)*X4+(3/15)*X3+(2/15)*X2+(1/15)*X1 任何时候系数之和恒为1。如果X是常量,每天的X值都不变,则EMA(X,N)=MA(X,N). 从以上的例举分析中,我们可以看到时间周期越近的X值它的权重越大,说明EMA函数对近期的X值加强了权重比,更能及时反映近期X值的波动情况。 所以EMA比Ma更具参考价值,而ema也不容易出现死叉和金叉,所以一旦出现要立即作出反映!对周线处理,ema就更加稳定了。 理解了MA,EMA的含义后,就可以理解其用途了,简单的说,当要比较数值与均价的关系时,用MA就可以了,而要比较均价的趋势快慢时,用EMA更稳定;有时,在均价值不重要时,也用EMA来平滑和美观曲线

㈩ 如何运用机器学习解决复杂系统的预测问题

在市场这种系统里, 有两个关键要素, 一个是个体和个体之间的互相作用(博弈),一个是系统与外部环境(地球资源)之间的相互作用(反馈),因此而形成复杂模式(Pattern), 这种模式通常很难预测。
而这种类型的系统我们通常定义为复杂系统: 由大量单元互相作用组成的系统, 由于集体行为的非线性(总体不等于个体之和), 而形成具备无数层级的复杂组织。或者称为涌现性。
复杂科学即研究复杂系统的一套联系不同尺度现象的数学方法。在人类试图理解那些和自身生存最相关的东西时,而经典物理学的还原论(把整体拆成部分)思维的却不适用。物理预测的核心方法是动力学方法, 即人们由实验出发抽象出引起运动改变的原因, 把这些原因量化为变量,用微分方程来描述, 从而取得对整个未来的精确解,如麦克斯韦方程组可以预测从光波的速度到磁线圈转动发电任何的电磁学现象。而你却无法通过了解市场上每个人的特性就很好的预测整个市场走势。
复杂系统难以预测的原理可以从以下几方面理解:
1, 高维诅咒: 构成现实生活的系统往往被大量未知变量决定, 比如生物由无数的细胞组成。 基因,是由无数独立的单元组成的, 市场, 由无数的交易者组成, 这些用物理的描述方法来预测, 就是极高维度空间的运动问题。维度,首先使得再简单的方程形式都十分复杂难解。
此处补充维度的科学定义: 维度是一个系统里可以独立变化的变量个数, 一个有非常多变量的系统,如复杂网络,假如每个变量不是互相独立,也可以是低维系统。 比如一个军营里的方阵,即使人数众多, 也会因为大家都做着一模一样的动作,而只有一个独立变量,成为一维系统。
2, 非线性诅咒:高维度系统的维度之间具有复杂的相互作用,导致我们不能把系统分解为单一维度然后做加法的方法研究。 高维加上非线性我们将得到对初级极为敏感的混沌系统。

非线性的一个重要推论是组织的产生, 因为非线性,1+1可以大于2或小于2, 为组织的产生提供了理论基础。
3, 反馈诅咒: 复杂系统中反馈无处不在, 即使是一个简单的一维系统, 反馈也可以使得系统的特性很丰富, 最典型的反馈是某种记忆效应, 使得系统产生复杂的路径依赖, 此刻你的现实与历史深刻关联,而关联方法导致复杂的模式产生。
反身性是一种由预测产生的特殊反馈, 当你预测股市的价格, 会引起你的交易策略变化从而影响你的预测, 是为反身性。
4, 随机诅咒: 复杂系统往往含有不包含确定规律的随机噪声,加上这些噪声, 系统的行为更加难预测, 而很多时候, 我们也无法区分一个系统里发现的模式是噪声导致还是由于元件之间的相互作用。
这四大诅咒是这些系统难以理解和预测的原因, 而这个时候, 复杂系统和机器学习的方法论可以作为一种非常有力的手段帮我们从复杂性中挖掘模式。
第一种方法叫模型驱动(Model approch), 即想办法找到事物变化的原因, 用一种降维的思路列出微分方程, 即从非常繁复的要素中化简出最重要的一个或者两个, 从而化繁琐为简单,不管三七二十一先抓住主要矛盾。其中的范例便是非线性动力学。
注: 此处我们有两个基本假设让非线性动力学得到简化,一个是只讨论连续变量,另一个是不考虑系统内的随机性(无噪声项)。
1, 如果一个系统可以化简到一维, 那么你只需要研究其内部存在的反馈性质并描述它即可。 负反馈导致稳定定点产生, 正反馈导致不稳定性。 很多事物多可以抽象为一维系统,包括简单环境下的人口增长问题。
2, 如果一个系统可以化简到二维, 那么你需要研究两个维度间的相互作用,最终可以互为负反馈而稳定下来,互为正反馈而爆发,或者产生此消彼长的周期轨道。 比如恋爱中的男女是个二维系统, 互为负反馈就回到普通朋友, 互为正反馈在爱欲中爆发-比如罗密欧与朱丽叶, 此消彼长那是玩捉迷藏的周期游戏。
3, 如果一个系统是三维的, 则混沌可能产生。 混沌即对初值极为敏感的运动体系。 你一旦偏离既定轨道一点, 即几乎无法回去。
4, 如果一个系统大于三维, 那么你需要用一个复杂网络描述它的运动, 这个时候我们可以得到我们复杂系统的主角- collective phenomena & emergence。 复杂网络的性质主要取决于单体间相互作用的方式, 以及系统与外界交换能量的方法, 这两者又息息相关。 最终我们得到涌现。

复杂网络的动力学往往混沌难以预测,对于高维混沌系统, 第一个方法也只能给出对事物定性的描述, 而我们可以祭出我们的第二种方法: 先不管数据背后错综复杂的动因,而是直接以数据驱动我们的预测。
这其中的哲学内涵即贝叶斯分析框架: 即先不预测, 而是列出所有可能的结果及根据以往知识和经验每种结果发生的可能性(先验概率),之后不停吸收新观测数据, 调整每种可能结果的概率大小(后验概率),将想得到的结果概率最大化(MAP)最终做出决策。
如果你把贝叶斯分析的框架自动化, 让电脑完成, 你就得到机器学习的最基本框架。
机器学习如果可以进入一个问题中, 往往要具备三个条件:
1, 系统中可能存在模式
2, 这种模式不是一般解析手段可以猜测到的。
3, 数据可以获取。
如果三点有一点不符,都很难运用机器学习。
机器学习的一个核心任务即模式识别, 也可以看出它和刚才讲的复杂系统提到的模式的关系。我们讲复杂系统难以通过其成分的分析对整体进行预测,然而由于复杂系统通常存在模式, 我们通常可以模式识别来对系统进行归类, 并预测各种可能的未来结果。比如一个投行女因为工作压力过大而自杀了, 那么在她之前的活动行为数据(比如点击手机的某些app的频率)里是否可能存在某种模式? 这种模式是否可以判定她之后的行为类型? 并且这个过程可否通过历史数据由计算机学习?如果都可以,这就是一个机器学习问题。
刚才讲的几大诅咒, 高维, 非线性, 复杂反馈,随机性也称为机器学习需要核心面对的几大困难, 由此得到一系列机器学习的核心算法。

机器学习在现实生活中被用于非常多的方面, 最常见的如商务洞察(分类,聚类, 推荐算法), 智能语音语义服务(时间序列处理,循环网络), 各种自动鉴别系统如人脸识别,虹膜识别 ,癌症检测(深度卷积网络), 阿尔法狗,机器人控制(深度强化学习算法)。 而由方法论分, 又可以分成有监督学习, 无监督学习, 和强化学习。

在八月份的巡洋舰科技的《机器学习vs复杂系统特训课》中,我着重讲了几种机器学习的基本方法:
1. 贝叶斯决策的基本思想:
你要让机器做决策, 一个基本的思路是从统计之前数据挖掘已有的模式(pattern)入手, 来掌握新的数据中蕴含的信息。 这个pattern在有监督学习的例子里, 就是把某种数据结构和假设结论关联起来的过程,我们通常用条件概率描述。 那么让机器做决策, 就是通过不停的通过新数据来调整这个数据结构(特征)与假设结果对应的条件概率。通常我们要把我们预先对某领域的知识作为预设(prior),它是一个假设结果在数据收集前的概率密度函数,然后通过收集数据我们得到调整后的假设结果的概率密度函数, 被称为后验概率(posterior),最终的目标是机器得到的概率密度函数与真实情况最匹配, 即 Maximum a posterior(MAP), 这是机器学习的最终目标。
2, 朴素贝叶斯分类器到贝叶斯网络:
分类,是决策的基础,商业中要根据收集客户的消费特征将客户分类从而精准营销。 金融中你要根据一些交易行为的基本特征将交易者做分类。 从贝叶斯分析的基本思路出发我们可以迅速得到几种分类器。
首当其冲的朴素贝叶斯分类器,它是机器学习一个特别质朴而深刻的模型:当你要根据多个特征而非一个特征对数据进行分类的时候,我们可以假设这些特征相互独立(或者你先假设相互独立),然后利用条件概率乘法法则得到每一个分类的概率, 然后选择概率最大的那个作为机器的判定。
图: 朴素贝叶斯分类器的基本框架, c是类别, A是特征。
如果你要根据做出分类的特征不是互相独立,而是互相具有复杂关联,这也是大部分时候我们面临问题的真相, 我们需要更复杂的工具即贝叶斯网络。 比如你对某些病例的判定, 咳嗽, 发烧, 喉咙肿痛都可以看做扁条体发炎的症候, 而这些症候有些又互为因果, 此时贝叶斯网络是做出此类判定的最好方法。构建一个贝叶斯网络的关键是建立图模型 , 我们需要把所有特征间的因果联系用箭头连在一起, 最后计算各个分类的概率。

图:贝叶斯网络对MetaStatic Cancer的诊断,此处的特征具有复杂因果联系
贝叶斯分析结合一些更强的假设,可以让我们得到一些经常使用的通用分类器, 如逻辑斯提回归模型,这里我们用到了物理里的熵最大假设得到玻尔兹曼分布, 因此之前简单贝叶斯的各个特征成立概率的乘积就可以转化为指数特征的加权平均。 这是我们日常最常用的分类器之一。 更加神奇的是, 这个东西形式上同单层神经网络。

图: logistic函数,数学形式通玻尔兹曼分布, 物理里熵最大模型的体现
3, 贝叶斯时间序列分析之隐马模型:
贝叶斯时间序列分析被用于挖掘存储于时间中的模式,时间序列值得是一组随时间变化的随机变量,比如玩牌的时候你对手先后撒出的牌即构成一个时间序列。 时间序列模式的预设setting即马尔科夫链, 之前动力学模式里讲到反馈导致复杂历史路径依赖,当这种依赖的最简单模式是下一刻可能出现的状态只与此刻的状态有关而与历史无关, 这时候我们得到马尔科夫链。
马尔科夫链虽然是贝叶斯时间序列分析的基准模型,然而现实生活中遇到的时间序列问题, 通常不能归于马尔科夫链,却可以间接的与马尔科夫链关联起来,这就是隐马过程,所谓含有隐变量的马尔科夫过程。

图: 隐马过程示意

语音识别就是一类特别能利用隐马过程的应用, 在这里语音可以看做一组可观测的时间序列, 而背后的文字是与之关联的马尔科夫链, 我们需要从可观测的量, 按照一定的概率分布反推不可观测的量, 并用马尔科夫链的观点对其建模, 从而解决从语音到文字的反推过程。 当今的语音识别则用到下面紧接讲的深度学习模型。
4, 深度学习
刚刚讲的分类问题, 只能根据我们已知的简单特征对事物进行分类, 但假设我们手里的数据连需要提取的特征都不知道, 我们如何能够对事物进行分类呢? 比如你要从照片识别人名, 你都不知道选哪个特征和一个人关联起来。 没关系, 此时我们还有一个办法, 就是让机器自发学习特征, 因此祭出深度学习大法。通常在这类问题里, 特征本身构成一个复杂网络,下级的特征比较好确定, 而最高层的特征, 是由底层特征的组合确定的, 连我们人类自己都不能抽象出它们。
深度学习即数据内涵的模式(特征)本身具备上述的多层级结构时候,我们的机器学习方法。 从以毒攻毒的角度看, 此时我们的机器学习机器也需要具有类似的多级结构,这就是大名鼎鼎的多层卷积神经网络。深度学习最大的优势是具有更高级的对“结构”进行自动挖掘的能力,比如它不需要我们给出所有的特征,而是自发去寻找最合适对数据集进行描述的特征。 一个复杂模式-比如“人脸” 事实上可以看做一个简单模式的层级叠加, 从人脸上的轮廓纹理这种底层模式, 到眼睛鼻子这样的中级模式, 直到一个独特个体这样最高级的复杂模式, 你只有能够识别底层模式,才有可能找到中级模式, 而找到中级模式才方便找到高级模式, 我们是不能从像素里一步到达这种复杂模式的。 而是需要学习这种从简单模式到复杂模式的结构, 多层网络的结构应运而生。
图: 从具体特征到抽象特征逐级深入的多级神经网络
6, RNN和神经图灵机
如果时间序列数据里的模式也包含复杂的多层级结构, 这里和我之前说的复杂系统往往由于反馈导致复杂的时间依赖是一致的, 那么要挖掘这种系统里的模式, 我们通常的工具就是超级前卫的循环神经网络RNN,这种工具对处理高维具有复杂反馈的系统有神效, 因为它本身就是一个高维具有复杂时间反馈的动力学系统。
图: 循环神经网络, 过去的信息可以通过循环存储在神经元之间
当一个复杂时间序列的问题里面, 每个时间点的信息都可以对未来以任何方式产生复杂影响, 那么处理这种复杂性的一个办法就是用循环神经网络,让它自发学习这种复杂结构。 比如一个城市里的交通流, 或者人与人之间的对话。
神经图灵机是在多层卷积神经网络或递归网络基础上加上一个较长期的记忆单元, 从而达到处理需要更复杂时间关联的任务, 比如对话机器人。 而神经图灵机最厉害的地方在于他可以通过机器学习传统的梯度下降法反向破译一个程序, 比如你写了一个python程序, 你用很多不同的输入得到很多对应的输出, 你可以把它给神经图灵机训练, 最终本来对程序丝毫无所知的神经图灵机居然可以如同学会了这个程序。

热点内容
今天基金涨了怎么算收益 发布:2025-07-01 04:27:53 浏览:448
股市中的阴险是什么意思 发布:2025-07-01 04:24:21 浏览:613
怎么申请通用金融账户 发布:2025-07-01 04:20:18 浏览:993
股市的0到1是什么意思 发布:2025-07-01 04:19:41 浏览:368
元月1月1号股票交易吗 发布:2025-07-01 04:15:58 浏览:291
全国股票交易金额统计表 发布:2025-07-01 04:15:25 浏览:669
期货小波段选什么品种 发布:2025-07-01 03:37:59 浏览:562
企业社保基金专户如何向银行贷款 发布:2025-07-01 03:33:46 浏览:58
捐款社会基金来获得股权什么意思 发布:2025-07-01 03:25:49 浏览:140
002028股票历史行情 发布:2025-07-01 03:09:23 浏览:438