當前位置:首頁 » 股市行情 » ema如何用於機器學習股市預測

ema如何用於機器學習股市預測

發布時間: 2022-11-25 04:53:33

㈠ 股票問題,MACD上的DIF,EMA,DEA,DEF等是什麼意思

平滑異同移動平均線MACD

MACD由正負差(DIF)和異同平均數(DEA)兩部分組成,當然,正負差是核心,DEA是輔助。DIF是快速平滑移動平均線(EMA)與慢速平滑移動平均線(EMA)的差。快速和慢速的區別是進行指數平滑時採用的參數大小不同,快速是短期的,慢速是長期的。以現在常用的參數12和26為例,DIF的計算過程為:今日EMA(12)=2/(12+1)×今日收盤價+11/(12+1)×昨日EMA(12);今日EMA(26)=2/(26+1)×今日收盤價+25/(26+1)×昨日EMA(26);以上兩個公式是指數平滑的公式,平滑因子分別為2/13和2/27。如果選用別的系數,則可照此法處理。DIF=EMA(12)-EMA(26)。DEA是DIF的移動平均,也就是連續數日的DIF的算術平均。此外,在分析軟體上還有一個指標叫柱狀線(BAR)。BAR=2×(DIF-DEA)。

macd指標又叫指數平滑異同移動平均線,是由查拉爾·阿佩爾(Gerald Apple)所創造的,是一種研判股票買賣時機、跟蹤股價運行趨勢的技術分析工具。

一、macd指標的原理

macd指標是根據均線的構造原理,對股票價格的收盤價進行平滑處理,求出算術平均值以後再進行計算,是一種趨向類指標。

macd指標是運用快速(短期)和慢速(長期)移動平均線及其聚合與分離的徵兆,加以雙重平滑運算。而根據移動平均線原理發展出來的macd,一則去除了移動平均線頻繁發出假信號的缺陷,二則保留了移動平均線的效果,因此,macd指標具有均線趨勢性、穩重性、安定性等特點,是用來研判買賣股票的時機,預測股票價格漲跌的技術分析指標 。

macd指標主要是通過EMA、DIF和DEA(或叫macd、DEM)這三值之間關系的研判,DIF和DEA連接起來的移動平均線的研判以及DIF減去DEM值而繪製成的柱狀圖(BAR)的研判等來分析判斷行情,預測股價中短期趨勢的主要的股市技術分析指標。其中,DIF是核心,DEA是輔助。DIF是快速平滑移動平均線(EMA1)和慢速平滑移動平均線(EMA2)的差。BAR柱狀圖在股市技術軟體上是用紅柱和綠柱的收縮來研判行情。

二、macd指標的計算方法
macd在應用上,首先計算出快速移動平均線(即EMA1)和慢速移動平均線(即EMA2),以此兩個數值,來作為測量兩者(快慢速線)間的離差值(DIF)的依據,然後再求DIF的N周期的平滑移動平均線DEA(也叫macd、DEM)線。
以EMA1的參數為12日,EMA2的參數為26日,DIF的參數為9日為例來看看macd的計算過程:

1、計算移動平均值(EMA)
12日EMA的算式為
EMA(12)=前一日EMA(12)×11/13+今日收盤價×2/13
26日EMA的算式為
EMA(26)=前一日EMA(26)×25/27+今日收盤價×2/27

2、計算離差值(DIF)
DIF=今日EMA(12)-今日EMA(26)

3、計算DIF的9日EMA
根據離差值計算其9日的EMA,即離差平均值,是所求的macd值。為了不與指標原名相混淆,此值又名DEA或DEM。
今日DEA(macd)=前一日DEA?8/10+今日DIF?2/10
計算出的DIF和DEA的數值均為正值或負值。

理論上,在持續的漲勢中,12日EMA線在26日 EMA線之上,其間的正離差值(+DIF)會越來越大;反之,在跌勢中離差值可能變為負數(—DIF),也會越來越大,而在行情開始好轉時,正負離差值將會縮小。指標macd正是利用正負的離差值(±DIF)與離差值的N日平均線(N日EMA)的交叉信號作為買賣信號的依據,即再度以快慢速移動線的交叉原理來分析買賣信號。另外,macd指標在股市軟體上還有個輔助指標——BAR柱狀線,其公式為:BAR=2?(DIF-DEA),我們還是可以利用BAR柱狀線的收縮來決定買賣時機。

離差值DIF和離差平均值DEA是研判macd的主要工具。其計算方法比較煩瑣,由於目前這些計算值都會在股市分析軟體上由計算機自動完成,因此,投資者只要了解其運算過程即可,而更重要的是掌握它的研判功能。另外,和其他指標的計算一樣,由於選用的計算周期的不同,macd指標也包括日macd指標、周macd指標、月macd指標年macd指標以及分鍾macd指標等各種類型。經常被用於股市研判的是日macd指標和周macd指標。雖然它們的計算時的取值有所不同,但基本的計算方法一樣。

在實踐中,將各點的 DIF和DEA(macd)連接起來就會形成在零軸上下移動的兩條快速(短期)和慢速(長期)線,此即為macd圖。

㈡ 股票中,EMA的計算公式是什麼簡單、通俗點。

EMA表示快(慢)速平滑移動線。其中快速是12日計算的,公式如下:今日:EMA(12):[2/(12+1)]*今日收盤價加[11/(12+1)]*作日EMA(12)

㈢ MACD公式中的昨日的12日EMA 是什麼意思

EMA是計算指數平滑移動平均數,12日EMA是12日內平均指數的總和/12,當日的12日EMA就是當日以前12日內平均指數的總和,以此類推昨日就是昨天以前的,移動平均線也可以設置成n天的。

MACD在應用上,,先計算出快速移動平均線即12日的EMA1,和慢速移動平均線,即26日的EMA2,以這兩個數值之間的差值得出DIFF,再求出DIFF的9日平滑移動平均線DEA,得出MACD=2×(DIFF-DEA)。

(3)ema如何用於機器學習股市預測擴展閱讀:

注意事項:

1、MACD在低位發生第一次金叉時,股價在較多情況下漲幅有限,或小漲後出現較大的回調,造成買進的投資者出現套牢虧損情況。

2、背馳時不理是否擊穿或突破前期高(低)位,高位時只要有頂背馳建議堅定賣出,不博股價能重新翻紅,除非大陽或漲停,其為尋找短期買賣點的奇佳手段,短期幅度15%以上,但中線走勢則要結合長期形態及其他。

3、判斷第一賣點成立的技巧,是股價橫盤、MACD死叉賣出,也就是說,當股價經過連續的上漲出現橫盤時,5日、10日移動平均線尚未形成死叉,但MACD率先死叉,死叉之日便是第一賣點形成之時,應該賣出或減倉。

4、在絕對高點賣股票時,決不能等MACD死叉後再賣,因為當MACD死叉時股價已經下跌了許多,在虛假頂賣股票必須參考K線組合。

參考資料來源:網路-MACD指標

參考資料來源:網路-MACD線

參考資料來源:網路-EMA

㈣ 股票不能通過機器學習來預測,你知道是為什麼嗎

因為股票市場是非線性的,而且是變化多端的,所以是沒有辦法進行人為預測的。而機器一般都是被人設定好的程序,所以也沒有辦法對股票來進行預測。現在很多人都對理財比較感興趣,所以大家都會對自己的財產進行合理的分配有些人就會拿出自己一些財產來進行炒股。炒股是一門學問,所以並不是每一個人都能夠在故事當中獲得大量的收益的。

機器只能夠模擬過去的股票市場,讓大家在學習股票的時候對股票行情和市場有一個基本的了解。但是機器是沒有辦法預測未來的,所以想要通過機器來預測股市是根本不可能的事情。所以那些想要走捷徑,想通過機器預測股票行情的人還是腳踏實地的自己買一些相關的書籍和課程自己學習吧。

㈤ ema均線指標和實戰方法

EMA即指數平均數指標( Exponential Moving Average, EXPMA或EMA),也是一種趨向類指標。其構造原理是:對收盤價進行加權算術平均,用於判斷價格未來走勢的變動趨勢。與MACD指標、DMA指標相比,EMA指標由於其計算公式中著重考慮了當天價格(當期)行情的權重,決定了其作為一類趨勢分析指標,在使用中克服了MACD指標對於價格走勢的滯後性缺陷,同時,也在一定程度上消除了DMA指標在某些時候對於價格走勢所產生的信號提前性,是一個非常有效的分析指標。

拓展資料

收盤價,幾乎可以說是市場上最容易被記住的一個最重要的數據,但我們卻很少注意到收盤價的盤面反饋。所謂收盤價的盤面反饋是指收盤以後停留在盤面上的掛盤狀況,包括10個買賣價位及相應的掛盤數量。其實我們可以從中得到不少的信息,特別是盤中主力的信息,盡管盤中主力也許並不想告訴我們。
事實上,收盤價是市場參與者們所共同認可的價格,是一天中大家所接受的價格。而最高價是大多數人認為好的賣出價格,最低價是大多數人認為好的買進價格,而收盤價是不再進行交易的價格。
因此研判收盤價有著重要意義,無論當天股價如何振盪,最終將定格在收盤價上,有人說主力可以憑借資金實力做出收盤價,這確實是,但主力做周線,特別是月線的收盤價難度比較大,因為耗資巨大。從這個角度看,月線以及周線的收盤價最具研判意義。聰明的主力會利用自己的資金做煽風點火之人,而不是全部依賴自己的真金白銀去做收盤價。
滬深股市的收盤價並不完全是最後一筆交易的成交價格,而是一個加權平均價,也叫已調整收盤價。
正常運作情況下,港股的收市價是按交易日最後一分鍾內五個按盤價的中位數計算。
系統由下午三時五十九分整開始每隔十五秒錄取股份按盤價一次,一共攝取五個按盤價。
現舉例如下:
攝取 時間 買盤價 沽盤價 最後錄得價 按盤價
第一次 下午3:59:00 $39.40 $39.50 $39.50 $39.50
第二次 下午3:59:15 $39.40 $39.50 $39.50 $39.50
第三次 下午3:59:30 $39.40 $39.50 $39.40 $39.40
第四次 下午3:59:45 $39.30 $39.50 $39.40 $39.40
第五次 下午4:00:00 $39.20 $39.30 $39.30 $39.30
按盤價排序:$39.30 $39.40 $39.40 $39.50 $39.50,則收盤價取中位數$39.40。

㈥ EMA在股票技術中的含義

EMA是一個加權平均,加權的目的在於使得某部分的收盤價的變化對趨勢影響更大,區別於簡單平均的一視同仁。
EMA(12),表示的是12天的加權移動平均。
W=2÷(12+1)=0.1538=2/13;
EMA(12)=(收盤價-昨日的EMA)×2/13+昨日的EMA(這個公式變化一下會更清晰)
=收盤價×2/13+昨日的EMA×(1-2/13)
=收盤價*2/13+昨日的EMA×11/13
這樣意思很明顯了,這個EMA(12)的計算值表示的是今天的收盤價的權重分配為2/13,之前的11天計算的EMA分配為11/13。

EMA與MA的作用相同,都是體現一段時間的趨勢,區別在於EMA更注重當天收盤價對未來趨勢的影響,分配權重大點,相對MA來看,就是反應快點。 但問題在於是不是反應快就是好呢?就是另外一個問題了,就如成語,欲速則不達——個人理解。

㈦ 股票中EMA是什麼意思

EMA(Exponential Moving Average)是指數移動平均值。也叫EXPMA指標,它也是一種趨向類指標,指數移動平均值是以指數式遞減加權的移動平均。

當要比較數值與均價的關系時,用MA就可以了,而要比較均價的趨勢快慢時,用EMA更穩定;有時,在均價值不重要時,也用EMA來平滑和美觀曲線。

其公式為:

EMAtoday=α * Pricetoday+ ( 1 - α ) * EMAyesterday;

其中,α為平滑指數,一般取作2/(N+1)。在計算MACD指標時,EMA計算中的N一般選取12和26天,因此α相應為2/13和2/27。

當公式不斷遞歸,直至EMA1出現,EMA1是沒有定義的。EMA1的取值有幾種不同的方法,通常情況下取EMA1為Price1,另外有的技術是將EMA1取值為開頭4到5個數值的均值。

從該式中可以更清楚地看出EMA加權平均的特性。在EMA指標中,每天價格的權重系數以指數等比形式縮小。

時間越靠近當今時刻,它的權重越大,說明EMA函數對近期的價格加強了權重比,更能及時反映近期價格波動情況。

所以EMA比MA更具參考價值,而EMA也不容易出現死叉和金叉,所以一旦出現要立即作出反映,對周線處理,EMA就更加穩定了。

㈧ macd公式中的ema是什麼意思

ema是計算指數平滑移動平均數,12日ema指的是12日內平均指數的總和/12,當日的12日ema就是當日以前12日內平均指數的總和。以此類推昨日就是昨天以前的。移動平均線也可以設置成n天的。
macd計算公式
macd在應用上,,先計算出快速移動平均線即12日的ema1,和慢速移動平均線,即26日的ema2,,以這兩個數值之間的差值得出diff,,然後再求出diff的9日平滑移動平均線dea.,最後得出macd=2×(diff-dea).

<1>計算12日和26日移動平均線ema1和ema2
當日ema(12)=前一日ema(12)×11/13+當日收盤價×2/13
當日ema(26)=前一日ema(26)×25/27+當日收盤價×2/27
<2>計算離差值(diff)
diff=當日ema(12)-當日ema(26)
<3>計算9日離差平均值dea
當日dea=前一日dea×8/10+當日diff×2/10
<4>計算macd
macd=2×(diff-dea)

離差值diff和離差平均值dea是研判macd的主要工具,,其計算方法比較煩瑣,。由於目前這些數值在股市分析軟體上都由計算機自動完成,。因此投資者只要了解其運算過程即可,,更重要的是掌握它的研判功能。.另外和其它技術指標一樣,,由於選取的計算周期的不同,,macd指標也包括日macd、,周macd、,月macd、,年macd指標,以及5分鍾,、15分鍾,、30分鍾,、60分鍾等分時macd.、常被用於股市研判的是日macd指標和周macd指標,雖然它們計算時的取值有所不同,但計算方法基本相同。.

㈨ 股市中的指數平均數指標即EMA的含義、計算公式~~謝謝!

網路上面不是有嘛
EMA(Exponential Moving Average),指數平均數指標。也叫EXPMA指標,它也是一種趨向類指標,指數平均數指標是以指數式遞減加權的移動平均。 求X的N日指數平滑移動平均,在股票公式中一般表達為:EMA(X,N),它真正的公式表達是:當日指數平均值=平滑系數*(當日指數值-昨日指數平均值)+昨日指數平均值;平滑系數=2/(周期單位+1);由以上公式推導開,得到:EMA(C,N)=2*C/(N+1)+(N-1)/(N+1)*昨天的指數收盤平均值; 演算法是:若Y=EMA(X,N),則Y=〔2*X+(N-1)*Y』〕/(N+1),其中Y』表示上一周期的Y值。EMA引用函數在計算機上使用遞歸演算法很容易實現,但不容易理解。例舉分析說明EMA函數。 X是變數,每天的X值都不同,從遠到近地標記,它們分別記為X1,X2,X3,….,Xn 如果N=1,則EMA(X,1)=〔2*X1+(1-1)*Y』〕/(1+1)=X1 如果N=2,則EMA(X,2)=〔2*X2+(2-1)*Y』〕/(2+1)=(2/3)*X2+(1/3)X1 如果N=3,則EMA(X,3)=〔2*X3+(3-1)*Y』〕/(3+1)=〔2*X3+2*((2/3)*X2+(1/3)*X1)〕/4=(1/2)*X3+(1/3)*X2+(1/6)*X1 如果N=4,則EMA(X,4)=〔2*X4+(4-1)*Y』〕/(4+1)=2/5*X4+3/5*((1/2)*X3+(1/3)*X2+(1/6)*X1) =2/5*X4+3/10*X3+1/5*X2+1/10*X1 如果N=5,則EMA(X,5)=2/(5+1)*X5+(5-1)/(5+1)(2/5*X4+3/10*X3+3/15*X2+3/30*X1) =(1/3)*X5+(4/15)*X4+(3/15)*X3+(2/15)*X2+(1/15)*X1 …………循環 X1 (2/3)*X2+(1/3)X1 (3/6)*X3+(2/6)*X2+(1/6)*X1 (4/10)*X4+(3/10)*X3+(2/10)*X2+(1/10)*X1 (5/15)*X5+(4/15)*X4+(3/15)*X3+(2/15)*X2+(1/15)*X1 任何時候系數之和恆為1。如果X是常量,每天的X值都不變,則EMA(X,N)=MA(X,N). 從以上的例舉分析中,我們可以看到時間周期越近的X值它的權重越大,說明EMA函數對近期的X值加強了權重比,更能及時反映近期X值的波動情況。 所以EMA比Ma更具參考價值,而ema也不容易出現死叉和金叉,所以一旦出現要立即作出反映!對周線處理,ema就更加穩定了。 理解了MA,EMA的含義後,就可以理解其用途了,簡單的說,當要比較數值與均價的關系時,用MA就可以了,而要比較均價的趨勢快慢時,用EMA更穩定;有時,在均價值不重要時,也用EMA來平滑和美觀曲線

㈩ 如何運用機器學習解決復雜系統的預測問題

在市場這種系統里, 有兩個關鍵要素, 一個是個體和個體之間的互相作用(博弈),一個是系統與外部環境(地球資源)之間的相互作用(反饋),因此而形成復雜模式(Pattern), 這種模式通常很難預測。
而這種類型的系統我們通常定義為復雜系統: 由大量單元互相作用組成的系統, 由於集體行為的非線性(總體不等於個體之和), 而形成具備無數層級的復雜組織。或者稱為涌現性。
復雜科學即研究復雜系統的一套聯系不同尺度現象的數學方法。在人類試圖理解那些和自身生存最相關的東西時,而經典物理學的還原論(把整體拆成部分)思維的卻不適用。物理預測的核心方法是動力學方法, 即人們由實驗出發抽象出引起運動改變的原因, 把這些原因量化為變數,用微分方程來描述, 從而取得對整個未來的精確解,如麥克斯韋方程組可以預測從光波的速度到磁線圈轉動發電任何的電磁學現象。而你卻無法通過了解市場上每個人的特性就很好的預測整個市場走勢。
復雜系統難以預測的原理可以從以下幾方面理解:
1, 高維詛咒: 構成現實生活的系統往往被大量未知變數決定, 比如生物由無數的細胞組成。 基因,是由無數獨立的單元組成的, 市場, 由無數的交易者組成, 這些用物理的描述方法來預測, 就是極高維度空間的運動問題。維度,首先使得再簡單的方程形式都十分復雜難解。
此處補充維度的科學定義: 維度是一個系統里可以獨立變化的變數個數, 一個有非常多變數的系統,如復雜網路,假如每個變數不是互相獨立,也可以是低維系統。 比如一個軍營里的方陣,即使人數眾多, 也會因為大家都做著一模一樣的動作,而只有一個獨立變數,成為一維系統。
2, 非線性詛咒:高維度系統的維度之間具有復雜的相互作用,導致我們不能把系統分解為單一維度然後做加法的方法研究。 高維加上非線性我們將得到對初級極為敏感的混沌系統。

非線性的一個重要推論是組織的產生, 因為非線性,1+1可以大於2或小於2, 為組織的產生提供了理論基礎。
3, 反饋詛咒: 復雜系統中反饋無處不在, 即使是一個簡單的一維系統, 反饋也可以使得系統的特性很豐富, 最典型的反饋是某種記憶效應, 使得系統產生復雜的路徑依賴, 此刻你的現實與歷史深刻關聯,而關聯方法導致復雜的模式產生。
反身性是一種由預測產生的特殊反饋, 當你預測股市的價格, 會引起你的交易策略變化從而影響你的預測, 是為反身性。
4, 隨機詛咒: 復雜系統往往含有不包含確定規律的隨機雜訊,加上這些雜訊, 系統的行為更加難預測, 而很多時候, 我們也無法區分一個系統里發現的模式是雜訊導致還是由於元件之間的相互作用。
這四大詛咒是這些系統難以理解和預測的原因, 而這個時候, 復雜系統和機器學習的方法論可以作為一種非常有力的手段幫我們從復雜性中挖掘模式。
第一種方法叫模型驅動(Model approch), 即想辦法找到事物變化的原因, 用一種降維的思路列出微分方程, 即從非常繁復的要素中化簡出最重要的一個或者兩個, 從而化繁瑣為簡單,不管三七二十一先抓住主要矛盾。其中的範例便是非線性動力學。
註: 此處我們有兩個基本假設讓非線性動力學得到簡化,一個是只討論連續變數,另一個是不考慮系統內的隨機性(無雜訊項)。
1, 如果一個系統可以化簡到一維, 那麼你只需要研究其內部存在的反饋性質並描述它即可。 負反饋導致穩定定點產生, 正反饋導致不穩定性。 很多事物多可以抽象為一維系統,包括簡單環境下的人口增長問題。
2, 如果一個系統可以化簡到二維, 那麼你需要研究兩個維度間的相互作用,最終可以互為負反饋而穩定下來,互為正反饋而爆發,或者產生此消彼長的周期軌道。 比如戀愛中的男女是個二維系統, 互為負反饋就回到普通朋友, 互為正反饋在愛欲中爆發-比如羅密歐與朱麗葉, 此消彼長那是玩捉迷藏的周期游戲。
3, 如果一個系統是三維的, 則混沌可能產生。 混沌即對初值極為敏感的運動體系。 你一旦偏離既定軌道一點, 即幾乎無法回去。
4, 如果一個系統大於三維, 那麼你需要用一個復雜網路描述它的運動, 這個時候我們可以得到我們復雜系統的主角- collective phenomena & emergence。 復雜網路的性質主要取決於單體間相互作用的方式, 以及系統與外界交換能量的方法, 這兩者又息息相關。 最終我們得到涌現。

復雜網路的動力學往往混沌難以預測,對於高維混沌系統, 第一個方法也只能給出對事物定性的描述, 而我們可以祭出我們的第二種方法: 先不管數據背後錯綜復雜的動因,而是直接以數據驅動我們的預測。
這其中的哲學內涵即貝葉斯分析框架: 即先不預測, 而是列出所有可能的結果及根據以往知識和經驗每種結果發生的可能性(先驗概率),之後不停吸收新觀測數據, 調整每種可能結果的概率大小(後驗概率),將想得到的結果概率最大化(MAP)最終做出決策。
如果你把貝葉斯分析的框架自動化, 讓電腦完成, 你就得到機器學習的最基本框架。
機器學習如果可以進入一個問題中, 往往要具備三個條件:
1, 系統中可能存在模式
2, 這種模式不是一般解析手段可以猜測到的。
3, 數據可以獲取。
如果三點有一點不符,都很難運用機器學習。
機器學習的一個核心任務即模式識別, 也可以看出它和剛才講的復雜系統提到的模式的關系。我們講復雜系統難以通過其成分的分析對整體進行預測,然而由於復雜系統通常存在模式, 我們通常可以模式識別來對系統進行歸類, 並預測各種可能的未來結果。比如一個投行女因為工作壓力過大而自殺了, 那麼在她之前的活動行為數據(比如點擊手機的某些app的頻率)里是否可能存在某種模式? 這種模式是否可以判定她之後的行為類型? 並且這個過程可否通過歷史數據由計算機學習?如果都可以,這就是一個機器學習問題。
剛才講的幾大詛咒, 高維, 非線性, 復雜反饋,隨機性也稱為機器學習需要核心面對的幾大困難, 由此得到一系列機器學習的核心演算法。

機器學習在現實生活中被用於非常多的方面, 最常見的如商務洞察(分類,聚類, 推薦演算法), 智能語音語義服務(時間序列處理,循環網路), 各種自動鑒別系統如人臉識別,虹膜識別 ,癌症檢測(深度卷積網路), 阿爾法狗,機器人控制(深度強化學習演算法)。 而由方法論分, 又可以分成有監督學習, 無監督學習, 和強化學習。

在八月份的巡洋艦科技的《機器學習vs復雜系統特訓課》中,我著重講了幾種機器學習的基本方法:
1. 貝葉斯決策的基本思想:
你要讓機器做決策, 一個基本的思路是從統計之前數據挖掘已有的模式(pattern)入手, 來掌握新的數據中蘊含的信息。 這個pattern在有監督學習的例子里, 就是把某種數據結構和假設結論關聯起來的過程,我們通常用條件概率描述。 那麼讓機器做決策, 就是通過不停的通過新數據來調整這個數據結構(特徵)與假設結果對應的條件概率。通常我們要把我們預先對某領域的知識作為預設(prior),它是一個假設結果在數據收集前的概率密度函數,然後通過收集數據我們得到調整後的假設結果的概率密度函數, 被稱為後驗概率(posterior),最終的目標是機器得到的概率密度函數與真實情況最匹配, 即 Maximum a posterior(MAP), 這是機器學習的最終目標。
2, 樸素貝葉斯分類器到貝葉斯網路:
分類,是決策的基礎,商業中要根據收集客戶的消費特徵將客戶分類從而精準營銷。 金融中你要根據一些交易行為的基本特徵將交易者做分類。 從貝葉斯分析的基本思路出發我們可以迅速得到幾種分類器。
首當其沖的樸素貝葉斯分類器,它是機器學習一個特別質朴而深刻的模型:當你要根據多個特徵而非一個特徵對數據進行分類的時候,我們可以假設這些特徵相互獨立(或者你先假設相互獨立),然後利用條件概率乘法法則得到每一個分類的概率, 然後選擇概率最大的那個作為機器的判定。
圖: 樸素貝葉斯分類器的基本框架, c是類別, A是特徵。
如果你要根據做出分類的特徵不是互相獨立,而是互相具有復雜關聯,這也是大部分時候我們面臨問題的真相, 我們需要更復雜的工具即貝葉斯網路。 比如你對某些病例的判定, 咳嗽, 發燒, 喉嚨腫痛都可以看做扁條體發炎的癥候, 而這些癥候有些又互為因果, 此時貝葉斯網路是做出此類判定的最好方法。構建一個貝葉斯網路的關鍵是建立圖模型 , 我們需要把所有特徵間的因果聯系用箭頭連在一起, 最後計算各個分類的概率。

圖:貝葉斯網路對MetaStatic Cancer的診斷,此處的特徵具有復雜因果聯系
貝葉斯分析結合一些更強的假設,可以讓我們得到一些經常使用的通用分類器, 如邏輯斯提回歸模型,這里我們用到了物理里的熵最大假設得到玻爾茲曼分布, 因此之前簡單貝葉斯的各個特徵成立概率的乘積就可以轉化為指數特徵的加權平均。 這是我們日常最常用的分類器之一。 更加神奇的是, 這個東西形式上同單層神經網路。

圖: logistic函數,數學形式通玻爾茲曼分布, 物理里熵最大模型的體現
3, 貝葉斯時間序列分析之隱馬模型:
貝葉斯時間序列分析被用於挖掘存儲於時間中的模式,時間序列值得是一組隨時間變化的隨機變數,比如玩牌的時候你對手先後撒出的牌即構成一個時間序列。 時間序列模式的預設setting即馬爾科夫鏈, 之前動力學模式里講到反饋導致復雜歷史路徑依賴,當這種依賴的最簡單模式是下一刻可能出現的狀態只與此刻的狀態有關而與歷史無關, 這時候我們得到馬爾科夫鏈。
馬爾科夫鏈雖然是貝葉斯時間序列分析的基準模型,然而現實生活中遇到的時間序列問題, 通常不能歸於馬爾科夫鏈,卻可以間接的與馬爾科夫鏈關聯起來,這就是隱馬過程,所謂含有隱變數的馬爾科夫過程。

圖: 隱馬過程示意

語音識別就是一類特別能利用隱馬過程的應用, 在這里語音可以看做一組可觀測的時間序列, 而背後的文字是與之關聯的馬爾科夫鏈, 我們需要從可觀測的量, 按照一定的概率分布反推不可觀測的量, 並用馬爾科夫鏈的觀點對其建模, 從而解決從語音到文字的反推過程。 當今的語音識別則用到下面緊接講的深度學習模型。
4, 深度學習
剛剛講的分類問題, 只能根據我們已知的簡單特徵對事物進行分類, 但假設我們手裡的數據連需要提取的特徵都不知道, 我們如何能夠對事物進行分類呢? 比如你要從照片識別人名, 你都不知道選哪個特徵和一個人關聯起來。 沒關系, 此時我們還有一個辦法, 就是讓機器自發學習特徵, 因此祭出深度學習大法。通常在這類問題里, 特徵本身構成一個復雜網路,下級的特徵比較好確定, 而最高層的特徵, 是由底層特徵的組合確定的, 連我們人類自己都不能抽象出它們。
深度學習即數據內涵的模式(特徵)本身具備上述的多層級結構時候,我們的機器學習方法。 從以毒攻毒的角度看, 此時我們的機器學習機器也需要具有類似的多級結構,這就是大名鼎鼎的多層卷積神經網路。深度學習最大的優勢是具有更高級的對「結構」進行自動挖掘的能力,比如它不需要我們給出所有的特徵,而是自發去尋找最合適對數據集進行描述的特徵。 一個復雜模式-比如「人臉」 事實上可以看做一個簡單模式的層級疊加, 從人臉上的輪廓紋理這種底層模式, 到眼睛鼻子這樣的中級模式, 直到一個獨特個體這樣最高級的復雜模式, 你只有能夠識別底層模式,才有可能找到中級模式, 而找到中級模式才方便找到高級模式, 我們是不能從像素里一步到達這種復雜模式的。 而是需要學習這種從簡單模式到復雜模式的結構, 多層網路的結構應運而生。
圖: 從具體特徵到抽象特徵逐級深入的多級神經網路
6, RNN和神經圖靈機
如果時間序列數據里的模式也包含復雜的多層級結構, 這里和我之前說的復雜系統往往由於反饋導致復雜的時間依賴是一致的, 那麼要挖掘這種系統里的模式, 我們通常的工具就是超級前衛的循環神經網路RNN,這種工具對處理高維具有復雜反饋的系統有神效, 因為它本身就是一個高維具有復雜時間反饋的動力學系統。
圖: 循環神經網路, 過去的信息可以通過循環存儲在神經元之間
當一個復雜時間序列的問題裡面, 每個時間點的信息都可以對未來以任何方式產生復雜影響, 那麼處理這種復雜性的一個辦法就是用循環神經網路,讓它自發學習這種復雜結構。 比如一個城市裡的交通流, 或者人與人之間的對話。
神經圖靈機是在多層卷積神經網路或遞歸網路基礎上加上一個較長期的記憶單元, 從而達到處理需要更復雜時間關聯的任務, 比如對話機器人。 而神經圖靈機最厲害的地方在於他可以通過機器學習傳統的梯度下降法反向破譯一個程序, 比如你寫了一個python程序, 你用很多不同的輸入得到很多對應的輸出, 你可以把它給神經圖靈機訓練, 最終本來對程序絲毫無所知的神經圖靈機居然可以如同學會了這個程序。

熱點內容
全球股票交易所交易量排名 發布:2025-07-01 00:02:19 瀏覽:377
定投指數基金收益怎麼給 發布:2025-07-01 00:00:06 瀏覽:58
股票屬於貨幣資金的投資范圍嗎 發布:2025-06-30 23:51:20 瀏覽:189
數字貨幣怎麼爆炒 發布:2025-06-30 23:49:30 瀏覽:54
金融三傑是什麼意思 發布:2025-06-30 23:44:43 瀏覽:729
匯頂科技股票是小盤股嗎 發布:2025-06-30 23:35:56 瀏覽:243
京東金融余額寶利息多少錢 發布:2025-06-30 23:23:26 瀏覽:491
在股市裡50線什麼意思 發布:2025-06-30 23:15:05 瀏覽:426
構建基金適合什麼組合 發布:2025-06-30 23:14:55 瀏覽:509
股市股票退市資金怎麼辦 發布:2025-06-30 22:54:06 瀏覽:337