卡方分布在股票市場的應用論文
『壹』 卡方分布
CHIDIST:求收尾概率,有兩個參數,CHIDIST(x,n)=1-0到自變數的x積分
例如CHIDIST(1.646,8)=0.99
CHIINV,根據概率求分位點值,也有兩個參數,CHINV(p,n)
例如CHINV(0.99,8)=1.646497=1.646
『貳』 在參數統計中卡方分布有哪些應用
卡方分布實際上是比率檢驗的進一步延伸。
1,利用卡方分布確定是否拒絕虛無假設。
2,卡方應用於適合型檢驗,根據一個分類標准(變數),將一個事件總體劃分為k類,考察k類中每一類的次數分布f是否符合某一理論次數分布的檢驗。
3,卡方獨立性檢驗:依照兩個分類標准,將觀察對象劃分為rxe個類別得到的實際次數分布是否顯示這兩個分類標準是具有相互獨立性的檢驗。
(您都不給分的....)
『叄』 卡方分布的特點
若n個相互獨立的隨機變數均服從標准正態分布,也稱獨立同分布於標准正態分布,則這n個服從標准正態分布的隨機變數的平方和構成一新的隨機變數,其分布規律稱為卡方分布,卡方分布的特點有:
1、卡方分布在第一象限內,卡方值都是正值,呈正偏態,右偏態,隨著參數的增大,卡方分布趨近於正態分布,卡方分布密度曲線下的面積都是1;
2、卡方分布的均值與方差可以看出,隨著自由度的增大,卡方分布向正無窮方向延伸,分布曲線也越來越低闊;
3、不同的自由度決定不同的卡方分布,自由度越小,分布
『肆』 卡方分布怎麼理解
在理論上n個獨立同分布的隨機變數,都服從正態分布,那麼平方和服從的分布就是自由度為n的卡方分布。
若n個相互獨立的隨機變數ξ1,ξ2,…,ξn ,均服從標准正態分布(也稱獨立同分布於標准正態分布),則這n個服從標准正態分布的隨機變數的平方和∑ξi∧2構成一新的隨機變數,其卡方分布分布規律稱為χ2(n)分布(chisquare distribution)。
其中參數 n 稱為自由度,自由度不同就是另一個χ2分布,正如正態分布中均值或方差不同就是另一個正態分布一樣。
補充:
χ2分布在一象限內,呈正偏態,隨著參數 n 的增大,χ2分布趨近於正態分布。
χ2分布的均值為自由度 n,記為 Eχ2=n,這里符號「E」表示對隨機變數求均值;χ2分布的方差為2倍的自由度(2n),記為 Dχ2=2n,這里符號「D」表示對隨機變數求方差。
從χ2分布的均值與方差可以看出,隨著自由度n的增大,χ2分布向正無窮方向延伸(因為均值n越來越大),分布曲線也越來越低闊(因為方差2n越來越大)。
χ2分布具有可加性:若有K個服從χ2分布且相互獨立的隨機變數,則它們之和仍是χ2分布,新的χ2分布的自由度為原來K個χ2分布自由度之和。表示為:
χ2分布是連續分布,但有些離散分布也服從χ2分布,尤其在次數統計上非常廣泛。
『伍』 卡方分布和卡方檢驗的定義
卡方分布(chi-square distribution, χ2-distribution)是概率統計里常用的一種概率分布。
我們先來看看卡方分布的定義:
若n個獨立的隨機變數 , ,⋯, ,且符合標准正態分布N(0,1),則這n個隨機變數的平方和
X=
為服從自由度為n的卡方分布,記為:
X∼χ2(n), 其中n為卡方分布的自由度。
χ2檢驗:(也稱擬合優度檢驗)
是以χ2分布為基礎的一種假設檢驗方法,主要用於分類變數。其基本思想是根據樣本數據推斷總體的分布與期望分布是否有顯著性差異,或者推斷兩個分類變數是否相關或者獨立。
一般可以設原假設為 H0:觀察頻數與期望頻數沒有差異,或者兩個變數相互獨立不相關。
實際應用中,我們先假設H0成立,計算出χ2的值,χ2表示觀察值與理論值之間的偏離程度。根據χ2分布,χ2統計量以及自由度,可以確定在H0成立的情況下獲得當前統計量以及更極端情況的概率p。如果p很小,說明觀察值與理論值的偏離程度大,應該拒絕原假設。否則不能拒絕原假設。
χ2的計算公式為:
χ2=∑(A−T)2T
其中,A為實際值,T為理論值。
χ2用於衡量實際值與理論值的差異程度,這也是卡方檢驗的核心思想。χ2包含了以下兩個信息:
1.實際值與理論值偏差的絕對大小。
2.差異程度與理論值的相對大小。
『陸』 重要抽樣分布:卡方分布(χ2分布)、t分布和F分布
冒泡~:最近在回顧一些以前學過的概率論和數理統計的知識 發現這三個抽樣分布經常出現,在參數估計和假設檢驗也會運用到,所以做一下整理。
【首先,這三個抽樣分布都是來自正態總體的常用的分布 可以根據情況應用於顯著性檢測】
定義:
設 X1,X2,......Xn相互獨立, 都服從標准正態分布N(0,1), 則稱隨機變數χ2=X1²+X2²+......+Xn²所服從的分布為自由度為 n 的χ2分布.
自由度:所包含的獨立變數的個數 (eg:χ2=X1²+X2² 自由度為2)
圖和式子如下:
關於圖像:
從分布圖可以看出:圖像分布在第一象限內,卡方值都是正值,呈右偏態,隨著參數 n 的增大,分布趨近於正態分布;隨著自由度n的增大,向正無窮方向延伸(這是因為均值n越來越大),分布曲線也越來越低(因為方差2n越來越大)。
更細致觀察:
當n=1或者2時 :卡方分布先高後低的平滑曲線,檢驗統計量等於較小值的概率遠遠大於較大值的概率,即觀察頻數有可能接近期望頻數。
當n大於2時 :卡方分布先低後高再低,其外形沿著正向扭曲
一些結論:
1.χ2分布具有可加性:若χ12~χ2(n),χ22~χ2(m),且二者相互獨立,則χ12+χ22~χ2(n+m)
2.卡方分布的 期望E(χ2)=n,方差D(χ2)=2n。
應用 :(補充ing)
卡方分布指出觀察頻數與期望頻數之間差異顯著性,和其他假設一樣,這取決於顯著性水平。
1、顯性水平α進行檢驗(常用的顯著性水平0.05)
2、檢測標准:卡方分布檢驗是單尾檢驗且是右尾,右尾被作為拒絕域。於是通過查看檢驗統計量是否位於右尾的拒絕域以內,來判定期望分布得出結果的可能性。
3、卡方概率表的使用:
卡方分布假設檢驗步驟 : 總是使用右尾
1、確定要進行檢驗的假設(H0)及其備擇假設H1.
2、求出期望E和自由度n.
3、確定用於做決策的拒絕域(右尾).
4、計算檢驗統計量.
5、查看檢驗統計量是否在拒絕域內.
6、做出決策.
ps:卡方分布檢驗其實就是假設檢驗的特殊形式。
定義:
t分布又叫student-t分布,常常用於根據小樣本來估計呈正態分布且方差值為知的樣本的均值。
(一個前提是:t分布的樣本的總體必須符合正態分布。t分布一般用於小樣本(樣本量比較小)的情形。)
假設X服從標准正態分布即X~N(0,1),Y服從自由度n的卡方分布即Y~χ2(n),且X與Y是相互獨立的,那麼 Z=X/sqrt(Y/n) 的分布成為自由的為n的t分布,記為Z~t(n).
期望 E(T)=0,方差 D(T)=n/(n-2),n>2
圖和式子如下:
圖像的特點:
1.圖像整體以0為中心,左右對稱的單峰分布;
2.t分布是一簇曲線,可發現其形態變化與n(即其自由度)大小有關。
自由度n越小,t分布曲線越低平;自由度n越大,t分布曲線越接近標准正態分布曲線,當自由度無限大時,t分布就成了正態分布
應用:
t檢驗
1.建立假設、確定檢驗水準α
H0:μ = μ0 (零假設null hypothesis)
H1:μ ≠ μ0(備擇假設alternative hypothesis)
雙側檢驗,檢驗水準:α=0.05
2.計算檢驗統計量
3.查相應界值表,確定P值,下結論。
(ps:t檢驗適用於兩個變數均數間的差異檢驗)
期望E(F)=n/(n-2),方差D(F)=2n^2(m+n-2)/m(n-2)^2(n-4)
圖像:
F分布為非對稱分布 有兩個分位點
應用:方差的同質性檢驗
此檢驗參考資料: 數據統計基礎之F分布及其應用 - 振裕 - CSDN博客
方差分析(ANOVA也稱為變異數分析和F檢驗)
詳細可參考:https://wenku..com/view/bcca13af7c1cfad6195fa779.html
finally~
今天也要假裝元氣滿滿的鴨!
『柒』 「卡方分布」是什麼
卡方分布(英語:chi-square distribution[2],χ²-distribution,或寫作χ²分布)是概率論與統計學中常用的一種概率分布。k個獨立的標准正態分布變數的平方和服從自由度為k的卡方分布。
卡方分布是一種特殊的伽瑪分布,是統計推斷中應用最為廣泛的概率分布之一,例如假設檢驗和置信區間的計算。
卡方分布在共同使用卡方檢驗用於擬合優度的觀測分布為理論之一,獨立的分類的兩個標準定性數據,並在用於人口區間估計標准偏差a的來自樣本標准差的正態分布。許多其他統計檢驗也使用這種分布,例如Friedman 的按秩方差分析。
由卡方分布延伸出來皮爾遜卡方檢驗常用於:
1、樣本某性質的比例分布與總體理論分布的擬合優度(例如某行政機關男女比是否符合該機關所在城鎮的男女比);
2、同一總體的兩個隨機變數是否獨立(例如人的身高與交通違規的關聯性);
3、二或多個總體同一屬性的同素性檢驗(義大利麵店和壽司店的營業額有沒有差距)。(詳見皮爾遜卡方檢驗)
計算方法
p-value = 1- p_CDF.
χ2越大,p-value越小,則可信度越高。通常用p=0.05作為閾值,即95%的可信度。
因此,由於適當自由度(df)的累積分布函數(CDF)給出了獲得比該點更不極端的值的概率,因此從 1 中減去 CDF 值給出p值。低於所選顯著性水平的低p值表示統計顯著性,即有足夠的證據拒絕零假設。顯著性水平 0.05 通常用作顯著和不顯著結果之間的分界點。
『捌』 什麼叫做卡方,X的平方分布
Z就是正態分布。
X^2(卡方)分布是一個正態分布的平方。
t分布是一個正態分布除以(一個X^2分布除以它的自由度然後開根號)。
F分布是兩個卡方分布分布除以他們各自的自由度再相除。
比如X是一個Z分布,Y(n)=X1^2+X2^2+……+Xn^2,這里每個Xn都是一個Z分布,t(n)=X/根號(Y/n),F(m,n)=(Y1/m)/(Y2/N)。
各個分布的應用如下:
方差已知情況下求均值是Z檢驗。方差未知求均值是t檢驗(樣本標准差s代替總體標准差R,由樣本平均數推斷總體平均數)兩個正態分布樣本的均值方差都未知情況下求兩個總體的方差比值是F檢驗。
『玖』 求一篇關於股票的論文
證劵投資分析 隨著我國經濟的發展,人民生活水平的提高,家庭金融資產的不斷增加,投資理財已成為日益重要的問題,投資理財是針對風險進行個人資財的有效投資,以使財富保值、增值,能夠抵禦社會生活中的經濟風險,不管是儲蓄投資、股票投資,外匯、保險投資,由於投資品種日益增多,所需的專業知識也不盡相同,投資方法也很難完全掌握,以下是本人對證劵投資分析的淺見。
一、 風險的定義與衡量
在投資者進行投資決策時,決策者(X)可能得到的利益(R)不僅取決於他自己選擇行動(a),而且還取決於其他一些條件或他人採取的行動(b)。設決策者X可能選擇的行動集合為A:{a1,a2,...…a n},經濟社會(Y)可能發生的狀態或他人可能採取的行動為B: {b1,b2,...bi,…b n}。決策者的收益函數方表示為:R=f(a、b),a∈A,b∈B.這個函數表示,決策者X採取行動為a的利益和他的選擇有關,也和經濟社會發生的狀態(或他人採取的行動)有關。Y採取的行動b相對於X的利益可以是「中性」的(不有意使X的處境更好,也不有意使X的處境更糟);如果X和Y的利益是沖突的, Y就可能傾向於採取減少X利益的行動;如果X和Y的利益是一致的,則Y就有可能採取增決於Y 的行動。但是在一般情況下,對於X而言Y的行動具有不確定性,從而X是在不確定的條件進行決策的。
當存在不確定時,決策者的決策就具有風險。風險就是不加X利益的行動。從決策論的角度看,X採取怎樣的行動,作出怎樣的決策,還要取確定性,源於不完全信息或者非對稱信息。風險的必要條件是決策面臨著不確定的條件。當一項決策者在不確定條件下進行時,具有的風險的含義是:從事前的角度看,決定所購買的資產預期收益變動的可能性及其變動幅度;從事後的角度,指由於不確定性因素而造成的決策損失或相對損失 。在計量經濟學中,風險通常用統計學上的標准差來衡量。
二、證券投資風險及其分類
投資者(包括機構投資者和個人投資者)投資於證券的主要目的在於獲得高收益,而證券投資(尤其是股票交易)的收益受很多不確定性因素的影響,收益穩定性明顯不如銀行存款高,這就產生了證券投資的風險。這種風險是與收益相伴而生的,高收益高風險,低收益低風險。因此我們也可以把證券收益看成是對投資者承擔風險的一種補償。具體地說,證券投資風險是指證券的投資者不能獲得預期報酬,遭受損失的可能性。投資者投資於證券都希望獲得預期收益,而真正得到的是實際收益,它有可能低於預期收益,這時風險就發生了,使投資者遭受到了損失。
不同的投資選擇會帶來不同的投資風險,風險產生的原因和程度也不盡相同,總體上按風險產生的原因可以分為以下幾類:
(1)市場風險。這是金融投資中最普遍、最常見的風險。無論投資於有價證券,還是其他實體項目,幾乎所有投資者多必須承受這種風險。這種風險來自於市場買賣雙方供求不平衡引起的價格波動,給投資者帶來損失。
(2)利率風險。利率風險是由於市場利率的變化影響到證券的市場價格,從而給投資者帶來損失的可能性。
(3)偶然事件風險。這種突發性風險是絕大多數投資者必須承擔的,且其劇烈程度和時效性因事而異。如自然災害、戰爭危險、政府的貨幣政策、匯率的變化、專利申請等意外情況的出現,都是投資者在進行投資時無法預料的。
(4)貶值風險。又稱通貨膨脹風險或購買力風險。通常用消費者價格指數測量通貨膨脹率.
(5)企業經營風險。企業經營風險是指由於經營的好壞而產生盈利能力的變化,造成投資者的收入或本金的損失。
(6)企業財務風險。企業的財務風險是指企業採用不同的融資方式而帶來的風險。
證券除了上述幾種風險外,還有其它一些風險,如:道德風險,法律風險、政治風險等等。
三、 證券投資風險的計量方法分析
為了在證券投資中便於比較風險的大小,我們將風險劃分為兩類,即總風險和市場風險。總風險是系統風險和非系統風險之和;市場風險是針對資產組合而言,研究各項資產收益率與組合收益率之間的相關性。對單個證券來說,主要考慮其總風險,而對證券組合,主要考慮其市場風險。
1.總風險的計量
(1)由於收益率是投資的結果,對風險的分析也集中在這個隨機變數上。常用收益率的方差來衡量風險的大小。
(2)一般而論,只有在期望收益相差不大時,標准差不大時,標准差才能夠對各項的風險程度予以度量。如果各項目期望收益相關較大時,則需運用差異系數來評價各項目的風險。差異系數實際上就是單位期望收益所承擔的風險.
(3)若將風險看作股票價格可能的波動,價差率就是一個衡量股票風險的較好指標。
價差率=2(最高價-最低價)/(最高價+最低價)
價差率越大,意味著風險也越大,需要指出,為了克服短期因素的影響,應考察在一段時期內平均價差率,以了解全面的情況。
(4)以收益率作為尺度衡量證券投資風險也是一種度量風險的方法。可將證券投資的收益視為無風險收益與風險補償收益兩部分.一種證券收益率越高,說明其風險補償收益越大,同時其風險程度越高。具體的方法是將在許多方面都相同而只在某一方面有顯著不同的證券進行比較,這樣便可以衡量出某種證券風險程度的高低。
(5)下面介紹另一種度量方法---風險補償法。假定作為投資收益的隨機變數R僅有兩種可能的取值,即R1與R2,取值的概率分布為P1和P2=1-P1,該證券的期望收益為:
ER=P1R1+P2R2
其期望效用為:
EU(R)=P1*U(R1)+(1-P1)*U(R2)
2.組合資產的收益與風險
作為投資對象的各類證券的組合稱為組合資產。馬柯維茨的證券組合理論解決了組合資產的風險度量問題。概要而言,馬柯維茨理論說明在一定條件下,一個投資者的證券組合選擇可以簡化為兩個因素的權衡,即證券組合的期望收益及其方差。
如果把市場上所有可能選擇的證券構成一個按它們的市場比重為權重的組合資產,就稱之為市場組合資產.當投資者僅持有由風險資產組成的市場組合時,每一證券收益率與市場組合收益率的關系就表現為每一證券收益率中與市場組合收益率無關的部分會由於持有市場組合而完全消失,也即每一證券的風險是根據與市場組合的協方差的大小來決定的。體現了單個證券收益與整個「市場組合」收益二者的關系,β I 描述了單個證券對於市場組合收益變化的敏感性。稱為β I 證券I 的系統風險。由於β m =1,所以證券的系統風險可以劃分為兩類,對於β>1的證券,其風險大於平均系統風險;反之,其風險小於平均系統風險。所以β可以衡量證券的相對風險。
3.遞增風險的三種等價定義
為了對兩個證券或投資的風險進行比較,以下給出了遞增風險的三個等價定義:
定義1 設有相同期望值的兩項投資W1和W2,如果
E{U(W1)}≥E{U(W2)}
對每一個凹函數都成立,則稱W1比W2的風險小。
定義2 若設W1和W2為二項投資,存在一個隨機變數ξ, 使得W2= W1+ξ, ξ 為雜訊且 E{ξ| W1}=0,則W1比W2的風險小。
定義3 設W1和W2的分布函數F和G被限制在區間[a ,b]內,且
T(Y)=∫ay[G(x)-F(x)]d x
如果T(y)≥0,且T(b)=0,則稱W1比W2的風險小。
遞增風險的界定對研究最優投資的性質是很有用的。
4.一種新的風險度量方法
設證券收益率為R,它的期望收益率為μ,R=μ +ξ。
其中,E{ξ}=0, μ=E{R}。定義隨機變數,
ξ+=ξ(當ξ≥0),ξ+=0 (當ξ<0);
ξ-=0 (當ξ≥0),ξ-=ξ(當ξ<0)。
- E{ξ-}為證券的風險測度,稱之為平均損失。
對於兩個證券R1 、R2,相應地應有
R1= E{ R1}+ξ1
R2= E{ R2}+ξ2
如果- E{ξ1-}>- E{ξ2-},則我們說證券1的風險比證券2大。
進行證劵投資就是為了妥善的管理我們的財產,把證劵投資風險降到最低是我們每一位投資者所必須考慮的問題! 僅供參考。。。
『拾』 卡方分布
如果有教育心理統計書籍的話看一下便知。下面的網址也有解釋,還有教學視頻。
http://www.nuist.e.cn/courses/tjx/zhang04/d0402021.htm
另外對於這個問題我不知道你是想了解卡方分布的特點還是進行卡方檢驗的應用條件,公式打不出來,簡單說一下分布特點吧:
1。是一族正偏態分布。隨n的大小不同,分布曲線形狀不同,n或n-1越小,分布偏斜,df很大時,接近正態分布,為無窮大是卡方分布就是正態分布。
2。卡方都是正值。
3。卡方分布的和也是卡方分布。卡方分布具有可加性。
4。如果df>2時,卡方分布的平均數=df,方差=2df.
5.卡方分布是連續型分布,但也些離散型的分布也近似於卡方分布。