python 計(jì)算t分布的雙側(cè)置信區(qū)間
如下所示:
interval=stats.t.interval(a,b,mean,std)t分布的置信區(qū) 間
a:置信水平
b:檢驗(yàn)量的自由度
mean:樣本均值
std:樣本標(biāo)準(zhǔn)差
from scipy import statsimport numpy as npx=[10.1,10,9.8,10.5,9.7,10.1,9.9,10.2,10.3,9.9]x1=np.array(x)mean=x1.mean()std=x1.std()interval=stats.t.interval(0.95,len(x)-1,mean,std)
intervalOut[9]: (9.531674678392644, 10.568325321607357)
補(bǔ)充:用Python學(xué)分析 - t分布
1. t分布形狀類似于標(biāo)準(zhǔn)正態(tài)分布
2. t分布是對稱分布,較正態(tài)分布離散度強(qiáng),密度曲線較標(biāo)準(zhǔn)正態(tài)分布密度曲線更扁平
3. 對于大型樣本,t-值與z-值之間的差別很小
作用- t分布糾正了未知的真實(shí)標(biāo)準(zhǔn)差的不確定性
- t分布明確解釋了估計(jì)總體方差時(shí)樣本容量的影響,是適合任何樣本容量都可以使用的合適分布
應(yīng)用- 根據(jù)小樣本來估計(jì)呈正態(tài)分布且方差未知的總體的均值
- 對于任何一種樣本容量,真正的平均值抽樣分布是t分布,因此,當(dāng)存在疑問時(shí),應(yīng)使用t分布
樣本容量對分布的影響- 當(dāng)樣本容量在 30-35之間時(shí),t分布與標(biāo)準(zhǔn)正態(tài)分布難以區(qū)分
- 當(dāng)樣本容量達(dá)到120時(shí),t分布與標(biāo)準(zhǔn)正態(tài)分布實(shí)際上完全相同了
自由度df對分布的影響- 樣本方差使用一個(gè)估計(jì)的參數(shù)(平均值),所以計(jì)算置信區(qū)間時(shí)使用的t分布的自由度為 n - 1
- 由于引入額外的參數(shù)(自由度df),t分布比標(biāo)準(zhǔn)正態(tài)分布的方差更大(置信區(qū)間更寬)
- 與標(biāo)準(zhǔn)正態(tài)分布曲線相比,自由度df越小,t分布曲線愈平坦,曲線中間愈低,曲線雙側(cè)尾部翹得愈高
- 自由度df愈大,t分布曲線愈接近正態(tài)分布曲線,當(dāng)自由度df= ∞ 時(shí),t分布曲線為標(biāo)準(zhǔn)正態(tài)分布曲線
圖表顯示t分布代碼:
# 不同自由度的學(xué)生t分布與標(biāo)準(zhǔn)正態(tài)分布import numpy as npfrom scipy.stats import normfrom scipy.stats import timport matplotlib.pyplot as pltprint(’比較t-分布與標(biāo)準(zhǔn)正態(tài)分布’)x = np.linspace( -3, 3, 100)plt.plot(x, t.pdf(x,1), label=’df=1’)plt.plot(x, t.pdf(x,2), label=’df=20’)plt.plot(x, t.pdf(x,100), label = ’df=100’)plt.plot( x[::5], norm.pdf(x[::5]),’kx’, label=’normal’)plt.legend()plt.show()
運(yùn)行結(jié)果:
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持好吧啦網(wǎng)。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章:
1. vue跳轉(zhuǎn)頁面常用的幾種方法匯總2. js開發(fā)中的頁面、屏幕、瀏覽器的位置原理(高度寬度)說明講解(附圖)3. CSS3實(shí)例分享之多重背景的實(shí)現(xiàn)(Multiple backgrounds)4. 不要在HTML中濫用div5. Vue中原生template標(biāo)簽失效如何解決6. XML入門的常見問題(三)7. 父div高度不能自適應(yīng)子div高度的解決方案8. XML 非法字符(轉(zhuǎn)義字符)9. Jquery使用原生AJAX方法請求數(shù)據(jù)10. el-input無法輸入的問題和表單驗(yàn)證失敗問題解決
