色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

您的位置:首頁技術文章
文章詳情頁

如何用python做逐步回歸

瀏覽:23日期:2022-06-23 13:02:05
算法介紹

逐步回歸是一種線性回歸模型自變量選擇方法;逐步回歸的基本思想是將變量逐個引入模型,每引入一個解釋變量后都要進行F檢驗,并對已經選入的解釋變量逐個進行t檢驗,當原來引入的解釋變量由于后面解釋變量的引入變得不再顯著時,則將其刪除。以確保每次引入新的變量之前回歸方程中只包含顯著性變量。這是一個反復的過程,直到既沒有顯著的解釋變量選入回歸方程,也沒有不顯著的解釋變量從回歸方程中剔除為止。以保證最后所得到的解釋變量集是最優的。這里我們選擇赤池信息量(Akaike Information Criterion)來作為自變量選擇的準則,赤池信息量(AIC)達到最?。夯谧畲笏迫还烙嬙淼哪P瓦x擇準則。

數據情況案例

在現實生活中,影響一個地區居民消費的因素有很多,例如一個地區的人均生產總值、收入水平等等,本案例選取了9個解釋變量研究城鎮居民家庭平均每人全年的消費新支出y,解釋變量為:x1——居民的食品花費x2——居民的衣著消費x3——居民的居住花費x4——居民的醫療保健花費x5——居民的文教娛樂花費x6——地區的職工平均工資x7——地區的人均GDPx8——地區的消費價格指數x9——地區的失業率(%)

數據

如何用python做逐步回歸

代碼

# -*- coding: UTF-8 -*-import numpy as npimport statsmodels.api as smimport statsmodels.formula.api as smffrom statsmodels.stats.api import anova_lmimport matplotlib.pyplot as pltimport pandas as pdfrom patsy import dmatricesimport itertools as itimport random# Load data 讀取數據df = pd.read_csv(’data3.1.csv’,encoding=’gbk’)print(df)target = ’y’variate = set(df.columns) #獲取列名variate.remove(target) #去除無關列variate.remove(’地區’)#定義多個數組,用來分別用來添加變量,刪除變量x = []variate_add = []variate_del = variate.copy()# print(variate_del)y = random.sample(variate,3) #隨機生成一個選模型,3為變量的個數print(y)#將隨機生成的三個變量分別輸入到 添加變量和刪除變量的數組for i in y: variate_add.append(i) x.append(i) variate_del.remove(i)global aic #設置全局變量 這里選擇AIC值作為指標formula='{}~{}'.format('y','+'.join(variate_add)) #將自變量名連接起來aic=smf.ols(formula=formula,data=df).fit().aic #獲取隨機函數的AIC值,與后面的進行對比print('隨機化選模型為:{}~{},對應的AIC值為:{}'.format('y','+'.join(variate_add), aic))print('n')#添加變量def forwark(): score_add = [] global best_add_score global best_add_c print('添加變量') for c in variate_del: formula = '{}~{}'.format('y', '+'.join(variate_add+[c])) score = smf.ols(formula = formula, data = df).fit().aic score_add.append((score, c)) #將添加的變量,以及新的AIC值一起存儲在數組中 print(’自變量為{},對應的AIC值為:{}’.format('+'.join(variate_add+[c]), score)) score_add.sort(reverse=True) #對數組內的數據進行排序,選擇出AIC值最小的 best_add_score, best_add_c = score_add.pop() print('最小AIC值為:{}'.format(best_add_score)) print('n')#刪除變量def back(): score_del = [] global best_del_score global best_del_c print('剔除變量') for i in x: select = x.copy() #copy一個集合,避免重復修改到原集合 select.remove(i) formula = '{}~{}'.format('y','+'.join(select)) score = smf.ols(formula = formula, data = df).fit().aic print(’自變量為{},對應的AIC值為:{}’.format('+'.join(select), score)) score_del.append((score, i)) score_del.sort(reverse=True) #排序,方便將最小值輸出 best_del_score, best_del_c = score_del.pop() #將最小的AIC值以及對應剔除的變量分別賦值 print('最小AIC值為:{}'.format(best_del_score)) print('n')print('剩余變量為:{}'.format(variate_del))forwark()back()while variate: # forwark()# back() if(aic < best_add_score < best_del_score or aic < best_del_score < best_add_score): print('當前回歸方程為最優回歸方程,為{}~{},AIC值為:{}'.format('y','+'.join(variate_add), aic)) break elif(best_add_score < best_del_score < aic or best_add_score < aic < best_del_score): print('目前最小的aic值為{}'.format(best_add_score)) print(’選擇自變量:{}’.format('+'.join(variate_add + [best_add_c]))) print(’n’) variate_del.remove(best_add_c) variate_add.append(best_add_c) print('剩余變量為:{}'.format(variate_del)) aic = best_add_score forwark() else: print(’當前最小AIC值為:{}’.format(best_del_score)) print(’需要剔除的變量為:{}’.format(best_del_c)) aic = best_del_score #將AIC值較小的選模型AIC值賦給aic再接著下一輪的對比 x.remove(best_del_c) #在原集合上剔除選模型所對應剔除的變量 back() 結果

如何用python做逐步回歸

如何用python做逐步回歸

如何用python做逐步回歸

以上就是如何用python 做逐步回歸的詳細內容,更多關于python 逐步回歸的資料請關注好吧啦網其它相關文章!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 69日本xxxxxxxxx13| 中文国产成人精品久久一 | 国产一级做a爱片久久毛片a | 亚洲国产日韩欧美在线 | 国产精品综合一区二区 | 国产美女主播一级成人毛片 | 亚洲欧美日韩久久一区 | 亚洲一区二区三区香蕉 | 亚洲成a人片在线网站 | 欧美做爰孕妇群 | 国产va精品网站精品网站精品 | 精品无码久久久久久国产 | 美女黄页网站免费进入 | 免费看孕妇毛片全部播放 | 国产日产欧产精品精品推荐小说 | 日韩在线不卡一区在线观看 | 国内精品久久久久久网站 | 精品久久久久亚洲 | 玖玖精品视频在线 | 亚洲成a人片在线播放 | 国产男女视频在线观看 | 国产二区三区 | 国产成人一级 | 国产成人综合手机在线播放 | 欧美成人 综合网播九公社 欧美成人26uuu欧美毛片 | 国产亚洲在线 | 久久亚洲国产中v天仙www | 国产三级中文字幕 | 欧美成人久久 | 寡妇野外啪啪一区二区 | 国产草草影院 | 日本二级毛片免费 | 99re久久精品国产首页2020 | 日本成本人视频 | 怡红院免费全部视频在线 | 99久久精品免费看国产高清 | 成年网站免费视频黄 | 青青草福利视频 | 亚洲综合色一区二区三区小说 | 日p免费视频 | 2022年国产精品久久久久 |