四、統計描述與統計推斷
統計的主要工作就是對統計數據進行統計描述和統計推斷。統計描述是統計分析的最基本內容,是指應用統計指標、統計表、統計圖等方法,對資料的數量特征及其分布規律進行測定和描述;而統計推斷是指通過抽樣等方式進行樣本估計總體特征的過程,包括參數估計和假設檢驗兩項內容。
(一)統計描述
1.計量資料的統計描述
計量資料的統計描述主要通過編制頻數分布表、計算集中趨勢指標和離散趁勢指標以及統計圖表來進行。
(1)集中趨勢。指頻數表中頻數分布表現為頻數向某一位置集中的趨勢。
集中趨勢的描述指標:
1)算術平均數。
直接法:
x為觀察值,z為個數
加權法又稱頻數表法,適用于頻數表資料,當觀察例數較多時用。
2.假設檢驗
假設檢驗是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質差別造成的統計推斷方法。
(1)假設檢驗的基本思想。假設檢驗的基本思想是小概率反證法思想。小概率思想是指小概率事件(P<0.01或P<0.05)在一次試驗中基本上不會發生。反證法思想是先提出假設(檢驗假設Ho),再用適當的統計方法確定假設成立的可能性大小,如可能性小,則認為假設不成立,若可能性大,則還不能認為假設不成立。
(2)假設檢驗的基本步驟。第一步:提出檢驗假設(又稱無效假設)和備擇假設。
Ho-樣本與總體或樣本與樣本間的差異是由抽樣誤差引起的。
H1:樣本與總體或樣本與樣本間存在本質差異。
預先設定的檢驗水準為0.05.
第二步:選定統計方法,計算出統計量的大小。根據資料的類型和特點,可分別選用t檢驗,U檢驗,秩和檢驗和卡方檢驗等。
第三步:根據統計量的大小及其分布確定檢驗假設成立的可能性P的大小并判斷結果。若P值小于預先設定的檢驗水準,則H0成立的可能性小,即拒絕H0,若P值不小于預先設定的檢驗水準,則H0成立的可能性還不小,還不能拒絕Ho.P值的大小一般可通過查閱相應的界值表得到。
(3)進行假設檢驗應注意的問題
1)做假設檢驗之前,應注意資料本身是否有可比性。
2)當差別有統計學意義時應注意這樣的差別在實際應用中有無意義。
3)根據資料類型和特點選用正確的假設檢驗方法。
4)根據專業及經驗確定是選用單側檢驗還是雙側檢驗。
5)當檢驗結果為拒絕無效假設時,應注意有發生I類錯誤的可能性,即錯誤地拒絕了本身成立的Ho,發生這種錯誤的可能性預先是知道的,即檢驗水準那么大;當檢驗結果為不拒絕無效假設時,應注意有發生Ⅱ類錯誤的可能性,即仍有可能錯誤地接受了本身就不成立的H0,發生這種錯誤的可能性預先是不知道的,但與樣本含量和I類錯誤的大小有關系。
6)判斷結論時不能絕對化,應注意無論接受或拒絕檢驗假設,都有判斷錯誤的可能性。
7)報告結論時應注意說明所用的統計量,檢驗的單雙側及P值的確切范圍。{來源:考{試大}