[Big Data] 2016/9/21 台北醫學大學.大數據學分班.學習筆記

  • 統計分析步驟:
    1. 具體定義要回答的問題(將問題已統計方式描述)
    2. 建立Null Hypothesis及Alternate Hypothesis (數學式)
    3. 定義關聯問題的變數
    4. 定義變數類型
    5. 設計實驗控制或攪亂confounding variables
    6. 基於以上的假設和變數,選擇一個最好的統計檢定方法
    7. 如果可以的話,做一次power analysis來決定實驗中最佳的取樣大小
    8. 開始實驗
    9. 檢驗資料是否符合統計檢定的假設,如果不符合,再選擇更適合的檢定方式
    10. 套用統計檢定方法並判讀結果
    11. 將結果製圖、製表,以利溝通
  • Null Hypothesis(虛無假設):統計上對參數的假設 (hypothesis) 為對一個或多個參數的論述 (statement) ,其中欲檢驗其正確性者稱為虛無假設 (null hypothesis) 。
  • Statistical Hypothesis Testing

Tabularised relations between truth/falseness of the null hypothesis and outcomes of the test:[2]

 Table of error types Null hypothesis (H0) is
Valid/True Invalid/False
Judgment of Null Hypothesis (H0) Reject Type I error
(False Positive)
Correct inference
(True Positive)
Fail to reject Correct inference
(True Negative)
Type II error
(False Negative)
Type I = True H0 but reject it (False Positive)

Type II = False H0 but fail to reject it (False Negative)

 

  • Significance Level(顯著水準

發佈留言