[Big Data] 2016/9/7 台北醫學大學.大數據學分班.學習筆記

Sampling (取樣):一個從母體選取單位的過程,而且是我們有興趣了解的單位,讓我們可以藉由對這些樣本的研究,反推整個母體的模樣。 Accessible population:因為預算等研究限制的關係,可以接觸到的母體群 Theoretical population:我們想要歸納的群體 要從母體中取一大區塊的群體並

[Big Data] 2016/8/31 台北醫學大學.大數據學分班.學習筆記

分析運作步驟: 訂定問題 確立要研究的母體範圍 取樣(多次取樣以逼近母體) 數據分析上,主要有兩件事,母體(Population)及取樣(Sampling)。 變數可被區分成兩種「數值型變數」和「類別型變數」 數值型變數:可以是「序列」、「區間」、「比例」這幾種型態。 類別型變數:命名式,譬如性別、顏色等變數 搭配上時