1、簡單隨機抽樣
有放回簡單隨機抽樣從總體中隨機抽出一個樣本單位,記錄觀測結(jié)果后,將其放回到總體中去,再抽取第二個,如此類推,一直到抽滿n個單位為止。
單位有被重復(fù)抽中的可能,容易造成信息重疊而影響估計的效率,較少采用。
2、不放回簡單隨機抽樣
從包含N個單元的總體中逐個隨機抽取單元并無放回,每次都在所有尚未被抽入樣本的單元中等概率的抽取下一個單元,直到抽取n個單元為止。
每個單位最多只能被抽中一次,不會由于樣本單位被重復(fù)抽中而提供重疊信息,比放回抽樣有更低的抽樣誤差。
3、分層抽樣
先按照某種規(guī)則把總體分為不同的層,然后在不同的層內(nèi)獨立、隨機的抽取樣本,這樣所得到的樣本稱為分層樣本。如果每層中的抽樣都是簡單隨機抽樣,則稱為分層隨機抽樣。
4、系統(tǒng)抽樣
系統(tǒng)抽樣指先將總體中的所有單元按一定順序排列,在規(guī)定范圍內(nèi)隨機抽取一個初始單元,然后按事先規(guī)定的規(guī)則抽取其他樣本單元。最簡單的系統(tǒng)抽樣是等距抽樣。
5、整群抽樣
整群抽樣是將總體中所有的基本單位按照一定規(guī)則劃分為互不重疊的群,抽樣時直接抽取群,對抽中的群調(diào)查其全部的基本單位,對沒有抽中的群則不進(jìn)行調(diào)查。
擴展資料
概率抽樣包括以下幾個方面的優(yōu)點:調(diào)查者可獲得被抽取的不同年齡、不同層次的人們的信息; 能估算出抽樣誤差; 調(diào)查結(jié)果可以用來推斷總體。
例如,在一項使用概率抽樣法的調(diào)查中,如果有 5 %的被訪者給出了某種特定回答,那么,調(diào)查者就可以以此百分比再結(jié)合抽樣誤差,推及總體情況。
另一方面,概率抽樣也有一些弊?。涸诖蠖鄶?shù)案例中,同樣規(guī)模的概率抽樣的費用要比非概率抽樣高;概率抽樣比非概率抽樣需要更多時間策劃和實施;必須遵守的抽樣計劃執(zhí)行程序會大量增加收集資料的時間。
參考資料來源:百度百科-概率抽樣
1.簡單隨機抽樣
若總體中每個個體被抽到的機會是均等的(即抽樣的隨機性),且在抽樣取走一個個體之后總體內(nèi)成分不變(即抽樣的獨立性),這種抽樣方式稱為簡單隨機抽樣。
簡單隨機抽樣一般用下述三種方法:
(1)抽簽法。把總體中的每一個個體都編上號碼,并做成簽,充分混合后從中隨機抽取一部分,這部分所對應(yīng)的個體就組成一個樣本。
(2)查表法。查隨機數(shù)表,確定從總體中所抽取個體的號碼,則號碼所對應(yīng)的個體就進(jìn)入樣本。隨機數(shù)表可隨意從任何一區(qū)、任何一個數(shù)目開始,依次向各個方向順序進(jìn)行。
(3)計算機造數(shù)法。用電子計算機編造隨機數(shù)程序,把隨機數(shù)作為總體中抽出個體進(jìn)入樣本的號碼。
2.系統(tǒng)抽樣(等距抽樣)
系統(tǒng)抽樣方法實際上是等間隔法的機械抽樣。它把總體中所有個體按一定順序編號,然后依固定間隔取樣,間隔的大小視所需樣本容量與總體中個體數(shù)目的比率而定,起始數(shù)字必須是隨機決定的。等距抽樣又有直線等距抽樣,對稱等距抽樣和循環(huán)等距抽樣三種。這種方法與簡單隨機抽樣相比,方便、易學(xué)、易做,當(dāng)總體按一定順序排定后,第一個樣本一經(jīng)確定,其他樣本也隨之確定。但是,這種抽樣方法在名單排列中,如果存在周期性部分,則會造成偏差。因此,在等距抽樣間距確定以后,選擇起點時,應(yīng)根據(jù)掌握的信息,盡量避開總體可能存在周期的點。
3.分層抽樣(類型抽樣)分層抽樣是先把總體按一定標(biāo)志分成不同類型或?qū)哟?,然后從各種不同類型中隨機抽取若干單位組成樣本。
分層抽樣在各層中抽取的樣本也可看成總的樣本數(shù)在各層的分?jǐn)?,它又有三種方法:
(1)等比例抽樣。即各層所抽樣本數(shù)占各層總體單位數(shù)的比例相等。
(2)按各層的離散情況分配樣本。某層的離散程度大,則該層多分?jǐn)傄恍颖尽?/p>
(3)最優(yōu)分配。既考慮到各層的單位數(shù)的多少,又考慮到各層的離散情況。
4.整群抽樣
整群抽樣是先將各單位劃分為若干群(組),然后以群為單位從中隨機抽取一些群,對抽中的群的所有單位進(jìn)行調(diào)查。
概率抽樣包括有簡單隨機抽樣、系統(tǒng)抽樣(等距抽樣)、分層抽樣(類型抽樣)、整群抽樣、多段抽樣、PPS抽樣和戶內(nèi)抽樣。
例如: 簡單隨機抽樣是一種廣為使用的概率抽樣方法。是最完全的概率抽樣。
如前面提到的,隨機抽樣就是總體中每個單位在抽選時有相等的被抽中的機會。在簡單隨機抽樣條件下,抽樣概率公式為:抽樣概率=樣本單位數(shù)∕總體單位數(shù)例如,如果總體單位數(shù)為 10000 ,樣本單位數(shù)為 400 ,那么抽樣概率為 4 %。
簡單隨機抽樣的優(yōu)點在于,它看起來簡單,并且滿足概率抽樣的一切必要的要求,保證每個總體單位在抽選時都有相等的被抽中的機會。簡單隨機抽樣可以通過電話隨機撥號功能完成這個步驟,可以從電腦檔案中挑選調(diào)查對象。
同樣,簡單隨機抽樣會遇到“樣本可能分布不均勻”以及“沒有好的抽樣框”等問題。友邦顧問在簡單隨機抽樣過程中常使用的技巧為“抽簽法”和“隨機表”法。
在定量抽樣調(diào)查中,等距抽樣常常代替簡單隨機抽樣。由于該抽樣方法簡單實用,所以應(yīng)用普遍。
等距抽樣得到的樣本幾乎與簡單隨機抽樣得到的樣本是相同的。等距抽樣的基本做法是,將總體中的各單元先按一定的順序排列、編號,然后決定一個間隔,并在此間隔基礎(chǔ)上選擇被調(diào)查的單位個體。
樣本距離可通過下面公式確定:樣本距離 =總體單位數(shù)∕樣本單位數(shù)例如,假設(shè)你使用本地電話本并確定樣本距離為 100 ,那么 100 個中取 1 個組成樣本。這個公式保證了整個列表的完整性。
等距抽樣方式隨意用一個起點,例如,如果你把一本電話本作為抽樣框,必須隨意取出一個號碼決定從該頁開始翻閱。假設(shè)從第 5 頁開始,在該頁上再另選一個數(shù)決定從該行開始。
假定選擇從第 3 行開始,這就決定了實際開始的位置。等距抽樣方式相對于簡單隨機抽樣方式最主要的優(yōu)勢就是經(jīng)濟性。
等距抽樣方式比簡單隨機抽樣更為簡單,花的時間更少,并且花費也少。使用等距抽樣方式最大的缺陷在于總體單位的排列上。
一些總體單位數(shù)可能包含隱蔽的形態(tài)或者是“不合格樣本”,調(diào)查者可能疏忽,把它們抽選為樣本。 定量調(diào)查中的分層抽樣是一種卓越的概率抽樣方式,在友邦公司以往的調(diào)查中經(jīng)常被使用。
分層抽樣的具體程序是:把總體各單位分成兩個或兩個以上的相互獨立的完全的組(如男性和女性),從兩個或兩個以上的組中進(jìn)行簡單隨機抽樣,樣本相互獨立??傮w各單位按主要標(biāo)志加以分組,分組的標(biāo)志與我們關(guān)心的總體特征相關(guān)。
例如,我們正在進(jìn)行有關(guān)啤酒品牌知名度方面的調(diào)查,初步判別,在啤酒方面男性的知識與和女性不相同,那么性別應(yīng)是劃分層次的適當(dāng)標(biāo)志。如果不以這種方式進(jìn)行分層抽樣,分層抽樣就得不到什么效果,花再多時間、精力和物資也是白費。
分層抽樣與簡單隨機抽樣相比,我們往往選擇分層抽樣,因為它有顯著的潛在統(tǒng)計效果。也就是說,如果我們從相同的總體中抽取兩個樣本,一個是分層樣本,另一個是簡單隨機抽樣樣本,那么相對來說,分層樣本的誤差更小些。
另一方面,如果目標(biāo)是獲得一個確定的抽樣誤差水平,那么更小的分層樣本將達(dá)到這一目標(biāo)。在調(diào)查實踐中,為提高分層樣本的精確度實際上要付出一些代價。
通常,我們現(xiàn)實正確的分層抽樣一般有三個步驟:首先,辯明突出的(重要的)人口統(tǒng)計特征和分類特征,這些特征與所研究的行為相關(guān)。例如,研究某種產(chǎn)品的消費率時,按常理認(rèn)為男性和女性有不同的平均消費比率。
為了把性別作為有意義的分層標(biāo)志,調(diào)查者肯定能夠拿出資料證明男性與女性的消費水平明顯不同。用這種方式可識別出各種不同的顯著特征。
調(diào)查表明,一般來說,識別出 6 個重要的顯著特征后,再增加顯著特征的辨別對于提高樣本代表性就沒有多大幫助了。第二,確定在每個層次上總體的比例(如性別已被確定為一個顯著的特征,那么總體中男性占多少比例,女性占多少比例呢?)。
利用這個比例,可計算出樣本中每組(層)應(yīng)調(diào)查的人數(shù)。最后,調(diào)查者必須從每層中抽取獨立簡單隨機樣本。
以上各種抽樣類型全部是按單位抽取的,即按樣本單位數(shù),分別一個單位一個單位地抽取。在整群抽樣中,樣本是一組單位一組單位地抽取。
整群抽樣有兩個關(guān)鍵步驟:-同質(zhì)總體被分為相互獨立的完全的較小子集。-隨機抽選子集構(gòu)成樣本。
如果調(diào)查者在抽中的子集中觀察全部單位,我們就有了一級整群樣本。如果在抽中的子集中再以概率方式抽取部分單位觀察,我們就有了二級整群樣本。
分層和整群抽樣都要將總體分為相互獨立的完全子集。它們的區(qū)別是,分層抽樣的樣本是從每個子集中抽取,而整群抽樣則是抽取部分子集。
地理區(qū)域抽樣是整群抽樣的典型方式。挨門挨戶去調(diào)查一個特定城市的調(diào)查者也許會隨機抽選一些區(qū)域,較集中地訪查一些群體,大量減少訪問時間和經(jīng)費。
整群抽樣被認(rèn)為是概率抽樣技術(shù),因為它隨機抽出群和隨機抽出單位。值得注意的是,在整群抽樣下,我們假定群中單位與總體一樣存在異質(zhì)性。
如果一群中單位的特征非常相似,如果由于共同環(huán)境使群內(nèi)差異小而群與群之間差異大。一般來說,要解決這個問題可以擴大群數(shù),然后從各群中抽取少量單位數(shù),以保證樣本。
概率抽樣方法 (Probability Sampling)
概率抽樣包括有
1. 簡單隨機抽樣(又稱:單純隨機抽樣)
2. 系統(tǒng)抽樣(等距抽樣)
3. 分層隨機抽樣(類型抽樣)
4. 分群隨機抽樣
等方法。概率抽樣又稱幾率抽樣、可能率抽樣,在實踐中受到人們的普遍重視和廣泛應(yīng)用。概率抽樣是以概率論與數(shù)理統(tǒng)計為基礎(chǔ),首先按照隨機的原則選取調(diào)查樣本,使調(diào)查母體中每一個子體均有被選中的可能性,即具有同等被選為樣本的可能率,機遇均等。定量市場調(diào)查中的概率抽樣是指在調(diào)查總體樣本中的每個單位都具有同等可能性被抽中的機會。
概率抽樣的基本原則是:樣本量越大,抽樣誤差就越小,而樣本量越大,則成本就越高。根據(jù)數(shù)理統(tǒng)計規(guī)律,樣本量增加呈直線遞增的情況下(樣本量增加一倍,成本也增加一倍),而抽樣誤差只是樣本量相對增長速度的平方根遞減。因此,樣本量的設(shè)計并不是越大越好,通常會受到經(jīng)濟條件的制約。
簡單隨機抽樣簡單隨機抽樣(simple random sampling)又稱純隨機抽樣,是概率抽樣的最基本形式。
它是按等概率原則直接從含有N個元素的總體中隨機抽取n個元素組成樣本(N>n)。常用的辦法類似于抽簽,即把總體的每一個單位都編號,將這些號碼寫在一張張小紙條上,然后放入一容器(如紙盒、口袋)中,攪拌均勻后,從中任意抽取,直到抽夠預(yù)定的樣本數(shù)目。
這樣,由抽中的號碼所代表的元素組成的就是一個簡單隨機樣本。?比如,某系共有學(xué)生300人,系學(xué)生會打算采用簡單隨機抽樣的辦法,從中抽取出60人進(jìn)行調(diào)查。
為了保證抽樣的科學(xué)性,他們先從系辦公室得到一份全系學(xué)生的名單,然后給名單中的每個學(xué)生都編上一個號(從001到300)。抽樣框編好后,他們又用300張小紙條分別寫上001,002,…,300。
他們把這300張寫好不同號碼的小紙條放在一個盒子里,攪亂后,隨便摸出60張小紙條。然后,他們按這60張小紙條上的號碼找到總體名單上所對應(yīng)的60位同學(xué)。
這60位同學(xué)就構(gòu)成了他們本次的樣本。這種方法簡便易學(xué)。
但當(dāng)總體元素很多時,寫號碼的工作量就很大,攪拌均勻也不容易,因而此法往往在總體元素較少時使用。對于總體元素很多的情形,我們則采用隨機數(shù)表來抽樣。
本書后就附有一張隨機數(shù)表,表中的數(shù)碼和排列都是隨機形成的,沒有任何規(guī)律性(故也稱為亂數(shù)表)。利用隨機數(shù)表進(jìn)行抽樣的具體步驟是:(1)先取得一份總體所有元素的名單(即抽樣框);(2)將總體中所有元素一一按順序編號;(3)根據(jù)總體規(guī)模是幾位數(shù)來確定從隨機數(shù)表中選幾位數(shù)碼;(4)以總體的規(guī)模為標(biāo)準(zhǔn),對隨機數(shù)表中的數(shù)碼逐一進(jìn)行衡量并決定取舍;(5)根據(jù)樣本規(guī)模的要求選擇出足夠的數(shù)碼個數(shù);(6)依據(jù)從隨機數(shù)表中選出的數(shù)碼,到抽樣框中去找出它所對應(yīng)的元素。
按上述步驟選擇出來的元素的集合,就是所需要的樣本。舉例來說,某總體共3 000人(四位數(shù)),需要從中抽取100人作為樣本進(jìn)行調(diào)查。
首先,我們要得到一份總體成員的名單;然后對總體中的每一個人從1到3 000進(jìn)行編號;再根據(jù)總體的規(guī)模,確定從隨機數(shù)表中選擇四位數(shù)。具體的選法是從隨機數(shù)表的任意一行和任意一列的某一個四位數(shù)開始,按照從上到下的順序,或者從左到右的順序,以3 000為標(biāo)準(zhǔn),對隨機數(shù)表中依次出現(xiàn)的每個四位數(shù)進(jìn)行取舍:凡小于或等于3 000的數(shù)碼就選出來,凡大于3 000的數(shù)碼以及已經(jīng)選出的數(shù)碼則不要,直到選夠100個數(shù)碼為止;最后按照所抽取的數(shù)碼,從總體名單中找到它們所對應(yīng)的100個成員。
這100個成員就構(gòu)成一個隨機樣本。表6—2就是對3 000人的總體進(jìn)行抽樣時,我們采用隨機數(shù)表對四位數(shù)碼進(jìn)行取舍的例子(采用后四位數(shù),并按從上往下的順序)。
表6—2隨機數(shù)表抽樣例隨機數(shù)表中的數(shù)碼選用的數(shù)碼不選用的原因后面四位數(shù)大于后面四位數(shù)大于30001359866042后面四位數(shù)大于3 與所選的第三個數(shù)碼重復(fù)27256511761176如果采用前四位數(shù)字,仍按從上往下的順序,那么從表6—2中我們又可以抽取出1 053、0 139、1 359、2 725這四個號碼;如果取中間的四位數(shù)字,所得到的則是2 990、1 404、1 912和0 582這四個號碼了。二、系統(tǒng)抽樣系統(tǒng)抽樣(systematic sampling)又稱等距抽樣或間隔抽樣。
它是把總體的單位進(jìn)行編號排序后,再計算出某種間隔,然后按這一固定的間隔抽取個體的號碼來組成樣本的方法。它和簡單隨機抽樣一樣,需要有完整的抽樣框,樣本的抽取也是直接從總體中抽取個體,而無其他中間環(huán)節(jié)。
系統(tǒng)抽樣的具體步驟是:(1)給總體中的每一個個體按順序編號,即制定出抽樣框。(2)計算出抽樣間距。
計算方法是用總體的規(guī)模除以樣本的規(guī)模。假設(shè)總體規(guī)模為N,樣本規(guī)模為n,那么抽樣間距K就由下列公式求得:K(抽樣間距)=N(總體規(guī)模)n(樣本規(guī)模)(3)在最前面的K個個體中,采用簡單隨機抽樣的方法抽取一個個體,記下這個個體的編號(假設(shè)所抽取的這個個體的編號為A),它稱做隨機的起點。
(4)在抽樣框中,自A開始,每隔K個個體抽取一個個體,即所抽取個體的編號分別為A,A+K,A+2K,…,A+(n-1)K。(5)將這n個個體合起來,就構(gòu)成了該總體的一個樣本。
例如,要在某大學(xué)總共3 000名學(xué)生中,抽取一個容量為100的大學(xué)生樣本。我們先將3 000名學(xué)生的名單依次編上號碼,然后按上述公式可求得抽樣間距為:K=3 000/100=30即每隔30人抽一名。
為此,我們先在1~30的數(shù)碼中,采用簡單隨機抽樣的方法抽取一個數(shù)字,假如抽到的是12,那么就以12為第一個號碼,每隔30名再抽一個。這樣,我們便可得到12,42,72,…,2 982總共100個號碼。
我們再根據(jù)這100個號碼,從總體名單中一一對應(yīng)地找出100名學(xué)生,這100名學(xué)生就構(gòu)成本次的一個樣本。從上面的過程中我們不難看出,系統(tǒng)抽樣較之于簡單隨機抽樣來說,顯然簡便易行多了,尤其是當(dāng)總體及樣本的規(guī)模都較大時更是如此。
這也正是社會研究較少采用簡單隨機抽樣而較多采用系統(tǒng)抽樣的原因。值得注意的是。

聲明:本網(wǎng)站尊重并保護(hù)知識產(chǎn)權(quán),根據(jù)《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》,如果我們轉(zhuǎn)載的作品侵犯了您的權(quán)利,請在一個月內(nèi)通知我們,我們會及時刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學(xué)習(xí)鳥. 頁面生成時間:3.163秒