發(fā)布時(shí)間:2023-08-15 17:13:36
序言:寫(xiě)作是分享個(gè)人見(jiàn)解和探索未知領(lǐng)域的橋梁,我們?yōu)槟x了8篇的統(tǒng)計(jì)學(xué)變量類型樣本,期待這些樣本能夠?yàn)槟峁┴S富的參考和啟發(fā),請(qǐng)盡情閱讀。
現(xiàn)在國(guó)家碩士研究生培養(yǎng)門(mén)類中列于數(shù)學(xué)大類之下屬于概率論與數(shù)理統(tǒng)計(jì)大方向的有概率論與數(shù)理統(tǒng)計(jì)學(xué)術(shù)型碩士,應(yīng)用統(tǒng)計(jì)專業(yè)學(xué)位碩士?jī)深悺深惔T士生的來(lái)源均是四年制本科生,學(xué)術(shù)性碩士生源的一般要求是數(shù)學(xué)或統(tǒng)計(jì)學(xué)專業(yè)畢業(yè),應(yīng)用統(tǒng)計(jì)專業(yè)學(xué)位碩士則只要求是理工科及相關(guān)專業(yè)即可,二者差別較大,專業(yè)知識(shí)的起點(diǎn)高度有差距。
在培養(yǎng)目標(biāo)上,兩類碩士差距就更加明顯了。學(xué)術(shù)型碩士要求可以進(jìn)行基本的專業(yè)理論研究,有繼續(xù)進(jìn)行高等理論研究的素質(zhì)和潛力,其中的一部分人可以繼續(xù)攻讀本專業(yè)及相關(guān)金融、管理、經(jīng)濟(jì)等相關(guān)專業(yè)的博士學(xué)位,學(xué)術(shù)性的碩士生更強(qiáng)調(diào)理論學(xué)習(xí)和理論基礎(chǔ)的訓(xùn)練。專業(yè)學(xué)位碩士則要求較好的專業(yè)知識(shí)實(shí)用能力,了解掌握常用統(tǒng)計(jì)方法的思想和軟件應(yīng)用,實(shí)踐能力強(qiáng),具有分析解決帶復(fù)雜數(shù)據(jù)分析背景的實(shí)際問(wèn)題的潛力,強(qiáng)調(diào)的是學(xué)生對(duì)實(shí)際問(wèn)題的處理能力,各種統(tǒng)計(jì)方法的綜合運(yùn)用及實(shí)戰(zhàn)能力。在國(guó)外發(fā)達(dá)國(guó)家,目前均有應(yīng)用統(tǒng)計(jì)專業(yè)學(xué)位博士,就是說(shuō)將來(lái)在我們國(guó)家,優(yōu)秀的應(yīng)用統(tǒng)計(jì)專業(yè)學(xué)位碩士可以進(jìn)一步攻讀專業(yè)學(xué)位博士,這類博士應(yīng)該對(duì)實(shí)際問(wèn)題有敏銳的眼光,對(duì)各種實(shí)用的統(tǒng)計(jì)方法有全面的了解,知曉其長(zhǎng)處與不足,可以解決復(fù)雜的實(shí)際數(shù)據(jù)分析問(wèn)題,因此應(yīng)用統(tǒng)計(jì)專業(yè)學(xué)位碩士的概率理論基礎(chǔ)訓(xùn)練應(yīng)更加傾向于實(shí)際,傾向于在統(tǒng)計(jì)學(xué)中大量用到的概率論知識(shí)。這就決定了對(duì)兩類碩士在概率論基礎(chǔ)知識(shí)要求方面有很大不同。在概率論基礎(chǔ)方面,由于兩類生源的本科知識(shí)體系中都是以《概率論與數(shù)理統(tǒng)計(jì)》課程為起點(diǎn),概率論部分基本相同,內(nèi)容是:概率基礎(chǔ)及公式,隨機(jī)變量及分布,隨機(jī)向量及分布,數(shù)字特征及計(jì)算。在碩士生階段應(yīng)在此基礎(chǔ)上考慮兩類碩士的培養(yǎng)目標(biāo)的差異,分別在概率基礎(chǔ)課程中安排不一樣的教學(xué)內(nèi)容和重點(diǎn)。
對(duì)學(xué)術(shù)型碩士生,通常開(kāi)設(shè)《高等概率論》課程,以測(cè)度論為起點(diǎn),具有一定的抽象度和深刻性,講授一般觀點(diǎn)下的積分、可測(cè)變換,隨機(jī)變量及向量,概率理論、基本公式獨(dú)立性,不等式和極限定理,數(shù)字特征與相依關(guān)系,講述高度抽象的測(cè)度控制理論、拉冬一尼古丁定理、抽象的條件期望理論,訓(xùn)練學(xué)生的思考能力和論證基本功。對(duì)應(yīng)用統(tǒng)計(jì)專業(yè)學(xué)位碩士,開(kāi)設(shè)《概率論基礎(chǔ)課程》,不涉及測(cè)度論等抽象內(nèi)容,但是要把在實(shí)際應(yīng)用中所有數(shù)據(jù)類型所對(duì)應(yīng)的概率密度形式及演算作為重點(diǎn)加以訓(xùn)練,內(nèi)容應(yīng)該集中在常見(jiàn)隨機(jī)變量的回顧,特殊類型的隨機(jī)變量(既不是離散的也不是連續(xù)的)的引入和背景,條件概率演算一特別是連續(xù)變量對(duì)離散變量、離散變量對(duì)連續(xù)變量的條件概率計(jì)算,復(fù)雜情況下隨機(jī)變量數(shù)字特征的計(jì)算等等,強(qiáng)調(diào)學(xué)生的動(dòng)手推演能力和問(wèn)題歸類能力,例如要求學(xué)生會(huì)計(jì)算貝葉斯理論中常用的二項(xiàng)變量與貝塔變量的聯(lián)合分布,通過(guò)這個(gè)聯(lián)合分布來(lái)來(lái)計(jì)算相應(yīng)的廣義條件概率密度及條件數(shù)學(xué)期望。另一個(gè)例子就是給學(xué)生們?cè)敿?xì)介紹對(duì)連續(xù)型隨機(jī)變量進(jìn)行截?cái)嘁院蟮玫降慕財(cái)嚯S機(jī)變量的分布推演過(guò)程,講述清楚該類型隨機(jī)變量所對(duì)應(yīng)的廣義密度函數(shù)與原來(lái)的連續(xù)型隨機(jī)變量的密度函數(shù)之間的關(guān)系,這類隨機(jī)變量既不是連續(xù)性的也不是離散型的,使二者的結(jié)合體,在生物統(tǒng)計(jì)、工程試驗(yàn)的數(shù)據(jù)集合中經(jīng)常會(huì)出現(xiàn)。
統(tǒng)計(jì)學(xué)在非統(tǒng)計(jì)學(xué)的各專業(yè)應(yīng)用非常廣泛。它不僅是數(shù)學(xué)工作者研究現(xiàn)實(shí)世界復(fù)雜問(wèn)題的基本科研手段,也是其他各行各業(yè)工作者們研究各自領(lǐng)域工作的重要方法。要保證學(xué)生們通過(guò)對(duì)概率統(tǒng)計(jì)課程的專業(yè)學(xué)習(xí)后,能夠?qū)Ω黝悊?wèn)題正確地選擇并使用統(tǒng)計(jì)方法。實(shí)際上在很多時(shí)候同學(xué)們通過(guò)學(xué)習(xí)或借鑒文獻(xiàn)中的做法都可以正確地選擇統(tǒng)計(jì)方法,但是在接下來(lái)的具體處理過(guò)程中就會(huì)犯下錯(cuò)誤,即沒(méi)能正確理解并使用該統(tǒng)計(jì)方法。而犯上述錯(cuò)誤的真正根源在于學(xué)生沒(méi)用熟練掌握概率的相關(guān)基本知識(shí)點(diǎn)。
實(shí)際上,統(tǒng)計(jì)方法在應(yīng)用于具體問(wèn)題的時(shí)候,需要許多環(huán)節(jié),其中最重要的是需要學(xué)生動(dòng)手來(lái)推算該具體問(wèn)題中涉及到的分布密度――特別是聯(lián)合密度、邊際密度與條件密度,演算方法應(yīng)用中的變量變換及相應(yīng)的分布密度,計(jì)算變量的數(shù)字特征,這些都是統(tǒng)計(jì)方法應(yīng)用的基本環(huán)節(jié),如果計(jì)算推演這一環(huán)節(jié)沒(méi)有經(jīng)過(guò)扎實(shí)地訓(xùn)練,那么在這一環(huán)節(jié)上經(jīng)常會(huì)出錯(cuò),統(tǒng)計(jì)結(jié)論就可能是錯(cuò)的。
上面的錯(cuò)誤歸結(jié)起來(lái)并不是同學(xué)的統(tǒng)計(jì)學(xué)沒(méi)有學(xué)好,而是他(她)的概率論基本訓(xùn)練沒(méi)有到位,因此有必要突出強(qiáng)調(diào)應(yīng)用統(tǒng)計(jì)類課程所需要的重要知識(shí)點(diǎn),在講授概率基礎(chǔ)課程時(shí)候加以特別強(qiáng)化訓(xùn)練。最重要的知識(shí)點(diǎn)主要有:
1.列出基于已知分布密度推導(dǎo)各種特殊數(shù)據(jù)類型的廣義概率密度的相應(yīng)方法。在實(shí)踐中最常用的數(shù)據(jù)類型主要有:一元連續(xù)型、多元連續(xù)型(常見(jiàn)且基本),一元離散型、多元離散型(常見(jiàn)且基本),同時(shí)具有離散型與連續(xù)型分量的多元數(shù)據(jù)(常見(jiàn)但不基本),右刪失數(shù)據(jù)(工程與生物領(lǐng)域常見(jiàn)但不基本)、左截?cái)鄶?shù)據(jù)(不常用又不基本),具有缺失分量的多元數(shù)據(jù)(常見(jiàn)但不基本),都可以給出相應(yīng)的方法求廣義概率密度。
2.概率基本公式應(yīng)用與條件分布的演算。教會(huì)學(xué)生正確地寫(xiě)出三大概率基本公式所需的各個(gè)要素,特別是關(guān)于條件概率及其密度的演算。重中之重有兩處:一是會(huì)求離散變量關(guān)于連續(xù)變量的廣義條件密度(十分常用),二是會(huì)利用廣義條件密度及廣義邊際密度求離散變量與連續(xù)變量的廣義聯(lián)合密度(十分常用)。
3.計(jì)算條件期望、條件方差等條件化的數(shù)字特征(包括期望、方差、協(xié)方差、矩母函數(shù)、特征函數(shù)、概率母函數(shù)等),以及數(shù)值特征之間的相互關(guān)系。這些計(jì)算都是以計(jì)算條件分布為基礎(chǔ)的,要讓學(xué)生知道條件分布密度也可以對(duì)應(yīng)到類似于數(shù)學(xué)期望等數(shù)字特征,在該場(chǎng)合下即被叫做條件數(shù)字特征;要讓同學(xué)們知道這些數(shù)學(xué)期望、方差等與絕對(duì)數(shù)字特征的區(qū)別,不要在計(jì)算時(shí)混淆。
地質(zhì)統(tǒng)計(jì)學(xué)是1962年,法國(guó)著名統(tǒng)計(jì)學(xué)家G.Matheron在Traitédegéostatistiqueappliquée一文最早提出的,之后其他科學(xué)家大量理論研究的基礎(chǔ)上逐漸形成的一門(mén)新的統(tǒng)計(jì)學(xué)與地質(zhì)學(xué)的交叉學(xué)科。地質(zhì)統(tǒng)計(jì)學(xué)所利用的是應(yīng)用統(tǒng)計(jì)學(xué)。地質(zhì)統(tǒng)計(jì)學(xué)因?yàn)榫哂锌臻g的分布特點(diǎn),而且是利用區(qū)域變量理論作為理論基礎(chǔ),因此地質(zhì)統(tǒng)計(jì)學(xué)在礦產(chǎn)開(kāi)發(fā)、資源開(kāi)發(fā)、動(dòng)植物研究、地質(zhì)地貌方面都有著很突出的作用。之所以將它稱作地質(zhì)統(tǒng)計(jì)學(xué)是因?yàn)?,它最早只是?yīng)用在地理科學(xué)當(dāng)中。地質(zhì)統(tǒng)計(jì)學(xué)的創(chuàng)立最初是由G.Matheron創(chuàng)造的,經(jīng)過(guò)長(zhǎng)時(shí)間的改造與發(fā)展,現(xiàn)在的地質(zhì)統(tǒng)計(jì)學(xué)已經(jīng)成為一門(mén)非常完善的數(shù)學(xué)工具了,而且它的應(yīng)用也變得越來(lái)越廣泛,由最初單純的地理研究,發(fā)展到今天在地球物理、地質(zhì)、生態(tài)、土壤等領(lǐng)域的廣泛應(yīng)用。
二、地質(zhì)統(tǒng)計(jì)學(xué)在礦山儲(chǔ)量分析當(dāng)中的應(yīng)用
地質(zhì)統(tǒng)計(jì)學(xué)是以研究區(qū)域化變量為基礎(chǔ)的,以變異函數(shù)為研究工具,研究在空間上具有隨機(jī)性和結(jié)構(gòu)性的自然現(xiàn)象的科學(xué)。地質(zhì)統(tǒng)計(jì)學(xué)在礦山儲(chǔ)量分析當(dāng)中的應(yīng)用中的原理大致分為以下幾種:1.區(qū)域化變量區(qū)域化變量是地質(zhì)統(tǒng)計(jì)學(xué)理論體系的核心基礎(chǔ),在實(shí)踐中,鉆孔的位置。在絕大多數(shù)情況下是不隨機(jī)的。當(dāng)兩個(gè)樣品在空間的距離很小時(shí),樣品間會(huì)存在較強(qiáng)的相似性,而當(dāng)距離很大時(shí),相似性就會(huì)減弱或不存在。也就是說(shuō),樣品之間存在著某種聯(lián)系,這種聯(lián)系的強(qiáng)弱是與樣品的相對(duì)位置有關(guān)的,樣品之間的聯(lián)系在空間上既具有隨機(jī)性又具有位置之間的聯(lián)系。2.半變異函數(shù)的數(shù)學(xué)模型通常情況下樣品由于取樣、化驗(yàn)誤差和礦化作用在短距離內(nèi)的變化,在絕大多數(shù)情況下半變異函數(shù)在原點(diǎn)不等于零。也就是會(huì)存在塊金效應(yīng)。但是地質(zhì)統(tǒng)計(jì)學(xué)在礦山儲(chǔ)量分析當(dāng)中的應(yīng)用在實(shí)際工作中區(qū)域化變量的變化性很復(fù)雜,通常要計(jì)算幾個(gè)具有代表性的方向,然后通過(guò)結(jié)構(gòu)分析,得到一個(gè)能代表其空間變異性的模型函數(shù),由于區(qū)域化變量往往存在各向異性,不同方向上的半變異函數(shù)具有不同的變程,影響范圍是一橢球體,即各向異性橢球體。在確定空間搜索橢球體時(shí),不僅需要指出塊金常數(shù)、基臺(tái)、變程,還需要指定一些參數(shù):圓錐體的容差角、容差限、滯后距等,各個(gè)參數(shù)的意義用幾何圖形表示。當(dāng)然應(yīng)用地質(zhì)統(tǒng)計(jì)學(xué)法對(duì)礦山儲(chǔ)量分析,被大部分人認(rèn)為是一種較好的品位估值方法,尤其適用于品位變化大,礦巖界線由品位控制的礦床。在估值計(jì)算過(guò)程中,當(dāng)有了足夠的地質(zhì)鉆孔數(shù)據(jù)時(shí),對(duì)礦床進(jìn)行正式可行性評(píng)價(jià)時(shí),選用地質(zhì)統(tǒng)計(jì)學(xué)法是一種較好的方法,而在對(duì)礦床進(jìn)行初步評(píng)價(jià)或是數(shù)據(jù)量不足時(shí),就要首選較簡(jiǎn)單的方法。基于地質(zhì)統(tǒng)計(jì)學(xué)原理和礦體三維可視化建模技術(shù)的DIMINE礦業(yè)軟件,實(shí)現(xiàn)了按照不同的邊界品位動(dòng)態(tài)圈定礦體,能夠以市場(chǎng)經(jīng)濟(jì)為向?qū)?快速計(jì)算出礦體范圍內(nèi)的礦石量,并進(jìn)行儲(chǔ)量分級(jí),在此過(guò)程中所得到的各中間參數(shù),可以為投資決策和日常管理提供必要的參考依據(jù)。
三、地質(zhì)統(tǒng)計(jì)學(xué)在勘探網(wǎng)度優(yōu)化方面的應(yīng)用
地質(zhì)統(tǒng)計(jì)學(xué)在勘探網(wǎng)度優(yōu)化中的應(yīng)用主要要注意以下的兩個(gè)個(gè)因素,其一是:構(gòu)造復(fù)雜程度;二是煤層的穩(wěn)定性。當(dāng)勘探區(qū)的構(gòu)造已經(jīng)經(jīng)過(guò),詳細(xì)的勘探,構(gòu)造問(wèn)題基本解決之后,勘探網(wǎng)度優(yōu)化主要的問(wèn)題就是煤層的穩(wěn)定性。當(dāng)一個(gè)煤田有兩種或者是兩種以上的煤層穩(wěn)定結(jié)構(gòu)時(shí)、應(yīng)該按照儲(chǔ)量和厚度占有優(yōu)勢(shì)的那一個(gè)煤層類型選擇勘探網(wǎng)度的優(yōu)化。應(yīng)用地質(zhì)統(tǒng)計(jì)學(xué)的方法對(duì)露天的在勘探網(wǎng)度進(jìn)行優(yōu)化,主要要分為兩個(gè)步驟:其一是建立地質(zhì)變量的最佳理論變差函數(shù);其二是應(yīng)用地質(zhì)變量的估計(jì)方差評(píng)價(jià)勘探過(guò)程對(duì)礦床的控制程度。
四、結(jié)語(yǔ)
HuCY,HuLP.JChinIntegrMed.2009;7(1):7478.
ReceivedOctober9,2008;accptedDecember1,2008;publishedonlineJanuary15,2009.
Indexed/abstractedinandfulltextlinkoutatPubMed.JournaltitleinPubMed:ZhongXiYiJieHeXueBao.
Freefulltext(HTMLandPDF).
ForwardlinkingandreferencelinkingviaCrossRef.
DOI:10.3736/jcim20090112OpenAccess
Howtoidentifystatisticaldata
ChunyanHU,LiangpingHU
ConsultingCenterofBiomedicalStatistics,AcademyofMilitaryMedicalSciences,Beijing100850,China
Keywords:statistics;medicine;dataanalysis,statistical
統(tǒng)計(jì)資料是統(tǒng)計(jì)分析的對(duì)象,正確識(shí)別統(tǒng)計(jì)資料是合理運(yùn)用統(tǒng)計(jì)分析方法處理統(tǒng)計(jì)資料的首要前提;而科學(xué)完善的實(shí)驗(yàn)設(shè)計(jì)又是獲得準(zhǔn)確而又可靠統(tǒng)計(jì)資料的基本保證。
1何為統(tǒng)計(jì)資料
1.1數(shù)據(jù)不等于統(tǒng)計(jì)資料某研究者提交了如下內(nèi)容。請(qǐng)問(wèn):它們是否叫統(tǒng)計(jì)資料?
6.55.16.13.93.57.72.11.99.67.97.67.84.66.16.42.87.62.54.68.14.86.95.12.06.46.04.58.08.08.66.44.96.46.84.73.47.71.22.80.52.63.26.57.63.55.75.42.37.42.74.26.46.97.26.76.54.07.31.14.92.52.91.93.61.42.54.42.5
它們不叫統(tǒng)計(jì)資料,因?yàn)檫@些數(shù)據(jù)代表什么含義并不清楚,數(shù)據(jù)的單位是什么不清楚,能派什么用場(chǎng)也不清楚,它們只能叫68個(gè)數(shù)據(jù)而已。
1.2僅有度量衡單位的數(shù)據(jù)仍不能稱為統(tǒng)計(jì)資料假定前面給出的68個(gè)數(shù)據(jù)的單位是ng/ml,是否可稱其為統(tǒng)計(jì)資料呢?仍然不可以!因?yàn)檫€缺少數(shù)據(jù)的名稱,即數(shù)據(jù)的專業(yè)含義是什么,必須交代清楚,對(duì)其進(jìn)行分析和討論才能有的放矢,否則,只能是玩弄數(shù)字游戲。
1.3僅有變量名及其取值的數(shù)據(jù)仍不能稱為統(tǒng)計(jì)資料表1中有很多數(shù)據(jù),其中的每一列都能被稱為統(tǒng)計(jì)資料嗎?
有些似乎可以,有些則不可以。因?yàn)橛行┝袃H有變量名,其專業(yè)含義并不清楚,如“G”代表什么,其下方的“1”與“2”又分別代表什么,“X1”的含義可通過(guò)其下方的“男”、“女”得知其代表“性別”,但“X3~X13”的含義都不清楚,“X14”代表聯(lián)合用藥情況。
1.4有指標(biāo)名稱又有度量衡單位的數(shù)據(jù)是否一定就可稱為統(tǒng)計(jì)資料假定前面給出的68個(gè)數(shù)據(jù)所代表的指標(biāo)為神經(jīng)元特異性烯醇化酶(neuronspecificenolase,NSE)的含量,其單位是ng/ml,此時(shí),它們是否就能叫統(tǒng)計(jì)資料?若要求不高,基本上可以稱其為統(tǒng)計(jì)資料;若要求嚴(yán)格,還不能這樣稱呼。因?yàn)樗鼈儨y(cè)自什么樣的受試者并不清楚!比如有的測(cè)自正常人,有的測(cè)自不同疾病患者,甚至有的測(cè)自動(dòng)物。表1冠心病人與正常人多項(xiàng)指標(biāo)的觀測(cè)結(jié)果
1.5統(tǒng)計(jì)資料應(yīng)具備4個(gè)基本要素應(yīng)當(dāng)說(shuō),指標(biāo)(或變量)名稱、度量衡單位和具體取值是統(tǒng)計(jì)資料的3個(gè)基本要素。僅有這些基本要素可能還達(dá)不到特定的研究目的,也就是說(shuō),統(tǒng)計(jì)資料還應(yīng)包括實(shí)現(xiàn)特定研究目的所對(duì)應(yīng)的特定條件。比如說(shuō),前面給出的68個(gè)數(shù)據(jù)是某年從某地區(qū)18~60歲全部正常成年人中隨機(jī)抽取的68人血液NSE酶的具體數(shù)值,而且,在獲得這些數(shù)據(jù)時(shí),測(cè)定的時(shí)間、地點(diǎn)、方法、儀器設(shè)備和測(cè)定者等都相同。這樣條件下測(cè)得的NSE酶含量(ng/ml)所得的統(tǒng)計(jì)資料,運(yùn)用適當(dāng)?shù)慕y(tǒng)計(jì)分析方法,才可以推測(cè)該年該地區(qū)18~60歲全部正常成年人血中NSE酶含量的(1-α)100%容許區(qū)間(醫(yī)學(xué)上習(xí)慣稱為正常值范圍)和NSE酶含量總體平均值的(1-α)100%置信區(qū)間(也有人稱為可信區(qū)間)。概括起來(lái)說(shuō),統(tǒng)計(jì)資料應(yīng)具備4個(gè)要素:影響因素(測(cè)定條件)、有明確專業(yè)含義的指標(biāo)名稱、度量衡單位和具體取值。由此可見(jiàn),統(tǒng)計(jì)資料通常是復(fù)合型,一般至少含有2個(gè)變量,一個(gè)稱為影響因素,另一個(gè)稱為觀測(cè)指標(biāo)及其取值。前面舉的例子中,影響因素是受試者類型,僅測(cè)定了正常人,隱含的另一個(gè)水平是除這里定義的正常人以外的其他人,要使兩組人具有較好的可比性,與其可形成對(duì)照的是某年從某地區(qū)18~60歲全部非正常成年人中隨機(jī)抽取的68人。下面的表2中,若給X5~X11加上相應(yīng)的度量衡單位,就是一個(gè)比較正規(guī)且可達(dá)到一定研究目的的復(fù)合型統(tǒng)計(jì)資料。表2103例冠心病人與100例正常人多項(xiàng)指標(biāo)的觀測(cè)結(jié)果
2統(tǒng)計(jì)資料的分類
2.1定性與定量資料任何一個(gè)有一定實(shí)用價(jià)值的統(tǒng)計(jì)資料通常都是復(fù)合型統(tǒng)計(jì)資料,即至少有兩類性質(zhì)的資料,一類叫定性資料,另一類叫定量資料。通常影響因素是定性資料,而觀測(cè)結(jié)果是定量資料,但有時(shí)影響因素和觀測(cè)結(jié)果都可包含定性與定量?jī)深愘Y料。
2.2資料類型的兩種劃分方法資料類型的劃分方法有傳統(tǒng)與現(xiàn)代兩種?,F(xiàn)將這兩種劃分方法作一扼要介紹,并對(duì)其加以比較。
2.2.1資料類型的傳統(tǒng)劃分方法資料類型的傳統(tǒng)劃分方法是將資料分為計(jì)量資料、計(jì)數(shù)資料和等級(jí)資料3類。其定義如下。
計(jì)量資料:測(cè)定每個(gè)觀察單位某項(xiàng)指標(biāo)量的大小,所得的資料稱為計(jì)量資料。例如測(cè)得正常成年男子身高(cm)、體質(zhì)量(kg)、血紅蛋白(g/L)和總鐵結(jié)合力(μmol/L)等所得的資料。
計(jì)數(shù)資料:將觀測(cè)單位按某種屬性或類別分組計(jì)數(shù),得到各組觀察單位數(shù)稱為計(jì)數(shù)資料。例如某單位全體員工按ABO血型系統(tǒng)劃分所得A型、B型、AB型、O型血的人數(shù)分別為1598、2032、641、1823人;又例如某小學(xué)1年級(jí)至6年級(jí)的學(xué)生人數(shù)分別為90、100、86、95、112、96人。
等級(jí)資料:將觀測(cè)單位按某種屬性的不同程度分組計(jì)數(shù),得到各組觀察單位數(shù)稱為等級(jí)資料或半定量資料或有序資料。例如用某種治療方法醫(yī)治100名某病患者,最后清點(diǎn)治愈、顯效、好轉(zhuǎn)、無(wú)效和死亡的人數(shù)分別為10、30、40、15和5人;又例如某醫(yī)院檢測(cè)1029例患者,其中眼晶狀體混濁程度為+、++、+++的分別有494、296、239人。
2.2.2資料類型的現(xiàn)代劃分方法資料類型的現(xiàn)代劃分方法是將資料先粗分為定量資料和定性資料兩大類,然后,再將定量資料劃分為計(jì)量資料和計(jì)數(shù)資料兩小類;將定性資料劃分為名義資料和有序資料兩小類。其定義如下。
定量資料:測(cè)定每個(gè)觀察單位某項(xiàng)指標(biāo)量的大小,所得的資料稱為定量資料。
計(jì)量資料:指標(biāo)的取值可以帶度量衡單位,甚至可以帶小數(shù)(標(biāo)志測(cè)量的精度)的定量資料,就叫計(jì)量資料。例如測(cè)得正常成年男子身高(cm)、體質(zhì)量(kg)、血紅蛋白(g/L)和總鐵結(jié)合力(μmol/L)等所得的資料,它們首先是定量資料,進(jìn)一步細(xì)分,它們還是計(jì)量資料。
計(jì)數(shù)資料:在定量資料中,若指標(biāo)的取值可以帶度量衡單位,但不可以帶小數(shù)(只能取整數(shù),通常為正整數(shù))的定量資料,就叫計(jì)數(shù)資料。例如測(cè)得正常成年男子脈搏數(shù)(次/min)和引體向上的次數(shù)(次/min)。
定性資料:觀測(cè)每個(gè)觀察單位某項(xiàng)指標(biāo)質(zhì)的狀況,所得的資料稱為定性資料。
名義資料:在定性資料中,若指標(biāo)質(zhì)的不同狀況之間在本質(zhì)上無(wú)數(shù)量大小或質(zhì)量好壞之分或先后順序之分的定性資料,就叫名義資料。例如某單位全體員工按ABO血型系統(tǒng)(A型、B型、AB型、O型)來(lái)記錄每個(gè)人的情況所得的資料;又例如某市全體員工按職業(yè)(工人、農(nóng)民、知識(shí)分子、軍人……)來(lái)記錄每個(gè)人的情況所得的資料。
有序資料:指標(biāo)質(zhì)的不同狀況(狀態(tài)個(gè)數(shù)≥3)之間在本質(zhì)上有數(shù)量大小或質(zhì)量好壞或有先后順序之分的定性資料,就叫有序資料。例如某病患者按治療后的療效(治愈、顯效、好轉(zhuǎn)、無(wú)效、死亡)來(lái)劃分所得的資料;又例如矽肺病患者按肺門(mén)密度級(jí)別(+、++、++
+)來(lái)劃分所得的資料。
若用一張表將資料類型的現(xiàn)代劃分方法表示出來(lái),則一目了然。見(jiàn)表3。表3統(tǒng)計(jì)資料類型的現(xiàn)代劃分方法
2.2.3資料類型兩種劃分方法的比較資料類型的傳統(tǒng)劃分方法是從資料的收集方式角度來(lái)定義,也可以說(shuō)是就“形式”而言;而資料類型的現(xiàn)代劃分方法是從資料的性質(zhì)角度來(lái)定義,也可以說(shuō)是就“本質(zhì)”而言。
事實(shí)上,當(dāng)人們看到一個(gè)記號(hào)“1”時(shí),人們無(wú)法知道這個(gè)“1”究竟代表的是什么含義。因?yàn)樗梢源?個(gè)人的年齡為1天或1個(gè)月或1歲,可以代表某定量指標(biāo)的一個(gè)具體取值,也可以代表某組個(gè)體中具有某種陽(yáng)性反應(yīng)的人數(shù)是1人(頻數(shù)為1),還可以代表受試者的一個(gè)特定性別(如用“1”代表男性,用“0”代表女性)。這說(shuō)明僅從事物的表面看問(wèn)題,很難準(zhǔn)確地獲知事物的本質(zhì)特征。要想準(zhǔn)確地揭示統(tǒng)計(jì)資料的性質(zhì),只需給出資料所對(duì)應(yīng)的指標(biāo)名稱(變量名,通常隱含專業(yè)意義,若含義不明,應(yīng)明確給出)和具體取值,而不必將調(diào)查對(duì)象分組后數(shù)出各組的調(diào)查單位數(shù)。例如在表3的前4行中,任何一行的任何一個(gè)數(shù)據(jù)或符號(hào)都應(yīng)叫做其表頭上相應(yīng)指標(biāo)的具體取值,“25”是“年齡X1”的一個(gè)具體取值,“農(nóng)民”是“職業(yè)X4”的一個(gè)具體取值,同理,“+”是“尿糖X7”的一個(gè)具體取值。對(duì)于資料類型的現(xiàn)代劃分方法而言,可以說(shuō)出表3中任何一列的資料類型;而對(duì)于資料類型的傳統(tǒng)劃分方法而言,就不便說(shuō)出表3中后4列的資料類型,它需要先分組,然后,用每個(gè)指標(biāo)的所有不同標(biāo)志及其對(duì)應(yīng)組內(nèi)的個(gè)體數(shù)兩部分結(jié)合在一起,才叫計(jì)數(shù)資料或等級(jí)資料。而在多變量回歸分析中,需要直接利用后4列資料,此時(shí),資料類型的傳統(tǒng)劃分方法就顯得“心有余而力不足”了。
3誤判資料類型的案例
例1原文題目:美泰寧對(duì)睡眠作用的影響。原作者研究美泰寧對(duì)戊巴比妥鈉誘導(dǎo)的小鼠睡眠的影響,選用40只體質(zhì)量相近的雄性小鼠,隨機(jī)分為溶劑對(duì)照組和3個(gè)劑量組,根據(jù)0、12.5、25.0和75.0mg/kg體質(zhì)量,用蒸餾水配成所需濃度,每天灌胃。第7天灌胃15min后,各組動(dòng)物按28mg/kg體質(zhì)量腹腔注射戊巴比妥鈉,以小鼠翻正反射消失達(dá)1min以上作為入睡判斷標(biāo)準(zhǔn),觀察腹腔注射戊巴比妥鈉25min內(nèi)各組動(dòng)物發(fā)生睡眠的動(dòng)物數(shù)。經(jīng)統(tǒng)計(jì)學(xué)處理,中、高劑量組與溶劑對(duì)照組比較,差異有統(tǒng)計(jì)學(xué)意義(P<0.01)。見(jiàn)表4。表4美泰寧對(duì)閾下劑量戊巴比妥鈉誘導(dǎo)雄性小鼠睡眠發(fā)生率的影響
對(duì)差錯(cuò)的辨析與釋疑統(tǒng)計(jì)資料常常分為定量資料和定性資料兩大類,所謂定量資料是指每個(gè)觀察單位用計(jì)量方法測(cè)量某項(xiàng)指標(biāo)數(shù)值大?。欢ㄐ再Y料是指記錄每個(gè)觀察單位的某一方面的特征和性質(zhì)。本資料觀察的是動(dòng)物的入睡情況,原作者把每組入睡的每只動(dòng)物記為1,不睡的動(dòng)物記為0,這樣第一組有2個(gè)1,8個(gè)0,第2組有5個(gè)1,5個(gè)0,第1組和第2組各10個(gè)數(shù)據(jù)進(jìn)行t檢驗(yàn),得t=1.406,P<0.05(經(jīng)驗(yàn)算,就計(jì)算本身而言,原作者的計(jì)算結(jié)果是正確的)。但實(shí)際上這里的1并不代表真正的數(shù)值,它只是代表一種狀態(tài),即入睡,而0則代表沒(méi)有入睡,因而本資料從性質(zhì)上說(shuō)應(yīng)屬于定性資料。但原作者卻錯(cuò)誤地將其判斷為定量資料,表的標(biāo)題后括號(hào)內(nèi)寫(xiě)了x±s的形式,但實(shí)際上表中并沒(méi)有表示平均數(shù)和標(biāo)準(zhǔn)差的數(shù)據(jù),反而誤導(dǎo)讀者該資料為定量資料。一般來(lái)說(shuō),t檢驗(yàn)僅適于分析定量資料,用分析定量資料的方法去分析定性資料顯然是錯(cuò)誤的。
正確判定統(tǒng)計(jì)資料屬于定量資料還是定性資料是選用統(tǒng)計(jì)分析方法的首要前提。本資料屬于定性資料,應(yīng)根據(jù)分析目的,合理選用適合此類資料的分析方法如Fisher精確檢驗(yàn)進(jìn)行統(tǒng)計(jì)分析。
例2原文題目:小兒皮膚血管瘤雌、孕激素受體的研究。原作者意在探討雌激素受體(estrogenreceptor,ER)和孕激素受體(progesteronereceptor,PR)在血管瘤發(fā)生、發(fā)展中的意義。采用免疫組化方法對(duì)毛細(xì)血管瘤、混合型血管瘤、海綿狀血管瘤、淋巴管瘤及正常皮膚組織的ER和PR進(jìn)行檢測(cè)。全部標(biāo)本經(jīng)10%福爾馬林固定,常規(guī)石蠟包埋。每例選一典型蠟塊,4~6μm切片,進(jìn)行免疫組化染色,高倍鏡下每例腫瘤區(qū)內(nèi)計(jì)數(shù)500個(gè)細(xì)胞,計(jì)數(shù)ER和PR陽(yáng)性細(xì)胞百分率,統(tǒng)計(jì)方法用χ2檢驗(yàn)。結(jié)果見(jiàn)表5。表5血管瘤和淋巴管瘤中ER和PR檢測(cè)結(jié)果
對(duì)差錯(cuò)的辨析與釋疑正確判別統(tǒng)計(jì)資料的設(shè)計(jì)類型是合理選擇統(tǒng)計(jì)分析方法的重要前提。根據(jù)統(tǒng)計(jì)指標(biāo)的性質(zhì),統(tǒng)計(jì)資料一般分為定量資料和定性資料兩大類。所謂定量資料,是指每個(gè)觀察單位(針對(duì)此資料,其觀察單位是病例標(biāo)本)測(cè)得的指標(biāo)是用具體的數(shù)值表示,其又細(xì)分為計(jì)量資料和計(jì)數(shù)資料;所謂定性資料,是指每個(gè)觀察單位測(cè)得的指標(biāo)僅反映某一方面的性質(zhì),并不能用具體的數(shù)值表示,其又細(xì)分為名義資料和有序資料。對(duì)于本資料來(lái)說(shuō),測(cè)量細(xì)胞的結(jié)果是“陽(yáng)性”或“陰性”,且一般認(rèn)為帶有“率”的資料就是定性資料,似應(yīng)判為定性資料。然而問(wèn)題的關(guān)鍵在于,原作者的觀察單位并不是細(xì)胞本身,而是每一個(gè)病例標(biāo)本。原作者關(guān)心的是4種疾病病例標(biāo)本和一組正常人標(biāo)本的ER和PR陽(yáng)性細(xì)胞率之均值是否相同,從每一個(gè)病例標(biāo)本中得到的是ER和PR陽(yáng)性細(xì)胞率,是一具體的數(shù)值,因而應(yīng)屬于定量資料。如果僅從資料的表面現(xiàn)象(有“率”)進(jìn)行判斷,而不考慮每一個(gè)數(shù)值的實(shí)際含義,沒(méi)有從資料的本質(zhì)上進(jìn)行判斷,很容易判斷錯(cuò)誤。
本資料的受試對(duì)象為病例標(biāo)本,測(cè)量指標(biāo)為“陽(yáng)性細(xì)胞百分率”,因而應(yīng)為定量資料,其涉及一個(gè)實(shí)驗(yàn)因素,即樣品類別,有5個(gè)水平,即毛細(xì)血管瘤、混合型血管瘤、海綿狀血管瘤、淋巴管瘤和正常皮膚。對(duì)于百分率的定量指標(biāo),一般根據(jù)經(jīng)驗(yàn),宜做平方根反正弦變換,使資料檢驗(yàn)滿足正態(tài)性和方差齊性的前提條件后,按單因素五水平設(shè)計(jì)資料進(jìn)行方差分析,如變量變換后仍不滿足前提條件,則用非參數(shù)檢驗(yàn)。
例3有人對(duì)103例冠心病患者(G=1)和100例正常對(duì)照者(G=2)進(jìn)行了多項(xiàng)指標(biāo)的觀測(cè),資料見(jiàn)表2。若以X5~X11為定量的結(jié)果變量,分別以“組別、性別、年齡、高血壓史、吸煙史、基因型”為影響因素,有人說(shuō)此表中的資料類型為定性資料,也有人認(rèn)為是定量資料。請(qǐng)問(wèn):此表中的統(tǒng)計(jì)資料究竟是什么資料[1]。
對(duì)差錯(cuò)的辨析與釋疑將此表中的資料說(shuō)成是定性資料或定量資料都不對(duì),因?yàn)榇吮碇杏泻芏嗔?,各列資料的性質(zhì)不盡相同。若籠統(tǒng)地說(shuō),此表中的資料為混合型統(tǒng)計(jì)資料;具體地說(shuō),應(yīng)根據(jù)各列變量、取值及其專業(yè)含義,區(qū)別對(duì)待。
第1列“編號(hào)”不屬于統(tǒng)計(jì)資料,僅起一個(gè)標(biāo)識(shí)作用,若一定要問(wèn)該變量的性質(zhì)是什么,可叫它為“多值有序變量”。
第2列“組別(區(qū)分正常人和冠心病病人)”、第3列“性別”、第5列“是否有高血壓史”和第6列“是否抽煙”都是定性資料,其變量性質(zhì)應(yīng)叫做“二值名義變量”。
第7列~第13列都是“血脂指標(biāo)”,它們都是定量資料,具體應(yīng)叫做計(jì)量資料。
第14列和第15列分別是兩種“基因型”(通常有3種表現(xiàn):-/-、-/+、+/+),它們都是定性資料,其變量性質(zhì)應(yīng)叫做“三值名義變量”。
第16列是“服藥情況”,其變量性質(zhì)應(yīng)叫做“多值名義變量”。
4小結(jié)
本文從正反兩個(gè)方面介紹了什么是統(tǒng)計(jì)資料、統(tǒng)計(jì)資料的分類以及統(tǒng)計(jì)資料識(shí)別中常犯的錯(cuò)誤。按現(xiàn)代劃分方法來(lái)命名統(tǒng)計(jì)資料,有利于抓住問(wèn)題的實(shí)質(zhì)。科研設(shè)計(jì)的質(zhì)量好壞和實(shí)施過(guò)程中的質(zhì)量控制水平
的高低決定了所收集的統(tǒng)計(jì)資料是否準(zhǔn)確、可靠;而正確識(shí)別各種研究問(wèn)題中的統(tǒng)計(jì)資料類型,則是合理選用統(tǒng)計(jì)分析方法處理統(tǒng)計(jì)資料的關(guān)鍵環(huán)節(jié)。這是所有希望靠數(shù)據(jù)來(lái)說(shuō)話的科研工作者不可小視的一個(gè)大問(wèn)題!
1χ2檢驗(yàn)的常見(jiàn)誤用
1.1誤用χ2檢驗(yàn)替代秩和檢驗(yàn)例1稿件題目《皖北礦區(qū)嬰幼兒氣質(zhì)特點(diǎn)調(diào)查分析》,表1為作者調(diào)查不同性別嬰幼兒氣質(zhì)類型分布比較的原表。
該例作者將不同性別的嬰幼兒氣質(zhì)分為易養(yǎng)型、中間偏易養(yǎng)型、中間偏難養(yǎng)型、難養(yǎng)型、發(fā)動(dòng)緩慢型,這5種類型實(shí)質(zhì)上是一個(gè)等級(jí)分類,從易養(yǎng)型到難養(yǎng)型,再到發(fā)動(dòng)緩慢型,是結(jié)果變量(氣質(zhì)類型)為有序變量的單向有序列聯(lián)表資料。要觀察此2組分布的差異,不能使用χ2檢驗(yàn),應(yīng)使用成組設(shè)計(jì)兩樣本比較的秩和檢驗(yàn)(Wilcoxon兩樣本比較法),得uc=1.05,P>0.05。但是,有學(xué)者會(huì)認(rèn)為作者使用的方法雖然不恰當(dāng),但是結(jié)果都是一樣的,不必小題大做。實(shí)際上2×C列聯(lián)表的χ2檢驗(yàn),與結(jié)果變量的是否有序沒(méi)有關(guān)系,用χ2檢驗(yàn)分析得出的結(jié)果是男女不同氣質(zhì)類型的頻數(shù)是否相同,而得不出男女不同氣質(zhì)類型的差異是否有統(tǒng)計(jì)學(xué)意義的結(jié)論。
例2稿件題目《無(wú)創(chuàng)機(jī)械通氣聯(lián)合硝普鈉治療急性心源性肺水腫》,作者分別采用無(wú)創(chuàng)機(jī)械通氣聯(lián)合硝普鈉(A組)、單純硝普鈉治療(B組)和常規(guī)治療(C組)急性心源性肺水腫患者,并統(tǒng)計(jì)分析3組的治療效果,見(jiàn)表2。由于例2是多組單向有序資料的分析,應(yīng)采用成組設(shè)計(jì)多個(gè)樣本比較的秩和檢驗(yàn)(Kruskal-Wallis法),得Hc=6.50,P<0.05,3組療效差異有統(tǒng)計(jì)學(xué)意義。
1.2誤用χ2檢驗(yàn)替代四格表確切概率法例3作者觀察白細(xì)胞介素-6(IL-6)在正常卵巢組織和卵巢癌組織中的表達(dá)情況,見(jiàn)表3。當(dāng)四格表最小理論頻數(shù)<1或n<40,宜用四格表確切概率法分析;由于本例n=30,故不能采用一般四格表χ2檢驗(yàn),應(yīng)使用四格表確切概率法分析,得P=0.000。
1.3誤用χ2檢驗(yàn)替代配對(duì)χ2檢驗(yàn)例4稿件題目《超聲彈性成像及陰道超聲檢查在子宮頸占位性病變?cè)\斷中的對(duì)比研究》,其中一項(xiàng)觀察是作者應(yīng)用陰道超聲聯(lián)合縱、橫切面彈性成像診斷子宮頸占位性病變,并與病理學(xué)診斷比較得出表4結(jié)果。
作者在作統(tǒng)計(jì)學(xué)分析時(shí)采用一般四格表資料χ2檢驗(yàn)進(jìn)行分析,得出差異均有統(tǒng)計(jì)學(xué)意義,說(shuō)明陰道超聲聯(lián)合彈性成像診斷的假陽(yáng)性率高。正確統(tǒng)計(jì)學(xué)方法是采用配對(duì)四格表χ2檢驗(yàn)分析,要注意是:當(dāng)b+c<40時(shí)用校正配對(duì)χ2檢驗(yàn),正如表5,得出差異均無(wú)統(tǒng)計(jì)學(xué)意義,說(shuō)明陰道超聲聯(lián)合彈性成像診斷與病理診斷一致。
1.4誤用χ2檢驗(yàn)處理相關(guān)性分析
例5作者為觀察凋亡抑制基因Livin及PTEN在卵巢上皮性癌組織中表達(dá)的相關(guān)性,作了表6統(tǒng)計(jì)學(xué)分析,得出卵巢上皮性癌組織中Livin與PTEN表達(dá)無(wú)相關(guān)性。作者誤用χ2檢驗(yàn)分析雙向有序且屬性不同列聯(lián)表資料;而作者的意圖是分析2種基因的蛋白表達(dá)是否有相關(guān)關(guān)系,所以應(yīng)用Spearman等級(jí)相關(guān)分析,得r''''s=-0.336,P<0.01,卵巢上皮性癌組織中Livin與PTEN的表達(dá)呈負(fù)相關(guān)關(guān)系的結(jié)論。
2t檢驗(yàn)的常見(jiàn)誤用
2.1誤用兩兩t檢驗(yàn)替代方差分析和q檢驗(yàn)
例6《缺血性腦血管病患者同型半胱氨酸和基質(zhì)金屬蛋白酶-9與頸動(dòng)脈粥樣硬化的關(guān)系》一文,作者分別觀察比較了正常對(duì)照組和缺血性腦血管病患者有斑塊組及無(wú)斑塊組的同型半胱氨酸(Hcy)和基質(zhì)金屬蛋白酶-9(MMP-9)水平,原稿統(tǒng)計(jì)學(xué)方法中采用兩兩t檢驗(yàn),見(jiàn)表7。
該例研究實(shí)際上是檢驗(yàn)3個(gè)相互獨(dú)立樣本均數(shù)差異有無(wú)統(tǒng)計(jì)學(xué)意義,屬于單因素方差分析;而t檢驗(yàn)只能用于2個(gè)成組樣本均數(shù)差異有無(wú)統(tǒng)計(jì)學(xué)意義的檢驗(yàn),故應(yīng)采用單因素方差分析進(jìn)行檢驗(yàn)。若差異有統(tǒng)計(jì)學(xué)意義,則可進(jìn)行多個(gè)樣本的兩兩比較,如q檢驗(yàn)等。本例若直接通過(guò)t檢驗(yàn)作兩兩比較,會(huì)增加犯第一類錯(cuò)誤的概率α,如本例犯第一類錯(cuò)誤的概率α為0.1426,比0.05大多了,所以應(yīng)在方差分析的基礎(chǔ)上進(jìn)行q檢驗(yàn),改正后見(jiàn)表8,還要有標(biāo)記標(biāo)注各組間差異有無(wú)統(tǒng)計(jì)學(xué)意義。
2.2誤用t檢驗(yàn)替代配對(duì)t檢驗(yàn)例7稿件題目《單束重建聯(lián)合脛骨嵌入重建后交叉韌帶》,作者采用Lysholm膝關(guān)節(jié)功能評(píng)分評(píng)定手術(shù)前后的膝關(guān)節(jié)功能,見(jiàn)表9。
本例作者采用自身對(duì)照研究,比較治療前后變化觀察療效,而錯(cuò)誤地采用隨機(jī)t檢驗(yàn)進(jìn)行統(tǒng)計(jì)學(xué)處理。隨機(jī)t檢驗(yàn)的應(yīng)用是完全隨機(jī)設(shè)計(jì)的計(jì)量資料,是研究者觀察2樣本x±s差異有無(wú)統(tǒng)計(jì)學(xué)意義。配對(duì)t檢驗(yàn)是適用于配對(duì)設(shè)計(jì)的計(jì)量資料,包括自身對(duì)照和配對(duì)對(duì)照研究。由于配對(duì)t檢驗(yàn)最大程度地減少了個(gè)體變異對(duì)處理間變異的可能影響,用較少樣本可得較多的信息,提高了檢驗(yàn)效能;但其數(shù)據(jù)處理主要是研究者對(duì)觀察對(duì)象處理前后觀察指標(biāo)的差值平均數(shù)和差值標(biāo)準(zhǔn)差的處理。正確處理見(jiàn)表10。例8《醒腦靜治療急性腦出血的臨床觀察》一文,作者分對(duì)照組和治療組分別采用常規(guī)治療和常規(guī)治療基礎(chǔ)上加用醒腦靜治療,于治療14天后評(píng)價(jià)2組的臨床神經(jīng)功能缺損程度評(píng)分。作者在同組和組間治療前后比較中均采用了成組設(shè)計(jì)定量資料的t檢驗(yàn),見(jiàn)表11。
從臨床應(yīng)用角度來(lái)講,該例中的對(duì)照組為臨床常用的有效治療方案,而作者研究的目的是觀察2組治療后的療效誰(shuí)更好。本例作者對(duì)組內(nèi)治療前后指標(biāo)變化比較直接采用原始數(shù)據(jù)計(jì)算各自x±s,并作成組比較的t檢驗(yàn)分析,此時(shí)擴(kuò)大了樣本例數(shù),如治療組由80例擴(kuò)大到160例,易得出假陽(yáng)性結(jié)果;另外,表11對(duì)2組治療后x±s作成組t檢驗(yàn)只能反映治療組治療后的水平較對(duì)照組治療后低,并未能真實(shí)反映療效,因?yàn)?組治療前的基本數(shù)據(jù)不完全一樣。欲真實(shí)反映療效需作2步分析:第一,每組作治療前后的自身對(duì)照分析,評(píng)價(jià)每組治療是否有效,此時(shí)各組樣本數(shù)仍各為80例;第二,在2組自身對(duì)照差異均有統(tǒng)計(jì)學(xué)意義的情況下,欲知道治療組的效果是否真正優(yōu)于對(duì)照組,需比較2組的d±sd差異是否有統(tǒng)計(jì)學(xué)意義。通過(guò)計(jì)算得出2組治療均有效,但治療組效果更好于對(duì)照組,見(jiàn)表12。
關(guān)鍵詞:商品房銷售單價(jià)增長(zhǎng)率;單因素方差;顯著差異性分析
中圖分類號(hào):F126 文獻(xiàn)識(shí)別碼:A 文章編號(hào):1001-828X(2017)009-0-02
一、引言
伴隨我國(guó)宏觀經(jīng)濟(jì)的高速增長(zhǎng)和持續(xù)發(fā)展,尤其是城鄉(xiāng)一體化戰(zhàn)略的推進(jìn),房地產(chǎn)業(yè)迎來(lái)了復(fù)蘇和急劇發(fā)展的階段。作為國(guó)民經(jīng)濟(jì)的重要組成部分,房地產(chǎn)市場(chǎng)的發(fā)展對(duì)國(guó)家整體和居民個(gè)體都有很大的影響。當(dāng)前,全國(guó)房?jī)r(jià)呈現(xiàn)出普遍上漲的態(tài)勢(shì),各地調(diào)控政策的出臺(tái)、房市相關(guān)動(dòng)態(tài)時(shí)刻備受市民關(guān)注,住房市場(chǎng)的價(jià)格波動(dòng)已經(jīng)影響到居民的生活水平和民生問(wèn)題,而房?jī)r(jià)的增長(zhǎng)幅度成為市民最直接的關(guān)注點(diǎn)和落腳點(diǎn)。本文以廣西各地區(qū)2005-2015年度的房?jī)r(jià)為研究對(duì)象,用單因素方差模型對(duì)14地市各年度間房?jī)r(jià)增長(zhǎng)的差異進(jìn)行了分析。
二、基本思想和原理
方差分析是通過(guò)檢驗(yàn)各因子水平下總體均值是否相等來(lái)判斷分類型自變量對(duì)數(shù)值型因變量是否有顯著影響。其中,檢驗(yàn)的對(duì)象稱為因子,為分類型自變量;每個(gè)因子的不同樣本數(shù)據(jù)為觀測(cè)值,為數(shù)值型因變量。
分析步驟:
假設(shè)有k個(gè)自變量值,第i個(gè)自變量值下的樣本量為ni,第i個(gè)自變量值下的第j個(gè)樣本觀測(cè)值為xij;其中i=1,2,3,…,k,j=1,2,…,ni。
a.提出假設(shè)。假設(shè)各自變量值下的樣本均值相等:
不全相等
b.計(jì)算統(tǒng)計(jì)量。
每個(gè)自變量值下的樣本誤差平方和為只含隨機(jī)誤差誤差平方和,用SSE表示:
,其中為i組樣本均值 (1)
不同自變量值之間的樣本誤差平方和為組間誤差,既有隨機(jī)誤差又有系統(tǒng)誤差,用SSA表示:
,其中為所有樣本均值 (2)
所有樣本誤差為總體間誤差平方和為總平方和,用SST表示:
(3)
檢驗(yàn)統(tǒng)計(jì)量F:
(4)
c.統(tǒng)計(jì)決策。當(dāng),拒絕原假設(shè)H0,各自變量值下的樣本均值之間差異是顯著的,自變量對(duì)因變量有顯著影響。當(dāng),不能說(shuō)明各自變量值下的樣本均值之間差異是顯著的。
d.多重比^使用S-N-K比較法,將均值無(wú)差異的自變量值下的樣本歸于同一子集。
三、數(shù)據(jù)設(shè)計(jì)
本文數(shù)據(jù)來(lái)源于2004-2015年統(tǒng)計(jì)年鑒,選用廣西14個(gè)市的商品房數(shù)據(jù),包括商品房銷售額和商品房銷售面積。其中,銷售單價(jià)=商品房銷售額/商品房銷售面積,某年的銷售單價(jià)增長(zhǎng)率=該年銷售單價(jià)/上年銷售單價(jià)-1。當(dāng)中,賀州市和崇左市2004年的商品房信息缺失,河池市2015年的商品房銷售數(shù)據(jù)有誤,整理后的2005-2015年廣西各市商品房房?jī)r(jià)增長(zhǎng)率數(shù)據(jù)如下表1所示。
以2005―2015年11個(gè)年度為分類型自變量值,以14地市的商品房銷售單價(jià)增長(zhǎng)率為數(shù)值型因變量。利用單因素方差分析商品房銷售單價(jià)年度增長(zhǎng)率總體均值的差異,用S-N-K多重比較法對(duì)比每?jī)蓚€(gè)年度的均值差異。
四、結(jié)果分析
利用上述建立的單因素方差分析模型,利用SPSS22.0,導(dǎo)入數(shù)據(jù),設(shè)置顯著性水平為0.05。
首先,整體數(shù)據(jù)作Leven’s方差齊性檢驗(yàn),其結(jié)果如下表2。
表2中的檢驗(yàn),認(rèn)為各年度增長(zhǎng)率方差是相等的,滿足了進(jìn)行方差分析的條件。
接著,2005-2015年11個(gè)年度的商品房銷售單價(jià)增長(zhǎng)率方差分析表如下表3。
顯著性水平
表3中,商品房銷售單價(jià)增長(zhǎng)率統(tǒng)計(jì)量,且顯著P值明顯低于顯著性水平,說(shuō)明11年間廣西商品房銷售單價(jià)增長(zhǎng)率存在著顯著性差異。因此,需要進(jìn)行多重比較,將差異不顯著的幾年歸于一個(gè)集合。
2005-2015年11個(gè)年度的商品房銷售單價(jià)增長(zhǎng)率經(jīng)過(guò)S-N-K多重比較分析結(jié)果如下表4。
會(huì)顯示同質(zhì)子集中群組的平均值。
a.使用調(diào)和平均值樣本大小=13.697
b.群組大小不相等。將使用群組大小的調(diào)和平均值。不保證類型|錯(cuò)誤層級(jí)。
表4中,先根據(jù)年度商品房銷售單價(jià)增長(zhǎng)率的均值排序,根據(jù)兩兩間的均值差異性,分為兩大子集,即屬同一子集的年度間的商品房銷售單價(jià)增長(zhǎng)率均值無(wú)顯著差異,所屬不同子集的年度間的商品房銷售單價(jià)增長(zhǎng)率均值皆存在一定程度以上的差異。根據(jù)分析結(jié)果得出,2005年、2011年、2013年、2014年和2015年屬于集合1,這5個(gè)年度的廣西整體商品房銷售單價(jià)增長(zhǎng)率偏低;2006―2010年和2012年都屬于廣西整體商品房銷售單價(jià)增長(zhǎng)率偏高的年度。
從整體時(shí)間推進(jìn)上來(lái)看,從2006年開(kāi)始,廣西的商品房?jī)r(jià)格突然出現(xiàn)迅猛增長(zhǎng),主要因?yàn)榻?jīng)濟(jì)的快速發(fā)展刺激了住房消費(fèi),推動(dòng)了房?jī)r(jià)的快速上漲;2007至2010這四年間一直保持居高不下的增長(zhǎng)勢(shì)頭,這期間房地產(chǎn)投資持續(xù)加大,國(guó)家出臺(tái)支持改善性住房消費(fèi)的相關(guān)政策,推動(dòng)房地產(chǎn)經(jīng)濟(jì)迅速發(fā)展;在2011―2014年增長(zhǎng)逐緩,甚至到2015年出現(xiàn)了負(fù)增長(zhǎng),由于國(guó)家針對(duì)房地產(chǎn)市場(chǎng)投資過(guò)熱陸續(xù)房地產(chǎn)調(diào)控限購(gòu)、土地監(jiān)管、金融房貸等政策,抑制投機(jī)投資性購(gòu)房,從而使得商品房?jī)r(jià)格的增幅縮小。從整體發(fā)展趨勢(shì)來(lái)看,在未來(lái)兩年廣西的商品房?jī)r(jià)格仍將保持增長(zhǎng)的勢(shì)頭,但增速相對(duì)平緩,不會(huì)出現(xiàn)太大的波動(dòng)。
五、結(jié)語(yǔ)
總而言之,本文選用商品房銷售單價(jià)增長(zhǎng)率為變量,利用方差分析的方法和模型進(jìn)行分析和對(duì)比,說(shuō)明了廣西各地市在2005―2015年這11年間各年度商品房銷售單價(jià)增長(zhǎng)率均值存在顯著差異。針對(duì)其差異,具體說(shuō)明了廣西商品房銷售單價(jià)在時(shí)間軸上的變化趨勢(shì),并根據(jù)其趨勢(shì),對(duì)未來(lái)廣西的商品房?jī)r(jià)格走向情況作出判斷。若要對(duì)廣西房?jī)r(jià)未來(lái)的增長(zhǎng)趨勢(shì)作更準(zhǔn)確的預(yù)測(cè),可以結(jié)合各種具體影響因素如國(guó)家的宏觀調(diào)控政策等進(jìn)行具體分析。
參考文獻(xiàn):
[1]廣西壯族自治區(qū)統(tǒng)計(jì)局.廣西統(tǒng)計(jì)年鑒[M].北京:中國(guó)統(tǒng)計(jì)出版社,2016.
[2]賈俊平,何曉群,金勇進(jìn).統(tǒng)計(jì)學(xué)(第六版)[M].北京:中國(guó)人民大學(xué)出版社,2015.
[3]陳曉婷.宏觀因素對(duì)我國(guó)房?jī)r(jià)波動(dòng)的影響―基于VAR模型的實(shí)證研究[D].東北財(cái)經(jīng)大學(xué),2011.
[4]鄧維斌,唐興艷,胡大權(quán),周玉敏.統(tǒng)計(jì)分析實(shí)用教程SPSS(中文版)[M].北京:電子工業(yè)出版社,2012.
作者簡(jiǎn)介:高淑蘭(1988-),女,百色學(xué)院數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,主要從事應(yīng)用數(shù)學(xué)研究。
統(tǒng)計(jì)學(xué)處理
使用SPSS13.0完成統(tǒng)計(jì)分析,以家庭養(yǎng)育環(huán)境因素為自變量,氣質(zhì)維度為因變量進(jìn)行多因素線性回歸分析(后退法),P<0.05為差異有統(tǒng)計(jì)學(xué)意義。結(jié)果1.?huà)胗變夯緺顩r本次調(diào)查以中國(guó)疾病預(yù)防控制中心婦幼保健中心課題為樣本,共207例產(chǎn)婦及其嬰幼兒納入,剔除調(diào)查資料不全者,共收回氣質(zhì)問(wèn)卷112份(有效應(yīng)答率為54.11%)。
嬰幼兒氣質(zhì)類型分析
112例母乳喂養(yǎng)兒童中平易型68例(60.7%),中間偏易型32例(28.6%),中間偏煩型2例(1.8%),麻煩型3例(2.7%),發(fā)動(dòng)緩慢型7例(6.3%)。其中男童中平易型46例(40.1%),中間偏易型11例(9.8%),中間偏煩型2例(1.8%),麻煩型2例(1.8%),發(fā)動(dòng)緩慢型3例(2.7%)。女童中平易型22例(19.6%),中間偏易型21例(11.8%),中間偏煩型0例(0%),麻煩型1例(0.9%),發(fā)動(dòng)緩慢型4例(3.6%)。男女各氣質(zhì)類型的分布差異無(wú)統(tǒng)計(jì)學(xué)意義(χ2=2.255,P=0.324)。
母乳喂養(yǎng)嬰幼兒氣質(zhì)維度的多元線性回歸
多元線性回歸結(jié)果顯示,母親文化、家庭結(jié)構(gòu)、家庭月收入與氣質(zhì)中4個(gè)因子(活動(dòng)水平、趨避性、注意分散、反應(yīng)閾)有關(guān)。性別與氣質(zhì)中4個(gè)因子(節(jié)律性、趨避性、心境、持久性)有關(guān)(表1)。
嬰幼兒氣質(zhì)類型的分布情況
本研究顯示,母乳喂養(yǎng)的嬰幼兒中平易型68例(60.7%),中間偏易型32例(28.6%),中間偏煩型2例(1.8%),麻煩型3例(2.7%),發(fā)動(dòng)緩慢型7例(6.3%)。母乳喂養(yǎng)嬰幼兒氣質(zhì)類型分布以平易型為主,其次為中間偏易型、中間偏煩型、麻煩型,發(fā)動(dòng)緩慢型最少。與朱雪娜等[2]的報(bào)道相比,母乳喂養(yǎng)嬰幼兒中平易型和中間偏易型比例較大。王衛(wèi)芳[3]研究中,平易型占39.94%,母乳喂養(yǎng)嬰幼兒中平易型比例較大。
男女氣質(zhì)類型分布無(wú)統(tǒng)計(jì)學(xué)差異,與以往的研究一致。平易型和中間偏易型占大多數(shù),與國(guó)內(nèi)資料報(bào)道的4-8個(gè)月、3-7歲兒童氣質(zhì)分布的報(bào)道一致。說(shuō)明氣質(zhì)是先天性較為穩(wěn)定的心理特征,不同年齡段,氣質(zhì)類型分布基本一致。
母乳喂養(yǎng)嬰幼兒氣質(zhì)維度的特點(diǎn)
在本研究中,母乳喂養(yǎng)嬰幼兒平易型68例(60.7%),中間偏易型32例(28.6%)。Thomas和Chess最早提出兒童氣質(zhì)對(duì)兒童心理行為發(fā)展可能緊密相關(guān)。他們?cè)诤芏嗟难芯恐邪l(fā)現(xiàn)易養(yǎng)型或中間偏易型:以生物功能節(jié)律性強(qiáng),容易接受新事物,情緒多為積極,反應(yīng)強(qiáng)度中等或較低,適應(yīng)快為特點(diǎn)。有研究發(fā)現(xiàn)母乳喂養(yǎng)對(duì)兒童氣質(zhì)發(fā)育有積極的影響,如母乳喂養(yǎng)兒比人工喂養(yǎng)兒情緒更穩(wěn)定,社交更敏感,焦慮、煩躁、睡眠障礙等問(wèn)題的發(fā)生率明顯降低。母乳喂養(yǎng)中母嬰之間關(guān)系更融洽,母親關(guān)注嬰兒更多,因此適時(shí)作出調(diào)整以適應(yīng)嬰兒規(guī)律,嬰兒在這種愉快的環(huán)境中成長(zhǎng),表現(xiàn)為交往積極、情緒穩(wěn)定。
Quinonez等[4]對(duì)56例18個(gè)月的兒童進(jìn)行EAS氣質(zhì)測(cè)定和ECC(EarlyChildCare)評(píng)定,經(jīng)多因素回歸分析顯示氣質(zhì)中4個(gè)因子(情緒狀態(tài)、生物活動(dòng)節(jié)律、社交反應(yīng)性、內(nèi)向性)與喂養(yǎng)方式無(wú)關(guān)。研究結(jié)論如此迥異,可能與研究樣本量的大小、方法不一和各種混雜因素的影響有關(guān)。
母乳喂養(yǎng)嬰幼兒氣質(zhì)的多元線性回歸結(jié)果
1對(duì)象與方法
1.1臨床資料
選擇2008年1月至2013年12月河南省腫瘤醫(yī)院收治的、行全子宮/廣泛子宮切除+雙附件切除+盆腔淋巴結(jié)清掃術(shù)的子宮內(nèi)膜癌患者共449例為研究對(duì)象?;颊吲R床資料完整,排除因高血壓、糖尿病、冠心病等嚴(yán)重合并癥未能接受手術(shù)者?;颊?4~83歲,中位年齡55.98歲;根據(jù)2009年國(guó)際婦產(chǎn)科聯(lián)盟(FIGO)手術(shù)病理分期標(biāo)準(zhǔn),Ⅰ期394例,Ⅱ期19例,Ⅲ期33例,Ⅳ期3例;子宮內(nèi)膜樣癌420例,漿液性狀癌8例,透明細(xì)胞癌2例,腺鱗癌16例,神經(jīng)內(nèi)分泌癌3例;組織學(xué)分級(jí)中高分化383例,低分化66例;浸潤(rùn)深度達(dá)深肌層99例,淺肌層350例;其中行腹主動(dòng)脈旁淋巴結(jié)清掃術(shù)158例。
1.2隨訪
對(duì)所有患者進(jìn)行電話或者門(mén)診隨訪,以2014年6月為隨訪截止時(shí)間,共隨訪6~81個(gè)月,中位隨訪期38個(gè)月。死亡為終點(diǎn)事件,由于各種原因失訪以及到觀察期終止依然存活的病例為刪失。
1.3統(tǒng)計(jì)學(xué)處理
采用SPSS17.0進(jìn)行統(tǒng)計(jì)學(xué)分析,盆腔和腹主動(dòng)脈旁淋巴結(jié)轉(zhuǎn)移影響因素的單因素分析采用χ2檢驗(yàn)或精確概率法,多因素分析采用logistic回歸分析;預(yù)后影響因素篩選采用COX回歸分析。檢驗(yàn)水準(zhǔn)α=0.05。
2結(jié)果
2.1子宮內(nèi)膜癌盆腔淋巴結(jié)轉(zhuǎn)移相關(guān)因素的分析
單因素分析見(jiàn)表1。以盆腔淋巴結(jié)轉(zhuǎn)移為因變量(陰性=0,陽(yáng)性=1),以組織學(xué)分級(jí)(中高分化=0,低分化=1)、病理學(xué)類型(子宮內(nèi)膜樣癌=0,非內(nèi)膜樣癌=1)、FIGO分期(Ⅰ、Ⅱ、Ⅲ、Ⅳ期分別賦值為0、1、2、3)和浸潤(rùn)深度(淺肌層=0,深肌層=1)為自變量,構(gòu)建logistic回歸模型,結(jié)果(表2)顯示,F(xiàn)I-GO分期、浸潤(rùn)深度是子宮內(nèi)膜癌盆腔淋巴結(jié)轉(zhuǎn)移的獨(dú)立危險(xiǎn)因素。
2.2子宮內(nèi)膜癌腹主動(dòng)脈旁淋巴結(jié)轉(zhuǎn)移相關(guān)因素的分析
單因素分析見(jiàn)表3。表3顯示,深肌層浸潤(rùn)、盆腔淋巴結(jié)轉(zhuǎn)移是腹主動(dòng)脈旁淋巴結(jié)轉(zhuǎn)移的影響因素。以腹主動(dòng)脈旁淋巴結(jié)轉(zhuǎn)移為因變量(陰性=0,陽(yáng)性=1),以FIGO分期(賦值同2.1)、浸潤(rùn)深度(賦值同2.1)、盆腔淋巴結(jié)轉(zhuǎn)移(陰性=0,陽(yáng)性=1)為自變量,構(gòu)建logistic回歸模型,結(jié)果(表4)未篩出有統(tǒng)計(jì)學(xué)意義的變量(P均>0.05)。
2.3子宮內(nèi)膜癌預(yù)后相關(guān)因素分析
137例失訪(30.5%),以生存時(shí)間和結(jié)局為因變量,分別以年齡(“<55.95歲”=0,“>55.95歲”=1)、組織學(xué)分級(jí)、病理學(xué)類型、FIGO分期、浸潤(rùn)深度(同2.1)、盆腔淋巴結(jié)轉(zhuǎn)移(賦值同2.2)、腹主動(dòng)脈旁淋巴結(jié)轉(zhuǎn)移(陰性=0,陽(yáng)性=1)、腹主動(dòng)脈旁淋巴結(jié)清掃(有=0,無(wú)=1)為自變量,構(gòu)建COX風(fēng)險(xiǎn)比例模型,結(jié)果(表5)顯示,病理學(xué)類型、FIGO分期、盆腔淋巴結(jié)轉(zhuǎn)移、腹主動(dòng)脈旁淋巴結(jié)轉(zhuǎn)移為子宮內(nèi)膜癌預(yù)后的獨(dú)立影響因素。
3討論