高校四級(jí)成績(jī)數(shù)據(jù)的重采樣方法研究

發(fā)布時(shí)間：2022-11-11 10:52:46

序言：寫作是分享個(gè)人見解和探索未知領(lǐng)域的橋梁，我們?yōu)槟x了1篇的高校四級(jí)成績(jī)數(shù)據(jù)的重采樣方法研究樣本，期待這些樣本能夠?yàn)槟峁┴S富的參考和啟發(fā)，請(qǐng)盡情閱讀。

0引言

大學(xué)英語等級(jí)考試一直以來都是高校學(xué)生參與度最高的全國(guó)性考試，其考試成績(jī)不僅反映了學(xué)生的英語學(xué)習(xí)能力，其證書也是高校畢業(yè)生求職應(yīng)聘中所必備的。評(píng)估高校各專業(yè)整體英語應(yīng)試水平，對(duì)于高校管理層在專業(yè)層面上提出相關(guān)英語教學(xué)改革措施極為重要。Bootstrap與Jackknife是抽樣調(diào)查中常用的重采樣方法，Jackknife是由Quenouille[1,2]（1949/1956）作為減少系列相關(guān)系數(shù)估計(jì)量偏倚的一種方法提出的，后來逐漸成為復(fù)雜樣本方差估計(jì)的一種重要方法。Bootstrap是由B.Efron[3](1979)在Jackknife的基礎(chǔ)上提出的一種利用重抽樣方法對(duì)總體參數(shù)進(jìn)行估計(jì)的統(tǒng)計(jì)方法。呂萍[4]（2017）指出在數(shù)據(jù)分析中,若忽視層、群等抽樣設(shè)計(jì)的復(fù)雜性,直接利用調(diào)查數(shù)據(jù)按照傳統(tǒng)數(shù)據(jù)分析方法,容易得出錯(cuò)誤的結(jié)論,尤其是涉及標(biāo)準(zhǔn)誤的估計(jì)。Bootstrap方法的優(yōu)勢(shì)在于對(duì)小樣本進(jìn)行評(píng)估時(shí),可極大地降低評(píng)估樣本不足對(duì)評(píng)估結(jié)果的影響[5]。該方法也在估計(jì)中存在些許不足，主要體現(xiàn)在重抽樣都是在已知的樣本觀測(cè)數(shù)據(jù)中進(jìn)行的，這使得自主樣本與原樣本的相似度較高，并且樣本量越小，其相似度就越高，估計(jì)結(jié)果與真實(shí)分布的差異性也會(huì)越大[6]。Jackknife方法在方差分量估計(jì)和標(biāo)準(zhǔn)誤估計(jì)上都較為準(zhǔn)確，且其估計(jì)的準(zhǔn)確性不隨數(shù)據(jù)類型、研究設(shè)計(jì)和方差分量的不同而產(chǎn)生波動(dòng)，具有較強(qiáng)的穩(wěn)健性[7]。Jackknife方法不足之處主要體現(xiàn)在：估計(jì)總體統(tǒng)計(jì)量時(shí)只利用了很少的信息，各采樣樣本之間的差異很小，每?jī)蓚€(gè)Jackknife樣本中只有兩個(gè)單一的觀測(cè)值不同。本文在估計(jì)總體樣本均值的過程中，考慮到Jackknife算法與Bootstrap算法存在的不足，提出Bootstrap-Jackknife算法，得到了更接近于總體樣本均值的估計(jì)值。

1數(shù)據(jù)與估計(jì)方法

1.1數(shù)據(jù)來源與處理

本文采集廣州華商學(xué)院各專業(yè)學(xué)生在2017學(xué)年的四級(jí)成績(jī)數(shù)據(jù)，共計(jì)9860條有效數(shù)據(jù)，并對(duì)收集的數(shù)據(jù)進(jìn)行對(duì)數(shù)化處理，數(shù)據(jù)對(duì)數(shù)化可以使得樣本數(shù)據(jù)更加光滑，消除異方差,同時(shí)減小數(shù)據(jù)波動(dòng)范圍。

1.2Normal

將采集得到的觀測(cè)樣本x1,?,xn當(dāng)做總體樣本的近似，通過觀測(cè)樣本得到各樣本統(tǒng)計(jì)量值以估計(jì)總體統(tǒng)計(jì)量，其中總體標(biāo)準(zhǔn)差的無偏估計(jì)如式，Bootstrap是一種著名的方差估計(jì)方法，其思想是通過重復(fù)抽樣來估計(jì)總體分布。具體來說就是將得到的樣本Fn(x)當(dāng)做總體F(x)的近似，θ是θ的一個(gè)估計(jì)，通過從得到的樣本中重復(fù)有放回抽樣生成經(jīng)驗(yàn)累積分布函數(shù)F*n(x)，對(duì)生成的F*n(x)樣本進(jìn)行相應(yīng)計(jì)算得到θ*，利用一系列θ*實(shí)現(xiàn)θ的置信區(qū)間評(píng)定。本文為了使全部的數(shù)據(jù)盡可能被采集，使得總體統(tǒng)計(jì)量的估計(jì)結(jié)果更為穩(wěn)健，規(guī)定抽樣次數(shù)B=2000；⑶對(duì)一個(gè)估計(jì)量θ的標(biāo)準(zhǔn)差進(jìn)行Bootstrap估計(jì)就是將Bootstrap重復(fù)實(shí)驗(yàn)θ(1),?,θ(B)的樣本標(biāo)準(zhǔn)差作為估計(jì)值，Jackknife可用于總體估計(jì)量的不確定估計(jì)，旨在減少估計(jì)的偏差。其思想為“去一”抽樣，假設(shè)獲取樣本樣本量為n，在第i次抽樣中去除第i個(gè)樣本數(shù)據(jù)i=(1,2,...,n)，用剩下的(n-1)個(gè)數(shù)據(jù)作為抽樣樣本計(jì)算θ(i)，分別對(duì)生成的n個(gè)樣本計(jì)算相應(yīng)的樣本統(tǒng)計(jì)量，從而實(shí)現(xiàn)總體統(tǒng)計(jì)量的置信區(qū)間估計(jì)。具體步驟如下：⑴從觀測(cè)樣本x1,?,xn中做i次Jackknife抽樣，生成第i個(gè)Jackknife樣本⑵對(duì)n個(gè)Jackknife樣本計(jì)算估計(jì)值θ(1),θ(2),?,θ(n)；⑶當(dāng)利用Jackknife對(duì)θ進(jìn)行標(biāo)準(zhǔn)差估計(jì)時(shí)，21.5Bootstrap-Jackknife在實(shí)際應(yīng)用中，Bootstrap對(duì)估計(jì)量的相關(guān)估計(jì)值具有隨機(jī)性，即每一次運(yùn)用Bootstrap算法抽樣得到的估計(jì)值并不相同，而使用Jackknife對(duì)統(tǒng)計(jì)量進(jìn)行估計(jì)時(shí)，各采樣的樣本之間的差異太小。本文考慮到Bootstrap與Jackknife的不足之處，結(jié)合兩種算法，創(chuàng)新性地進(jìn)行相關(guān)方差估計(jì)。采用Bootstrap選取多組樣本，隨后采用Jackknife對(duì)每組樣本分別進(jìn)行均值與標(biāo)準(zhǔn)差的估計(jì)，結(jié)合實(shí)際訓(xùn)練數(shù)據(jù)發(fā)現(xiàn)該方法得到的估計(jì)值穩(wěn)健度更高。本文實(shí)現(xiàn)Bootstrap-Jackknife的具體步驟如下：

2實(shí)例分析

分別采用Normal、Bootstrap、Jackknife、Bootstrap-Jackknife方法，對(duì)實(shí)際樣本數(shù)據(jù)進(jìn)行均值估計(jì)，實(shí)際訓(xùn)練樣本為該校各專業(yè)學(xué)生在2017學(xué)年的四級(jí)成績(jī)對(duì)數(shù)。估計(jì)結(jié)果對(duì)比情況如圖1所示。由圖1數(shù)據(jù)可以看出：①對(duì)于Normal、Jackknife與Bootstrap-Jackknife這三種方法計(jì)算出的均值估計(jì)量?jī)H有細(xì)微差異，而Bootstrap得到的均值估計(jì)值與其他三種方法得到的均值估計(jì)值相差較大；②對(duì)于標(biāo)準(zhǔn)差估計(jì)，Bootstrap-Jackknife估計(jì)得到的標(biāo)準(zhǔn)差要遠(yuǎn)遠(yuǎn)小于其他三種方法估計(jì)的標(biāo)準(zhǔn)差，這說明在對(duì)總體均值的估計(jì)中，Bootstrap-Jackknife的估計(jì)誤差最小，即利用該方法得到的均值用來估計(jì)總體均值，其精度最高。另外Bootstrap與Jackknife的標(biāo)準(zhǔn)差估計(jì)值幾乎重合為一條折線且遠(yuǎn)小于普通法的標(biāo)準(zhǔn)差估計(jì)值，這說明利用Bootstrap與Jackknife對(duì)估計(jì)量進(jìn)行估計(jì)，其可信度要高于普通法得到的估計(jì)量值。為了更明顯的顯示四種方法估計(jì)樣本均值的差異，本文將四種方法得到的樣本數(shù)據(jù)均值估計(jì)值進(jìn)行排序，具體排序結(jié)果如表1所示(僅列舉部分)。表1四種方法估計(jì)的均值排序?qū)Ρ扔⒄Z國(guó)際商務(wù)會(huì)計(jì)學(xué)(ACCA班)...環(huán)境設(shè)計(jì)視覺傳達(dá)設(shè)計(jì)產(chǎn)品設(shè)計(jì)B為比較Bootstrap-Jackknife方法與其他三種方法排序結(jié)果之間的差異，本文將各專業(yè)Bootstrap-Jackknife排序結(jié)果與其他三種方法得到的排序結(jié)果做差值處理，并進(jìn)行絕對(duì)值運(yùn)算，依據(jù)各差值結(jié)果繪制箱線圖，如圖2所示。圖2各結(jié)合表1排序數(shù)據(jù)與圖2箱線圖可以看出：第一，Normal與Bootstrap-Jackknife在專業(yè)排序上的差異甚微，Bootstrap-Jackknife與Jackknife在專業(yè)排序上的差異最為顯著，這說明就均值估計(jì)而言，Jackknife估計(jì)的穩(wěn)定性并不高；第二，就排序數(shù)據(jù)上來看，該校英語四級(jí)應(yīng)試能力前三的專業(yè)為英語、國(guó)際商務(wù)和會(huì)計(jì)學(xué)（ACCA班），而英語四級(jí)應(yīng)試能力較差的專業(yè)為環(huán)境設(shè)計(jì)、視覺傳達(dá)設(shè)計(jì)、產(chǎn)品設(shè)計(jì)這三個(gè)藝術(shù)專業(yè)。

3結(jié)論

本文基于廣州華商學(xué)院2017學(xué)年各專業(yè)學(xué)生四級(jí)成績(jī)數(shù)據(jù)，運(yùn)用Normal、Bootstrap、Jackknife和Bootstrap-Jackknife四種方差估計(jì)方法分別評(píng)估該校均衡，是一種均勻的密集采樣，導(dǎo)致訓(xùn)練困難。

4結(jié)束語

本文選用的YOLOv3和SSD框架可實(shí)現(xiàn)四種闊葉材高效、準(zhǔn)確辨識(shí)，YOLOv3框架辨識(shí)準(zhǔn)確率更高，而SSD框架用時(shí)更短?？傮w而言，SSD對(duì)四種闊葉材做到了更高效自動(dòng)辨識(shí)，可以在保證辨識(shí)的正確率前提下能夠更快的處理樣本，提高了闊葉材的識(shí)辨識(shí)效率。本文識(shí)別準(zhǔn)確率沒有達(dá)到100%，綜合分析與圖像特點(diǎn)有關(guān)。本文只對(duì)四種木材樣本進(jìn)行研究，闊葉材種類相對(duì)單一，但是每種闊葉材采集的樣本量較大，結(jié)果更具有適應(yīng)性，下一步將從提高樣本的多樣性入手，增加不同闊葉材材種的訓(xùn)練集，從而提高模型的抗干擾和泛化能力，使其更適應(yīng)于更多闊葉材材種的辨識(shí)。

作者:夏艷張麗娟單位:廣州華商學(xué)院

相關(guān)文章

優(yōu)秀范文

相關(guān)期刊

亚洲激情综合另类男同-中文字幕一区亚洲高清-欧美一区二区三区婷婷月色巨-欧美色欧美亚洲另类少妇

高校四級(jí)成績(jī)數(shù)據(jù)的重采樣方法研究

高校輔導(dǎo)員

高校招生

中國(guó)高校師資研究

高校教育管理