發(fā)布時間:2022-05-21 11:09:17
序言:寫作是分享個人見解和探索未知領(lǐng)域的橋梁,我們?yōu)槟x了1篇的統(tǒng)計學(xué)數(shù)據(jù)分析論文樣本,期待這些樣本能夠為您提供豐富的參考和啟發(fā),請盡情閱讀。
摘 要:隨著信息化時代的發(fā)展,數(shù)據(jù)的形式多樣化,數(shù)據(jù)結(jié)構(gòu)具有復(fù)雜性特征。這標(biāo)志著大數(shù)據(jù)時代的到來,這一時代的數(shù)據(jù)具有處理速度快、數(shù)據(jù)量大、樣本復(fù)雜但價值密度低的特點。大數(shù)據(jù)時代的到來,高校應(yīng)對其產(chǎn)生新的認識,并根據(jù)實際狀況及時調(diào)整統(tǒng)計學(xué)專業(yè)的建設(shè)策略,使統(tǒng)計人才的培養(yǎng)能夠適應(yīng)時代的需求。
關(guān)鍵詞:大數(shù)據(jù)時代;統(tǒng)計學(xué);影響
隨著大數(shù)據(jù)時代的到來,各企業(yè)采用了新的策略,獲得了更多的利潤。對于統(tǒng)計專業(yè)來說,改變發(fā)展策略,使培養(yǎng)出來的專業(yè)人才能夠適應(yīng)大數(shù)據(jù)背景的需求是其主要任務(wù)。目前,高校統(tǒng)計學(xué)專業(yè)逐漸認識到大數(shù)據(jù)時代綜合性人才培養(yǎng)的重要性,并對專業(yè)建設(shè)進行了相關(guān)改革。
一、大數(shù)據(jù)時代對統(tǒng)計學(xué)的影響
大數(shù)據(jù)時代的到來對現(xiàn)代統(tǒng)計專業(yè)的發(fā)展造成了新的沖擊,要確保培養(yǎng)出來的人才能夠起到應(yīng)有的作用,首先要了解大數(shù)據(jù)時代對統(tǒng)計專業(yè)所造成的影響。
(一)大數(shù)據(jù)時代使數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)性質(zhì)發(fā)生變化
網(wǎng)絡(luò)技術(shù)以及基于網(wǎng)絡(luò)技術(shù)的電子商務(wù)等新的數(shù)據(jù)記錄模式標(biāo)志著大數(shù)據(jù)時代的到來。大數(shù)據(jù)時代,不再依賴于抽樣調(diào)查的記錄模式,網(wǎng)站瀏覽、視頻監(jiān)控都將形成大量數(shù)據(jù)。傳統(tǒng)的數(shù)據(jù)結(jié)構(gòu)甚至是數(shù)據(jù)性質(zhì)發(fā)生了變化。大量的數(shù)據(jù)信息對于需求者來說,如何甄別其可用價值成為關(guān)鍵。傳統(tǒng)的數(shù)據(jù)可以二維表格顯示和整理。但大數(shù)據(jù)時代所產(chǎn)生的數(shù)據(jù)具有多樣化和復(fù)雜化特征,往往包含了大量的音頻、視頻、HTML等。這要求大數(shù)據(jù)的收集具有較強的目的性,才能實現(xiàn)其價值。
(二)大數(shù)據(jù)時代要求統(tǒng)計分析方法和統(tǒng)計思維更新
大數(shù)據(jù)時代的主要特征為數(shù)據(jù)多且復(fù)雜,數(shù)據(jù)分析要求分析者對總體進行分析。在這一背景下,參數(shù)統(tǒng)計不再具有意義,假設(shè)檢驗法也隨著總體分析而失去價值。數(shù)據(jù)的復(fù)雜化對傳統(tǒng)大數(shù)據(jù)統(tǒng)計思維造成了巨大的沖擊,要求統(tǒng)計者具有活躍的思維。只有對傳統(tǒng)數(shù)據(jù)的改變進行分析,并且樹立新的統(tǒng)計方法。
二、大數(shù)據(jù)時代下的統(tǒng)計學(xué)發(fā)展新策略
為適應(yīng)大數(shù)據(jù)時代的需求,統(tǒng)計學(xué)專業(yè)的發(fā)展勢必要對傳統(tǒng)模式進行改革。目前,多數(shù)高校統(tǒng)計學(xué)專業(yè)已經(jīng)認識到大數(shù)據(jù)對于其發(fā)展帶來的沖擊。為此,本文提出了以下策略,以及能夠幫助統(tǒng)計學(xué)取得更好發(fā)展。
(一)加強統(tǒng)計應(yīng)用性教學(xué)
根據(jù)大數(shù)據(jù)時代數(shù)據(jù)的總體分析特征,數(shù)據(jù)分析人員應(yīng)掌握全面的分析方法。在人才培養(yǎng)過程中,應(yīng)致力于培養(yǎng)實踐分析能力,提高數(shù)據(jù)和資料收集能力,并且培養(yǎng)其強烈的數(shù)據(jù)價值觀,使其能夠從眾多數(shù)據(jù)中找到所需的。另外,對傳統(tǒng)模式進行改革,增加大數(shù)據(jù)統(tǒng)計內(nèi)容,以適應(yīng)時代的需求?;诖髷?shù)據(jù)的結(jié)構(gòu)特點,實施資料透視化教學(xué),提高分析者對復(fù)雜數(shù)據(jù)的分析能力。
(二)培養(yǎng)大數(shù)據(jù)統(tǒng)計思維
在人才培養(yǎng)過程中,新的統(tǒng)計思維的培養(yǎng)具有重要意義,即強調(diào)數(shù)據(jù)分析實踐能力的提高。統(tǒng)計思維的培養(yǎng)有助于數(shù)據(jù)分析者對復(fù)雜的數(shù)據(jù)進行區(qū)分,從而整理有效信息。在大數(shù)據(jù)時代,不僅要以傳統(tǒng)的平均思維、動態(tài)思維和變異思維為基礎(chǔ),還要注重基于整體分析的大數(shù)據(jù)思維。另外,還要培養(yǎng)數(shù)據(jù)分者的復(fù)雜性思維,以應(yīng)對復(fù)雜的數(shù)據(jù)庫??傊髷?shù)據(jù)時代需要數(shù)據(jù)分析者具有全面的、創(chuàng)新性的思維。
(三)強化基礎(chǔ)性統(tǒng)計知識
統(tǒng)計學(xué)自身具有復(fù)雜性,其改變多且抽象?;A(chǔ)的統(tǒng)計知識是進一步掌握大數(shù)據(jù)分析思維的基礎(chǔ),可見學(xué)習(xí)基礎(chǔ)性統(tǒng)計知識的重要性是不言而喻的。為此,應(yīng)該采取深入淺出的方法,利用多媒體等方式使復(fù)雜的數(shù)據(jù)統(tǒng)計清晰化、簡單化。結(jié)合具體的案例使數(shù)據(jù)分析者正確認識統(tǒng)計概念、掌握統(tǒng)計原理和方法。此外大數(shù)據(jù)分析不再是一種專業(yè),而是更傾向于一種技術(shù),這要求我們將大數(shù)據(jù)分析與統(tǒng)計學(xué)以外的相關(guān)知識相互聯(lián)系。注重真實相關(guān)與偽相關(guān)的講解,強調(diào)商務(wù)智能的開發(fā)和分析。只有具有堅實的基礎(chǔ),才能確保數(shù)據(jù)分析者大數(shù)據(jù)分析思維的養(yǎng)成,適應(yīng)現(xiàn)代社會的需求。
(四)加強復(fù)合型人才培養(yǎng)
為適應(yīng)大數(shù)據(jù)時代的需求,復(fù)合型人才的培養(yǎng)是關(guān)鍵。所謂復(fù)合型人才,是指其不但要具有專業(yè)的數(shù)據(jù)分析能力,還要相應(yīng)的具備管理以及其從事專業(yè)的技術(shù)。大數(shù)據(jù)時代,高校應(yīng)建立全面的人才培養(yǎng)模式,注重培養(yǎng)人才的數(shù)據(jù)分析能力、編程能力等,使其真正了解大數(shù)據(jù),懂得如何利用大數(shù)據(jù)對其所處的行業(yè)起到積極作用才是關(guān)鍵??傊?,大數(shù)據(jù)時代對綜合性人才具有更高的需求,大數(shù)據(jù)時代不僅培養(yǎng)的是一種能力,而且是一種思維,是對全新模式下的數(shù)據(jù)的分析和利用。高校作為人才培養(yǎng)的重要基地,其教學(xué)模式的改革、對大數(shù)據(jù)時代所需教學(xué)模式的認識是高校的主要任務(wù)。
三、總結(jié)
統(tǒng)計學(xué)是經(jīng)濟學(xué)的基礎(chǔ)課程,傳統(tǒng)的統(tǒng)計人才培養(yǎng)具有定向性。而隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)產(chǎn)生的形式多樣,且具有復(fù)雜性。大數(shù)據(jù)分析不僅是作為一種專業(yè)存在,而是應(yīng)以一項必備的技術(shù)而存在。大數(shù)據(jù)時代,傳統(tǒng)的統(tǒng)計思維和統(tǒng)計方法發(fā)生了改變,統(tǒng)計人才培養(yǎng)方式的改革也就勢在必行。(作者單位:海南師范大學(xué))
【摘要】大數(shù)據(jù)給統(tǒng)計學(xué)帶來了機遇、挑戰(zhàn)和緊迫感。本文描述大數(shù)據(jù)的環(huán)境,利用大數(shù)據(jù)的目的和大數(shù)據(jù)帶來的變革;介紹國內(nèi)外有關(guān)大數(shù)據(jù)的研究動向;探討大數(shù)據(jù)包含的信息,大數(shù)據(jù)的預(yù)處理、抽樣和分析方法。
【關(guān)鍵詞】大數(shù)據(jù) 抽樣 數(shù)據(jù)分析方法論
當(dāng)今時代,一方面人們在主動地獲取數(shù)據(jù)。各個科學(xué)領(lǐng)域都在大量地獲取數(shù)據(jù),自然科學(xué)領(lǐng)域收集著從宏觀的天文數(shù)據(jù)到微觀的基因數(shù)據(jù),經(jīng)濟、金融和人文社會科學(xué)收集著大量的觀察和調(diào)查數(shù)據(jù)。另一方面人們在被動地囤積數(shù)據(jù)。隨著計算機互聯(lián)網(wǎng)、搜索引擎、電子商務(wù)、多種傳感器和多媒體技術(shù)的發(fā)展和廣泛使用,各種形式的數(shù)據(jù)如江河流水般地涌來。當(dāng)今數(shù)據(jù)的獲取和規(guī)模發(fā)生了根本的變化,統(tǒng)計學(xué)面臨著新的機遇和挑戰(zhàn),需要在方法論上有所突破。
一、大數(shù)據(jù)及其目的
狹義地講,大數(shù)據(jù)是一個大樣本和高維變量的數(shù)據(jù)集合。針對樣本大的問題,統(tǒng)計學(xué)可以采用抽樣減少樣本量,達到需要的精度。目前大數(shù)據(jù)的環(huán)境包括了:數(shù)據(jù)流環(huán)境:數(shù)據(jù)快速不斷涌來,現(xiàn)有存儲設(shè)備和計算能力難以應(yīng)付這種洪水般的數(shù)據(jù)流;磁盤存儲環(huán)境:數(shù)據(jù)已不能完全存儲在內(nèi)存中,需要硬盤存儲;分布存儲環(huán)境:數(shù)據(jù)分布存儲在多個計算機中;多線條環(huán)境:數(shù)據(jù)存儲在一個計算機中,多個處理器共享內(nèi)存。
大數(shù)據(jù)的目的是將數(shù)據(jù)轉(zhuǎn)化為知識,探索數(shù)據(jù)的產(chǎn)生機制,進行預(yù)測和制定政策。把信息轉(zhuǎn)變?yōu)橛杏玫闹R還需漫長的時間?!邦A(yù)測”不同于“制定政策”。一個兒童的鞋子越大,可以預(yù)測他掌握的詞匯量越多;但是,制定政策強制他穿大鞋子并不能提高他的詞匯量。
二、大數(shù)據(jù)帶來的變革
大數(shù)據(jù)給我們的時代帶來了變革。目前,人們習(xí)慣于根據(jù)“研究問題”來驅(qū)動“收集數(shù)據(jù)”。今后,大數(shù)據(jù)到處可得,人們將會用“數(shù)據(jù)”驅(qū)動“研究問題”。就像我們出遠門前常常查詢目的地的天氣、交通和賓館那樣,未來人們在研究和決策前將會通過查詢數(shù)據(jù)做決定。目前已經(jīng)有科學(xué)家開始使用軟件搜索和匯總已中的成果。大數(shù)據(jù)中包含有各種不同目的的數(shù)據(jù)集,綜合利用它們可以做出原來目的之外的意外成果。例如,將醫(yī)院病歷數(shù)據(jù)與信用卡消費數(shù)據(jù)結(jié)合,我們能發(fā)現(xiàn)食品與健康的相關(guān)關(guān)系,指導(dǎo)人們進行健康飲食。假若再加上手機和GPS等數(shù)據(jù),還能隨時對人們進行體檢,指導(dǎo)健身,減少猝死,幫助醫(yī)生診斷疾病等,應(yīng)用大數(shù)據(jù)可以設(shè)想的用途不計其數(shù)。
三、大數(shù)據(jù)的處理、抽樣與分析
(一)數(shù)據(jù)的預(yù)處理
大數(shù)據(jù)的預(yù)處理包括數(shù)據(jù)清洗、不完全數(shù)據(jù)填補、數(shù)據(jù)糾偏與矯正。利用隨機抽樣數(shù)據(jù)矯正雜亂的、非標(biāo)準(zhǔn)的數(shù)據(jù)源。統(tǒng)計機構(gòu)的數(shù)據(jù)是經(jīng)過嚴(yán)格抽樣設(shè)計獲取的,具有總體的代表性和系統(tǒng)誤差小的優(yōu)勢,但是數(shù)據(jù)獲取和更新的周期長,盡管調(diào)查項目有代表性,但難以無所不包。而互聯(lián)網(wǎng)數(shù)據(jù)的獲取速度快、量大、項目繁細,但是難以避免數(shù)據(jù)獲取的偏倚性。將統(tǒng)計機構(gòu)的數(shù)據(jù)作為金標(biāo)準(zhǔn)和框架對互聯(lián)網(wǎng)數(shù)據(jù)進行矯正,將互聯(lián)網(wǎng)數(shù)據(jù)作為補充資源對統(tǒng)計機構(gòu)的數(shù)據(jù)進行實時更新,也許是解決問題的一個思路。
(二)大數(shù)據(jù)環(huán)境的抽樣
大數(shù)據(jù)的抽樣方法有待研究?!皹颖尽辈槐厥褂盟小皵?shù)據(jù)”,不管鍋有多大,只要充分攪勻,品嘗一小勺就知道其滋味。針對大數(shù)據(jù)流環(huán)境,需要探索從源源不斷的數(shù)據(jù)流中抽取足以滿足統(tǒng)計目的和精度的樣本。需要研究新的適應(yīng)性、序貫性和動態(tài)的抽樣方法。根據(jù)已獲得的樣本逐步調(diào)整感興趣的調(diào)查項目和抽樣對象,使得最近頻繁出現(xiàn)的熱門數(shù)據(jù),也是感興趣的數(shù)據(jù)進入樣本。建立數(shù)據(jù)流的緩沖區(qū),記錄新發(fā)生數(shù)據(jù)的頻數(shù),動態(tài)調(diào)整不在樣本中的數(shù)據(jù)進入樣本的概率。
(三)大數(shù)據(jù)的分析與整合
針對大數(shù)據(jù)的高維問題,需要研究降維和分解的方法。探討壓縮大數(shù)據(jù)的方法,直接對壓縮的數(shù)據(jù)核進行傳輸、運算和操作。除了常規(guī)的統(tǒng)計分析方法,包括高維矩陣、降維方法、變量選擇之外,需要研究大數(shù)據(jù)的實時分析、數(shù)據(jù)流算法。不用保存數(shù)據(jù),僅掃描一遍數(shù)據(jù)的數(shù)據(jù)流算法,考慮計算機內(nèi)存和外存的數(shù)據(jù)傳送問題、分布數(shù)據(jù)和并行計算的方法。如何無信息損失或無統(tǒng)計信息損失地分解大數(shù)據(jù)集,獨立并行地在分布計算機環(huán)境進行推斷,各個計算機的中間計算結(jié)果能相互聯(lián)系溝通,構(gòu)造全局統(tǒng)計結(jié)果。研究多個數(shù)據(jù)資源的融合算法。研究利用數(shù)據(jù)流尋找模型變化時間點的動態(tài)變化模型。
在大數(shù)據(jù)環(huán)境,很多數(shù)據(jù)集不再有標(biāo)識個體的關(guān)鍵字,傳統(tǒng)的關(guān)系數(shù)據(jù)庫連接方法不再適用,需要探討利用數(shù)據(jù)庫之間的重疊項目來結(jié)合不同的數(shù)據(jù)庫,利用變量間的條件獨立性整合多個不同變量集的數(shù)據(jù)為一個完整變量集的大數(shù)據(jù)庫的方法。探索不必經(jīng)過整合多數(shù)據(jù)庫,直接利用局部數(shù)據(jù)進行推斷和各推斷結(jié)果傳播的方法。另一方面,利用統(tǒng)計性質(zhì)無信息損失地分解和壓縮大數(shù)據(jù)。
四、結(jié)束語
一個新生事物的出現(xiàn)將必定導(dǎo)致傳統(tǒng)觀念和技術(shù)的革命。數(shù)碼照相機的出現(xiàn)導(dǎo)致傳統(tǒng)相片膠卷和影像業(yè)的已近消亡。如果大數(shù)據(jù)包含了所有父親和兒子的身高數(shù)據(jù),只要計算給定的父親身高下所有兒子的平均身高就可以預(yù)測其兒子身高了。模型不再重要,當(dāng)年統(tǒng)計學(xué)最得意的回歸預(yù)測方法將被淘汰。大數(shù)據(jù)的到來將對傳統(tǒng)的統(tǒng)計方法進行考驗。統(tǒng)計學(xué)會不會象科學(xué)哲學(xué)那樣,只佩戴著歷史的光環(huán),而不再主導(dǎo)和引領(lǐng)人們分析和利用大數(shù)據(jù)資源。現(xiàn)在其他學(xué)科和行業(yè)涌入大數(shù)據(jù)的熱潮,如果統(tǒng)計學(xué)不抓緊參與的話,將面臨著被邊緣化的危險?,F(xiàn)今統(tǒng)計學(xué)的目標(biāo)是通過獲取數(shù)據(jù)和分析數(shù)據(jù)發(fā)現(xiàn)真理(總體的參數(shù)和性質(zhì)),統(tǒng)計方法和理論對數(shù)據(jù)有過高的要求。而大數(shù)據(jù)充滿了各種隨機的、非隨機的誤差和偏倚,不能滿足這些苛刻的要求。按照波普的科學(xué)劃界準(zhǔn)則,只要我們能從大數(shù)據(jù)中提煉出具有可證偽的結(jié)論,那么這個結(jié)論還是科學(xué)的,可以用于知識積累。這些可證偽的大數(shù)據(jù)結(jié)論可作為進一步科學(xué)研究的假說,以數(shù)據(jù)驅(qū)動研究。我們在看到大數(shù)據(jù)給統(tǒng)計學(xué)帶來了機遇的同時,也應(yīng)該看到現(xiàn)在的統(tǒng)計方法普遍只適用于全部數(shù)據(jù)放在單個計算機內(nèi)存的環(huán)境,分布式大數(shù)據(jù)和數(shù)據(jù)流的環(huán)境給統(tǒng)計學(xué)帶來了挑戰(zhàn)。統(tǒng)計學(xué)家不應(yīng)該固守傳統(tǒng)數(shù)據(jù)的環(huán)境,必須積極學(xué)習(xí)新生事物,適應(yīng)新的大數(shù)據(jù)環(huán)境,擴展統(tǒng)計學(xué)的應(yīng)用領(lǐng)域,創(chuàng)造出迎合大數(shù)據(jù)的新統(tǒng)計方法,“機遇”與“挑戰(zhàn)”并存。
[摘 要]以股票當(dāng)中基本的股票價格計算數(shù)據(jù)著手,重點研究統(tǒng)計學(xué)在股票價格計算數(shù)據(jù)整理運算進程中有關(guān)的運用。全面地說明了如何計算股票價格的三種平均數(shù)和計算的公式;股票價格統(tǒng)計數(shù)據(jù)整理運算進程當(dāng)中的取樣研究以及股票價格統(tǒng)計數(shù)據(jù)的四個計算方法;依次列出在各個國家之間具有比較高影響力的幾個股票價格統(tǒng)計數(shù)據(jù)在運算進程中統(tǒng)計學(xué)的有關(guān)運用。
[關(guān)鍵詞]統(tǒng)計學(xué);股票的價格;股票的價格統(tǒng)計數(shù)據(jù)
隨著社會進步,股票已深入人們的生活當(dāng)中,只有正確地對待股票與統(tǒng)計學(xué)之間的聯(lián)系,這樣能更全面利用統(tǒng)計學(xué)知識掌握股票交易市場的變動規(guī)律,從而促進個人與團體的利益一致性。
在平時常見的文章中我們能經(jīng)常碰到的是統(tǒng)計學(xué)的取樣數(shù)據(jù)分析、回歸分析、標(biāo)準(zhǔn)差等在股票技術(shù)分析、投資收益、風(fēng)險預(yù)測中的常見實際運用,在其實際運用中股票價格統(tǒng)計數(shù)據(jù)也是統(tǒng)計學(xué)里的一個,統(tǒng)計學(xué)在實際運用中有著廣泛的作用,本篇文章是從股票中最基本的股票價格統(tǒng)計數(shù)據(jù)開始,側(cè)重以統(tǒng)計學(xué)在股票價格統(tǒng)計數(shù)據(jù)整理運算過程中的實際運用進行分析、談?wù)摗?
1 統(tǒng)計學(xué)在股票中的定義
統(tǒng)計學(xué)通過收集相關(guān)的資料,剖析資料和數(shù)據(jù)得到的結(jié)果的一組概論,準(zhǔn)則與辦法。統(tǒng)計分析數(shù)據(jù)有描寫和推測統(tǒng)計兩種方法。
(1)看大盤:匯集股票的相關(guān)材料,即調(diào)查統(tǒng)計。從頭到尾,即全方位的去調(diào)查;有重點的看,即重點的調(diào)查;隨機的查看,即采樣調(diào)查;查找各種各樣的有象征性的個人股票,也是典型的調(diào)查。
(2)股票板塊:以某一標(biāo)志將股票進行分類,也就是分組統(tǒng)計。例如鋼鐵板塊等。
(3)陰陽燭:交易成功量與交易成功價格的高低決定其趨勢,即是頻數(shù)分布。
(4)牛市:股價呈飆升趨勢,即是正J型分布。
(5)熊市:股票呈下跌趨勢,即反J型分布。
(6)摸高,回落:股票飆升,至某一點時受到阻力后呈下跌趨勢,即是偏態(tài)分布。
(7)探底,反彈:股票價格下跌,到某一地方撐持后上升,也就U型的分布。
(8)股票指數(shù):加權(quán)平均數(shù)的運算,是質(zhì)量指標(biāo)指數(shù)。股票的價格是質(zhì)量指標(biāo),成交的數(shù)量或發(fā)行量是數(shù)量指標(biāo)。
(9)黑股:存在感過低,易失諸交臂。
(10)均線:股價算術(shù)的平均數(shù)。一般為加權(quán)平均。
(11)震蕩空間:股票價格的波動曲線的均值偏差,也就是標(biāo)準(zhǔn)偏差。
2 股票的價格統(tǒng)計數(shù)據(jù)
2.1 股票的價格均值
股票價格的均數(shù)是反饋不同股票價格上下浮動的基準(zhǔn)。股票價格均數(shù)是由證券交易場所、金融類服務(wù)公司、銀行或新聞媒體整理而成的。為了能時刻了解各種股票而聯(lián)合形成的行情市場整體的價格水平和完整市場總和的變化方向。
2.2 簡易的算術(shù)股票價錢均值
1981年6月,查爾斯?亨利?道在《客戶午后通訊》首次了一組之后被稱作“道?瓊斯工業(yè)股的股票價格平均數(shù)值”,也是全球上最早股票價格平均數(shù)值。
2.3 加權(quán)指數(shù)
加權(quán)指數(shù)是依據(jù)各種樣本股票的銷售數(shù)量或者是交易成交的數(shù)量依照權(quán)術(shù)來進行加權(quán)指數(shù)運算的股票交易價格的均值。因此銷售的數(shù)量是權(quán)數(shù)的加權(quán)均值的股票交易價格,即是抽樣股票的市場價值總和除以抽樣股票的銷售數(shù)量;以成交數(shù)量作為權(quán)數(shù)的加權(quán)均值股票價格,就相當(dāng)于是抽樣股票的全部金額除以抽樣股票的成交數(shù)量。
2.4 修正股票交易價格的均值
修正股票交易價格均值是通過簡便的數(shù)字運算的基本上,如果有分割股票、增加投資、發(fā)行新股的時候,經(jīng)過改動除數(shù),讓股票的交易價格的均值沒有任何影響。做法是以新的股票交易價格的全部金額除以舊的股票交易價格的平均數(shù)值,因此得出新的除數(shù),然后再以運算期的股票交易價格總金額去除以新的除數(shù),就可以得出修正的股票交易價格的平均數(shù)值。
2.5 股票價格的波動情形
股票的價格指標(biāo)是本期股票的交易價格和某個前期之間相對比的相對數(shù)變化,是因為證券交易的場所或者是金融中介機構(gòu)經(jīng)過對股票交易場所里有一些具有象征性的企業(yè)所發(fā)出的股票交易價格,進行平均運算和發(fā)展變化情況相比后整理出一個可以提供了解股票出價、發(fā)價或者是價格的指示數(shù)字。整理過程包括五個方面:①挑選一些具有象征性的股票,當(dāng)作整理過程中指示數(shù)字的樣品股票。②按照規(guī)定的時間去股票交易場所上去收集樣品股票的交易價格,俗稱采樣。③選擇一個基礎(chǔ)期,基礎(chǔ)期的股價交易價格水準(zhǔn)是100或者是1000。④要運用科學(xué)的方法以及高科技的手段運算出股票的指數(shù)數(shù)值。⑤要對外公布。
3 股票交易價格的運算
3.1 算術(shù)平均數(shù)
簡易的算術(shù)平均數(shù)是在運算出抽樣股票單個價格指數(shù)的基本上,加上總和算出平均值的一種運算方式?,F(xiàn)在運用這個方法計算的有算術(shù)平均股價指數(shù)、英國的《金融時報》精算股價指數(shù)等。
3.2 綜合平均法
綜合平均法是各自把前期和本期的股票交易價格實行求和,之后把本期的股票交易價格和前期的股票交易價格的總金額相對比,從而得出股票交易價格指標(biāo)的一個運算方式?,F(xiàn)在運用這個辦法的有美國的紐約證券所整理的股票交易價格指標(biāo),等等。
3.3 幾何平均法
幾何平均法是各自把本期和前期的股票交易價格互相乘后開方,之后再用本期和前期的相比較從而得出指標(biāo)的一個運算方法。
4 綜合加權(quán)法
(1)以樣品股票前期的成交量或者是銷售量為權(quán)數(shù)?,F(xiàn)在應(yīng)用這個方法運算有上海綜合股票交易價格指數(shù)等。
(2)以樣品股票本期的成交量為權(quán)數(shù)。現(xiàn)在應(yīng)用這個方法運算的有我國滬深300指數(shù)等。
(3)以樣品本期銷售量為權(quán)數(shù)。現(xiàn)在應(yīng)用這個方法運算的有標(biāo)準(zhǔn)普爾股票交易價格指數(shù)、深圳綜合指數(shù)等。
(4)加權(quán)幾何平均法。在股票交易價格指標(biāo)的運算當(dāng)中,大家為了能夠知道交易在本期與前期中區(qū)別,提議出了加權(quán)幾何平均法。現(xiàn)在使用這個方法運算的僅有英國倫敦《金融日報》工業(yè)普通的股票指數(shù)和美國價值線工業(yè)指數(shù)。
5 結(jié) 論
成功創(chuàng)立一種模型可以取得金融領(lǐng)域的頂尖榮譽,表現(xiàn)出了金融與數(shù)學(xué)的統(tǒng)計是有著不可分割聯(lián)系。統(tǒng)計學(xué)和其他有關(guān)的學(xué)術(shù)在證券交易場所起著非常重要的作用,人們在以前運用簡易的計算和算術(shù)方式已然無法去滿足逐漸困難的金融領(lǐng)域的進展。近這幾年,許多學(xué)院也都創(chuàng)立了金融系和管理系;北方工業(yè)學(xué)院的統(tǒng)計學(xué)學(xué)科創(chuàng)立了許多證券期貨的模擬工作間;設(shè)立有關(guān)學(xué)科的就特別多了。
摘要:大數(shù)據(jù)時代的到來,給與之密切相關(guān)的統(tǒng)計學(xué)專業(yè)帶來了前所未有的機遇與挑戰(zhàn)。本文針對統(tǒng)計學(xué)專業(yè)的自身特點,分析了專業(yè)中存在的問題,并從人才培養(yǎng)目標(biāo)的定位,課程的調(diào)整與設(shè)置,教學(xué)手段創(chuàng)新和完善教學(xué)評估體系等幾個方面提出了一些合理化的建議。
關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計學(xué);教學(xué)改革
一、引言
最早提出“大數(shù)據(jù)”時代到來的是全球知名咨詢公司麥肯錫,現(xiàn)在的社會是一個高速發(fā)展的社會,科技發(fā)達,信息流通,人們之間的交流越來越密切,生活也越來越方便,大數(shù)據(jù)就是這個高科技時代的產(chǎn)物。大數(shù)據(jù)具有以下的鮮明特點:第一個特征是數(shù)據(jù)量大。第二個特征是數(shù)據(jù)類型繁多,多類型的數(shù)據(jù)對數(shù)據(jù)的處理能力提出了更高的要求。第三個特征是數(shù)據(jù)價值密度相對較低,如何通過強大的機器算法更迅速地完成數(shù)據(jù)的價值“提純”,是大數(shù)據(jù)時代亟待解決的難題。第四個特征是處理速度快,時效性要求高,這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘最顯著的特征。
統(tǒng)計學(xué)專業(yè)是與數(shù)據(jù)分析處理聯(lián)系最為緊密的學(xué)科之一。大數(shù)據(jù)時代的到來不僅為統(tǒng)計學(xué)專業(yè)的發(fā)展帶來的前所未有的機遇,同時也帶來了巨大挑戰(zhàn)。傳統(tǒng)的統(tǒng)計學(xué)專業(yè)已不再適應(yīng)大數(shù)據(jù)時代的信息爆發(fā)式增長的要求,這就要求我們應(yīng)該對統(tǒng)計學(xué)專業(yè)進行重新定位,并在此基礎(chǔ)上調(diào)整相關(guān)課程,改革傳統(tǒng)的教學(xué)手段以及完善教學(xué)評價體系,以適應(yīng)大數(shù)據(jù)時代的到來。
二、統(tǒng)計學(xué)專業(yè)改革的建議
(一)人才培養(yǎng)目標(biāo)的重新定位
如果說以往的統(tǒng)計學(xué)專業(yè)是以培養(yǎng)簡單的“應(yīng)用型”人才為目標(biāo),那么隨著大數(shù)據(jù)時代的到來,社會不僅僅需要會應(yīng)用基礎(chǔ)統(tǒng)計知識處理相關(guān)領(lǐng)域的問題的單一的應(yīng)用型人才,而是對人才提出了更高的要求:大數(shù)據(jù)時代下的統(tǒng)計學(xué)專業(yè)的人才除了應(yīng)該具備基礎(chǔ)的數(shù)據(jù)收集,處理和分析的能力之外,還應(yīng)該了解相關(guān)應(yīng)用領(lǐng)域的背景知識,而且應(yīng)具備很強的自我學(xué)習(xí)能力,以適應(yīng)大數(shù)據(jù)時代數(shù)據(jù)量大,總類繁多,時效性高等發(fā)展特點。因此,統(tǒng)計學(xué)人才培養(yǎng)目標(biāo)應(yīng)該重新作出調(diào)整,應(yīng)該以培養(yǎng)全新的“復(fù)合型”統(tǒng)計人才為新的目標(biāo)。
(二)課程設(shè)置的調(diào)整
隨著人才培養(yǎng)目標(biāo)的重新定位,隨之而來的就是應(yīng)該對不再適應(yīng)時展要求的課程進行必要的調(diào)整。
首先,大數(shù)據(jù)的分析和處理與以往的經(jīng)典分析方法有很大不同,以往的統(tǒng)計分析方法主要是建立在抽樣基礎(chǔ)之上,而大數(shù)據(jù)時代信息處理迅速,信息獲得途徑廣泛,而且信息價值密度低,這就要求數(shù)據(jù)處理時,可以以全體作為樣本,而不是進行抽樣;分析時必須考慮所有數(shù)據(jù)而不是剔除所謂的異常數(shù)據(jù)。因此,以往的經(jīng)典統(tǒng)計分析方法已不再適應(yīng)大數(shù)據(jù)的處理和分析,必須適當(dāng)?shù)恼{(diào)整經(jīng)典分析方法的課程設(shè)置,增加新的適用于大數(shù)據(jù)分析的課程。
其次,隨著數(shù)據(jù)量的爆發(fā)式增長,所有的統(tǒng)計工作對計算機的依賴程度越來越高,這就要求統(tǒng)計學(xué)專業(yè)的學(xué)生不僅掌握統(tǒng)計學(xué)專業(yè)的基礎(chǔ)知識,同時應(yīng)該熟練掌握計算機專業(yè)知識相關(guān)知識,因此,在課程安排時,應(yīng)注意計算機相關(guān)課程的適當(dāng)增加。
基于上述原因,可以考慮增加如下課程:機器學(xué)習(xí),模擬算法,數(shù)據(jù)挖掘,R語言軟件分析等課程,同時適當(dāng)降低傳統(tǒng)分析方法課程的學(xué)時比重。此外,為了使學(xué)生能夠?qū)ο嚓P(guān)應(yīng)用領(lǐng)域的背景知識有所了解,可適當(dāng)增設(shè)與應(yīng)用領(lǐng)域相關(guān)的通識課程。
(三)教學(xué)模式與手段的創(chuàng)新
以往的教學(xué)模式,通常是以課堂教學(xué),掌握書本經(jīng)典理論為主。雖然,傳統(tǒng)教學(xué)手段有著學(xué)生理論基礎(chǔ)扎實等諸多優(yōu)點,但是同時也存才學(xué)生過于偏重理論知識的掌握,動手能力不足,理論與實踐脫節(jié)等缺點。隨著社會的發(fā)展,尤其統(tǒng)計學(xué)專業(yè)自身具有鮮明的應(yīng)用專業(yè)特點。只采用傳統(tǒng)的教學(xué)模式和手段顯然不再適合大數(shù)據(jù)時代的需要;同時,隨著大數(shù)據(jù)時代的到來,多媒體手段日益豐富多彩,為傳統(tǒng)教學(xué)的創(chuàng)新提供了必要的支持。因此,為了適應(yīng)大數(shù)據(jù)時代人才的要求,必須改革傳統(tǒng)的教學(xué)手段和模式,在傳統(tǒng)教學(xué)基礎(chǔ)上,加大實驗教學(xué)的比重,在傳統(tǒng)教學(xué)外,增加社會實踐環(huán)節(jié),引入微課慕課,翻轉(zhuǎn)課堂等全新教學(xué)模式,以提高學(xué)生的學(xué)習(xí)興趣,鍛煉學(xué)生理論應(yīng)用于實踐的能力,從而為以后使用大數(shù)據(jù)時代的工作打下堅實的基礎(chǔ)。
(四)教學(xué)評價體系的完善
傳統(tǒng)的教學(xué)評價體系,通常是采用書面考核的方式對學(xué)生的學(xué)習(xí)進行評價,隨著時代的發(fā)著,單純的筆試評價不足以衡量學(xué)生的全面能力,最后導(dǎo)致出現(xiàn)高分低能的情況的出現(xiàn)。
為了適應(yīng)大數(shù)據(jù)時代對人才多方面能力的需求,必須對傳統(tǒng)的考核評價體系做出適當(dāng)?shù)恼{(diào)整,以評價學(xué)生的多方面能力,尤其是動手能力,學(xué)習(xí)能力和應(yīng)用相關(guān)理論處理實際問題的能力。具體可以采用多種考核方法相結(jié)合的方式。如:增加平時的考核力度,增加實踐項目的考核,通過布置適當(dāng)?shù)捻椖空撐?,采用答辯的形式,以鍛煉學(xué)生適應(yīng)以后工作,獨立分析解決問題的能力。
此外,傳統(tǒng)教學(xué)評價體系通常是單方面的,只有對學(xué)生成績的評價,為了適應(yīng)大數(shù)據(jù)時代的到來,全面提高教學(xué)質(zhì)量,可采取雙向教學(xué)評價體系,如:增加學(xué)生對教學(xué)環(huán)節(jié)的評價體系。以及教師間同行間的評價體系等。
三、啟示
通過以上分析表明,為適應(yīng)大數(shù)據(jù)時代數(shù)據(jù)分析處理的要求,對統(tǒng)計學(xué)專業(yè)必然要進行必要的全面的改革,如:需要重新對專業(yè)驚醒合理的定位,重新制定人才培養(yǎng)目標(biāo),調(diào)整專業(yè)課程設(shè)置,改革傳統(tǒng)的教學(xué)模式和手段等等。但是,統(tǒng)計學(xué)專業(yè)改革是循序漸進的過程,不可能一蹴而就,不是一朝一夕就能實現(xiàn)的,因此,必須制定長期改革方案,以及有效的檢驗機制,避免在改革項目太多而適得其反。可以采用先試點,再推廣的方式,或者先局部進行改革試驗,再進行多方面的改革。例如可以先重新制定合理的人才培養(yǎng)方案,只進行適當(dāng)?shù)恼n程調(diào)整。穩(wěn)定后,在進行考核方式,評價體系等其他方面的改革。
摘要:大數(shù)據(jù)時代的到來對統(tǒng)計學(xué)提出了新的要求。本文從統(tǒng)計學(xué)專業(yè)發(fā)展的新特點出發(fā),剖析了現(xiàn)有教學(xué)體系中存在的問題,提出了明確專業(yè)培養(yǎng)目標(biāo),重新設(shè)計主干課程內(nèi)容;轉(zhuǎn)變固有思維方式,推進統(tǒng)計學(xué)教學(xué)改革;創(chuàng)新實踐教學(xué)模式,加強實踐教學(xué)開展等統(tǒng)計學(xué)專業(yè)教學(xué)體系改革的發(fā)展方向。
關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計學(xué);教學(xué)體系改革
一、大數(shù)據(jù)時代統(tǒng)計學(xué)專業(yè)發(fā)展的新特點
(一)數(shù)據(jù)化的信息收集
傳統(tǒng)的統(tǒng)計研究主要是對已收集的數(shù)據(jù)進行各種技術(shù)分析,包括描述性分析、推斷性分析、截面分析、時間序列分析等,側(cè)重點在于技術(shù)分析手段的使用上。然而大數(shù)據(jù)時代,關(guān)注的是信息本身。現(xiàn)代信息系統(tǒng)的使用使大數(shù)據(jù)成為可能,文字、地理方位、溝通等,任何事物都可以量化,一切現(xiàn)象都可以用數(shù)據(jù)或表格來詮釋。因此,大數(shù)據(jù)背景下世界是由各種信息和數(shù)據(jù)所構(gòu)成的。
(二)全數(shù)據(jù)模式的研究對象
在信息處理能力受限制的過去,人們?nèi)鄙儆脕矸治鏊占瘮?shù)據(jù)的工具,因此產(chǎn)生了隨機抽樣。隨機抽樣法的目的是用最少的數(shù)據(jù)獲得最多的關(guān)于總體的信息,從而使用樣本對總體進行推斷。然而,在大數(shù)據(jù)時代,數(shù)據(jù)處理的方式和技術(shù)發(fā)生了巨大的改變,人們可以通過互聯(lián)網(wǎng)、數(shù)據(jù)庫以及各種通訊工具獲得海量數(shù)據(jù),這時隨機抽樣就失去了它原來的意義。簡單廉價的數(shù)據(jù)收集方法,足夠的數(shù)據(jù)處理和存儲能力,使得全數(shù)據(jù)模式成為可能。因此,大數(shù)據(jù)背景下樣本即為總體。放棄隨機抽樣分析的捷徑,采用所有數(shù)據(jù)的方法,可以發(fā)現(xiàn)一些隱藏在海量數(shù)據(jù)下的細節(jié)。
(三)混雜性的數(shù)據(jù)處理思維
傳統(tǒng)的統(tǒng)計學(xué)處理數(shù)據(jù)的步驟是首先對數(shù)據(jù)進行整理和清洗,剔除不完整的或者異常值,然后再利用樣本信息,在允許的誤差范圍內(nèi)對總體進行推斷和分析,即通過調(diào)整精確度的大小來對總體進行研究和分析。然而,在大數(shù)據(jù)背景下,來自各個時間和空間的數(shù)據(jù)來源紛雜,格式廣泛,在萃取或處理數(shù)據(jù)的時候,很難做到把所有的數(shù)據(jù)都進行仔細地清洗。這種情況下,必須接受數(shù)據(jù)的混亂和不確定性,因為數(shù)據(jù)多比少好,因此更多的數(shù)據(jù)信息比更加智能、更加精確的算法系統(tǒng)還重要。當(dāng)擁有大量數(shù)據(jù)的時候,可以忽略一部分精確性,但并不是說不需要精確性,而是數(shù)據(jù)規(guī)模不斷擴大時,確切的數(shù)量已經(jīng)不再那么重要了,可以通過大規(guī)模的數(shù)據(jù)來發(fā)現(xiàn)事物背后的規(guī)律。
(四)相關(guān)關(guān)系的基礎(chǔ)分析方法
傳統(tǒng)的統(tǒng)計中,大部分相關(guān)關(guān)系分析僅限于尋求線性關(guān)系,或是在建立假設(shè)的基礎(chǔ)上揭示數(shù)據(jù)相互之間的因果關(guān)系,例如Granger檢驗就是依據(jù)時間序列數(shù)據(jù)對變量之間的因果關(guān)系進行的判斷,但往往會產(chǎn)生一些虛假的因果關(guān)系。這是因為統(tǒng)計關(guān)系并沒有蘊含多少真實的因果關(guān)系。在大數(shù)據(jù)背景下,數(shù)據(jù)點以數(shù)量級方式增長,用數(shù)據(jù)驅(qū)動的相關(guān)關(guān)系分析不再需要建立在假設(shè)的基礎(chǔ)上,所以相關(guān)關(guān)系分析不容易受偏見的影響而發(fā)生錯誤。大數(shù)據(jù)時代相關(guān)關(guān)系通過回答“是什么”的問題,為人們認識世界提供了一種新的視角。因此,相關(guān)關(guān)系統(tǒng)計分析是大數(shù)據(jù)預(yù)測的基礎(chǔ)。
二、統(tǒng)計學(xué)專業(yè)教學(xué)體系中存在的問題
大數(shù)據(jù)背景下傳統(tǒng)的統(tǒng)計學(xué)專業(yè)教學(xué)體系存在的問題凸顯,具體體現(xiàn)在以下幾個方面。
(一)培養(yǎng)目標(biāo)無法適應(yīng)大數(shù)據(jù)時代的社會需求
傳統(tǒng)的統(tǒng)計學(xué)專業(yè)教學(xué)體系的培養(yǎng)目標(biāo)是通過統(tǒng)計專業(yè)核心課程內(nèi)容的介紹,鍛煉學(xué)生收集、整理和分析數(shù)據(jù)的能力,培養(yǎng)“應(yīng)用型”統(tǒng)計專業(yè)人才。然而,大數(shù)據(jù)的出現(xiàn),使得通過數(shù)據(jù)分析獲得知識、商機和社會服務(wù)的能力,從以往局限于少數(shù)的學(xué)術(shù)精英圈子擴大到了普通的社會機構(gòu)、企業(yè)和政府部門,各行各業(yè)對統(tǒng)計數(shù)據(jù)、統(tǒng)計分析的需要使得統(tǒng)計學(xué)專業(yè)受到了前所未有的關(guān)注。大數(shù)據(jù)背景下,要求統(tǒng)計學(xué)作為一種分析工具,能夠與其他專業(yè)相互銜接,相互服務(wù),培養(yǎng)“復(fù)合型”專業(yè)人才。因此,傳統(tǒng)的統(tǒng)計學(xué)專業(yè)教學(xué)體系培養(yǎng)目標(biāo)存在兩個方面的挑戰(zhàn):第一,如何協(xié)調(diào)統(tǒng)計與其他專業(yè)之間的關(guān)系;第二,如何從“應(yīng)用型”向“復(fù)合型”人才進行轉(zhuǎn)變。
(二)忽視數(shù)據(jù)的收集和創(chuàng)新
傳統(tǒng)的統(tǒng)計學(xué)專業(yè)教學(xué)體系重視數(shù)據(jù)的分析技術(shù),更多的課程設(shè)置是圍繞著數(shù)據(jù)分析方法和技術(shù)展開的,例如多元統(tǒng)計分析、時間序列分析、統(tǒng)計預(yù)測與決策分析等?;A(chǔ)的數(shù)據(jù)收集部分只在統(tǒng)計學(xué)原理中有一章的內(nèi)容介紹,而且是作為非重點一帶而過的。大數(shù)據(jù)以海量的數(shù)據(jù)為分析研究的對象,將一切社會經(jīng)濟現(xiàn)象進行量化,重視的是信息的收集和數(shù)據(jù)的創(chuàng)新,包括數(shù)據(jù)的再利用,數(shù)據(jù)的重組,數(shù)據(jù)的擴展,數(shù)據(jù)的折舊以及數(shù)據(jù)的開放等各個方面。這些內(nèi)容在原有的教學(xué)體系中是沒有體現(xiàn)的。
(三)與大數(shù)據(jù)時代脫節(jié)的教學(xué)內(nèi)容
傳統(tǒng)的統(tǒng)計學(xué)專業(yè)教學(xué)體系仍然固守著原有的教學(xué)內(nèi)容,在近二十年內(nèi)變化不大。專業(yè)的主干課程有統(tǒng)計學(xué)原理、國民經(jīng)濟核算、計量經(jīng)濟學(xué)、抽樣技術(shù)與方法等。而在大數(shù)據(jù)背景下,教學(xué)內(nèi)容以全數(shù)據(jù)模式為研究對象,強調(diào)對所有的數(shù)據(jù)進行分析,而不是開展隨機抽樣;允許不精確的存在,而不是在給定的精確程度下對總體進行推斷和分析;關(guān)注海量數(shù)據(jù)之間的相關(guān)關(guān)系,而不是強調(diào)數(shù)據(jù)之間的因果聯(lián)系。這些內(nèi)容都無法在現(xiàn)有的教學(xué)體系中體現(xiàn),因此,傳統(tǒng)的專業(yè)教學(xué)體系與大數(shù)據(jù)時代是脫節(jié)的。
(四)實踐教學(xué)環(huán)節(jié)薄弱
隨著“應(yīng)用型”統(tǒng)計專業(yè)人才培養(yǎng)目標(biāo)的提出,學(xué)校對實踐教學(xué)的重視增強,與過去相比,現(xiàn)有的專業(yè)教學(xué)體系中已經(jīng)增加了實踐教學(xué)環(huán)節(jié)。但是,在大數(shù)據(jù)背景下,實踐教學(xué)仍然是統(tǒng)計學(xué)專業(yè)教學(xué)體系中的薄弱環(huán)節(jié)。主要表現(xiàn)在兩個方面:(1)以模型驅(qū)動為主的實踐教學(xué)模式已不適應(yīng)大數(shù)據(jù)時代的要求。現(xiàn)有的實踐教學(xué)內(nèi)容并不是從數(shù)據(jù)出發(fā),而是通過尋求一些適合模型的數(shù)據(jù)來“證明”這個模型的確有意義。這種思維方式與大數(shù)據(jù)時代的要求是不適應(yīng)的,因為創(chuàng)造模型的目的是適應(yīng)現(xiàn)實數(shù)據(jù),而不是由模型驅(qū)動。(2)以SPSS、Eviews為主的軟件教學(xué)已無法處理大數(shù)據(jù)。現(xiàn)有的實踐教學(xué)中,主要講授的是傳統(tǒng)的統(tǒng)計分析軟件SPSS和Eviews,因為這兩種軟件發(fā)展成熟,操作簡單,可以處理一般的計量模型和時間序列。但是,大數(shù)據(jù)時代數(shù)據(jù)是海量的、復(fù)雜的,用簡單的軟件已無法處理和實施。
三、統(tǒng)計學(xué)專業(yè)教學(xué)體系改革的方向
根據(jù)以上分析,時代的發(fā)展對統(tǒng)計學(xué)專業(yè)提出了更高的要求,現(xiàn)有的教學(xué)體系中存在的各種問題即為統(tǒng)計學(xué)專業(yè)教學(xué)體系改革的方向。
(一)準(zhǔn)確定位統(tǒng)計學(xué)專業(yè)的人才培養(yǎng)目標(biāo),重新設(shè)計主干課程的教學(xué)內(nèi)容
大數(shù)據(jù)時代要求培養(yǎng)“復(fù)合型”統(tǒng)計專業(yè)人才,因此教學(xué)體系的培養(yǎng)目標(biāo)要從簡單的“應(yīng)用型”向“復(fù)合型”轉(zhuǎn)變?!皬?fù)合型”統(tǒng)計專業(yè)人才要求學(xué)生除了具備數(shù)據(jù)收集、處理和分析的能力外,還要對統(tǒng)計學(xué)應(yīng)用領(lǐng)域的背景知識有一定的了解。因此,按這個培養(yǎng)目標(biāo),需要對現(xiàn)有教學(xué)體系中的主干課程重新進行調(diào)整和設(shè)計。專業(yè)主干課程分為方法和應(yīng)用兩個方面。方法類的課程除了原有的計量經(jīng)濟學(xué)、時間序列分析、多元統(tǒng)計分析等外,又增加了機器學(xué)習(xí)、模擬算法、數(shù)據(jù)挖掘、R軟件分析(或SAS軟件分析)等處理復(fù)雜大數(shù)據(jù)的方法的課程。應(yīng)用類課程在保留原有的國民經(jīng)濟核算,金融統(tǒng)計,證券投資,會計學(xué)基礎(chǔ)外,增加一些統(tǒng)計學(xué)應(yīng)用領(lǐng)域的基礎(chǔ)知識課程,例如商業(yè)統(tǒng)計、生物統(tǒng)計、保險與精算統(tǒng)計等。此外,適當(dāng)調(diào)整各專業(yè)主干課程的課時,一些課程可以增加課時,如軟件分析、數(shù)據(jù)挖掘等,一些課程可以縮減課時,僅作一些簡單的介紹,如抽樣技術(shù)等。
(二)轉(zhuǎn)變固有的思維方式,在大數(shù)據(jù)背景下積極推進教學(xué)改革
大數(shù)據(jù)時代,數(shù)據(jù)更多、更雜,傳統(tǒng)統(tǒng)計學(xué)思維方式受到了極大的挑戰(zhàn)。因此,以大數(shù)據(jù)為背景,轉(zhuǎn)變固有的思維方式,從以統(tǒng)計技術(shù)方法為中心轉(zhuǎn)換到以信息數(shù)據(jù)為中心,推進統(tǒng)計學(xué)專業(yè)教學(xué)改革十分重要。具體來說,可以弱化傳統(tǒng)的推理論證的教學(xué)模式,強化數(shù)據(jù)收集、數(shù)據(jù)處理和數(shù)據(jù)分析的能力培養(yǎng);強調(diào)數(shù)據(jù)本身的價值,讓數(shù)據(jù)說話,用簡單的方法了解數(shù)據(jù)背后所隱藏的信息和規(guī)律;使用項目式訓(xùn)練,讓學(xué)生從項目中真正體驗數(shù)據(jù)化處理的整個過程,達到理論和方法的結(jié)合;加強課堂教學(xué)與實驗教學(xué)的統(tǒng)一和貫通,如在傳統(tǒng)的教學(xué)過程中,將統(tǒng)計學(xué)原理、多元統(tǒng)計分析結(jié)合SPSS軟件介紹,而時間序列分析又采用Eviews進行介紹,造成學(xué)生疲于學(xué)習(xí)各種軟件,實際上SAS、R等統(tǒng)計軟件可以實現(xiàn)所有的功能,用一種軟件與課堂教學(xué)融合貫通能幫助學(xué)生更好更深地掌握軟件的使用。
(三)創(chuàng)新實踐教學(xué)模式,加強實踐教學(xué)的開展
從以模型驅(qū)動的實踐教學(xué)模式轉(zhuǎn)變?yōu)橐詳?shù)據(jù)驅(qū)動的教學(xué)模式,構(gòu)造課堂案例教學(xué)、實驗教學(xué)、課后項目式訓(xùn)練、校外實習(xí)基地鍛煉四位一體的創(chuàng)新型實踐教學(xué)模式。計算機快速發(fā)展的今天使得大數(shù)據(jù)成為現(xiàn)實,在處理數(shù)據(jù)的時候,根據(jù)數(shù)據(jù)的特征創(chuàng)造出新的計算方法來滿足實際需要,這就是數(shù)據(jù)驅(qū)動模式。在實踐教學(xué)的過程中,要強調(diào)統(tǒng)計數(shù)據(jù)、計算機編程以及統(tǒng)計分析軟件的結(jié)合。目前,R軟件和SAS軟件顯示出了強大的數(shù)據(jù)處理和數(shù)據(jù)分析功能,實踐教學(xué)環(huán)節(jié)中可以把這兩種中的一種融入到專業(yè)課程中去,將計算機軟件與課堂教學(xué)結(jié)合起來。此外,課后的項目式訓(xùn)練和校外實習(xí)可以帶動學(xué)生了解和掌握整個數(shù)據(jù)分析實踐的流程,激發(fā)學(xué)生學(xué)習(xí)的興趣,在實踐教學(xué)的過程中要多鼓勵、多開展。
摘 要:大數(shù)據(jù)對于統(tǒng)計學(xué)的影響日趨加深,促使負擔(dān)著培育數(shù)據(jù)采集的統(tǒng)計學(xué)教育也面臨著嚴(yán)峻的挑戰(zhàn),為了和新的外部趨勢相適應(yīng),統(tǒng)計教育應(yīng)該主動進行改革。然而,對于大數(shù)據(jù)會給統(tǒng)計學(xué)帶來什么挑戰(zhàn),統(tǒng)計學(xué)在新形勢下怎樣變革,卻很少有人給予關(guān)注,文章從大數(shù)據(jù)和統(tǒng)計學(xué)的聯(lián)系和差異、大數(shù)據(jù)對統(tǒng)計學(xué)的挑戰(zhàn)和新形勢下統(tǒng)計學(xué)的改革三個方面來討論這一問題。
關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計學(xué);新形勢
大數(shù)據(jù)是互聯(lián)網(wǎng)時代的新型產(chǎn)物,這一理念是在一九八零年由美國的未來學(xué)家埃爾夫托夫勒提出的。到了二十一世紀(jì),隨著互聯(lián)網(wǎng)技術(shù)的普及和運用,全世界的數(shù)據(jù)量大概每2年翻一倍,這說明人類在最近兩年產(chǎn)生的數(shù)據(jù)量等同于以往產(chǎn)生數(shù)據(jù)量的總和。大數(shù)據(jù)雖然在我國發(fā)展較晚,但是從起步之后就一直蓬勃發(fā)展,尤其是最近幾年,新的大數(shù)據(jù)采集、發(fā)掘、儲存、探析類企業(yè)和組織逐漸建成,大數(shù)據(jù)在我國各行各業(yè)的使用日趨廣泛,遍及信息、金融、商品銷售等行業(yè)。
一、大數(shù)據(jù)和統(tǒng)計學(xué)之間的聯(lián)系和差異
統(tǒng)計教育是以統(tǒng)計學(xué)理論和統(tǒng)計學(xué)在相應(yīng)領(lǐng)域的使用為主的教育內(nèi)容,所以想要分析大數(shù)據(jù)時代統(tǒng)計學(xué)教育所面對的挑戰(zhàn)和改革,首先應(yīng)該搞清大數(shù)據(jù)和統(tǒng)計學(xué)二者的概念,明白兩者之間的聯(lián)系和差異。
大數(shù)據(jù)和統(tǒng)計學(xué)之間是有密切聯(lián)系的。首先,大數(shù)據(jù)雖然是通過巨型數(shù)據(jù)采集構(gòu)成,構(gòu)成主要涵蓋非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),和通常結(jié)構(gòu)化數(shù)據(jù)不一樣,但是它的根本依然沒有離開數(shù)據(jù)的屬性,統(tǒng)計學(xué)依然可以把大數(shù)據(jù)看做探究的主要方面。第二,大數(shù)據(jù)對于數(shù)據(jù)的通常處理過程是:搜集―統(tǒng)計解析―發(fā)掘―找到需要的信息,而統(tǒng)計活動的主要順序則是:統(tǒng)計設(shè)計―數(shù)據(jù)采集―數(shù)據(jù)整理―數(shù)據(jù)解析―發(fā)現(xiàn)數(shù)量聯(lián)系和規(guī)律,二者對于數(shù)據(jù)的處理方式在某些方面雖然有部分差異,但是基本過程也有很多相似的地方。第三,一方面統(tǒng)計學(xué)為大數(shù)據(jù)的研究提供基本方式,比如大量的觀察、數(shù)據(jù)分組、相關(guān)解析等也是分析大數(shù)據(jù)的主要方式,另一方面因為在大數(shù)據(jù)探究和處理過程中應(yīng)該借助新的信息技術(shù),所以大數(shù)據(jù)的發(fā)展在很大范圍里提升了統(tǒng)計學(xué)探究設(shè)施和方式,使現(xiàn)代信息設(shè)備和互聯(lián)網(wǎng)技術(shù)在統(tǒng)計學(xué)的使用更加廣泛。
大數(shù)據(jù)和統(tǒng)計學(xué)的主要差別體現(xiàn)在探究目標(biāo)、數(shù)據(jù)處理對象和解析技藝上。大數(shù)據(jù)通過發(fā)現(xiàn)數(shù)據(jù)機遇和數(shù)據(jù)價值,尋求數(shù)據(jù)回報為最終目標(biāo),數(shù)據(jù)所觸及的范圍比較寬泛,運用遍布互聯(lián)網(wǎng)、經(jīng)濟分析、財產(chǎn)管理、商業(yè)投資和醫(yī)療器械等方面,處理的數(shù)據(jù)主要是海量、全面性的非架構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)。然而統(tǒng)計學(xué)以發(fā)現(xiàn)數(shù)據(jù)后映射物體的自身關(guān)聯(lián)和規(guī)律為目的,處理的數(shù)據(jù)主要為數(shù)量不大的結(jié)構(gòu)化數(shù)據(jù),使用概率論、非全面調(diào)查、抽樣推斷和相應(yīng)回歸解析等數(shù)理統(tǒng)計理論為探究方式。所以,相對于統(tǒng)計學(xué),大數(shù)據(jù)不但在技術(shù)和工具的運用里更為全面和智能,和互聯(lián)網(wǎng)技術(shù)的聯(lián)結(jié)的也變的十分緊密,而且在所處理的數(shù)據(jù)種類和探究目標(biāo)上都和統(tǒng)計學(xué)有所區(qū)別。
二、大數(shù)據(jù)時代給統(tǒng)計學(xué)帶來的挑戰(zhàn)
大數(shù)據(jù)和統(tǒng)計學(xué)雖然密切相關(guān),但是兩者在探究目標(biāo)、數(shù)據(jù)處理和解析設(shè)備方面卻有著很大的不同,人類步入信息時代之后,隨著非結(jié)構(gòu)化、半結(jié)構(gòu)化的大數(shù)據(jù)的比例急速上漲,互聯(lián)網(wǎng)技術(shù)在數(shù)據(jù)采集和處理中的運用日漸寬泛,大家對數(shù)據(jù)價值和數(shù)據(jù)回報的追求更加猛烈。怎樣汲取大數(shù)據(jù)探究里的價值理論,使受教育者把握良好、先進、適用的數(shù)據(jù)搜集、解析和處理的技術(shù)。在大數(shù)據(jù)時代統(tǒng)計教育將會面對的挑戰(zhàn)主要表現(xiàn)為以下幾點。
(一)對教育內(nèi)容的挑戰(zhàn)
當(dāng)下統(tǒng)計學(xué)專業(yè)教育內(nèi)容主要是概率論和數(shù)理統(tǒng)計、抽樣抽查、統(tǒng)計形式和有關(guān)的統(tǒng)計運用學(xué)科,基本以結(jié)構(gòu)化數(shù)據(jù)為主要的處理對象,而對非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)的解析和設(shè)備的運用則觸及很少。然而,依據(jù)大數(shù)據(jù)時代對數(shù)據(jù)處理高端人士素養(yǎng)和技術(shù)的需求,目前統(tǒng)計學(xué)的內(nèi)容已經(jīng)不可以滿足非結(jié)構(gòu)和半結(jié)構(gòu)的海量數(shù)據(jù)探究和商業(yè)運用對人才培育的需求。所以,統(tǒng)計學(xué)的教育應(yīng)該看清形勢,以對統(tǒng)計專業(yè)人士的現(xiàn)實需要為核心,不停地提升原來的科目內(nèi)容,開設(shè)新的課程,才可以確保教育內(nèi)容跟上大數(shù)據(jù)時代前行的步伐。
(二)對教育方法的挑戰(zhàn)
目前統(tǒng)計學(xué)教育模式以課堂教育為中心,主要以老師講解為主,注重理論,忽略應(yīng)用,注重方式講解,忽略技能培育,并且教育方式單調(diào),教育方法陳舊,教育組織的合作觀念較弱。所以現(xiàn)在的統(tǒng)計學(xué)教育方法已經(jīng)不適合大數(shù)據(jù)時代對全面性數(shù)據(jù)處理和分析人才的素養(yǎng)需求,應(yīng)該在教學(xué)方法上展開調(diào)適和改革。
(三)對人才培育方式的挑戰(zhàn)
目前統(tǒng)計學(xué)教育方式以給予學(xué)生知識,培育政府、企業(yè)、事業(yè)單位需求的統(tǒng)計任務(wù)人才和學(xué)校、科研組織需求的統(tǒng)計教育和研究人員為主要內(nèi)容和目的,另外大多高校老師綜合素養(yǎng)不夠,本專業(yè)之外的知之甚少,實驗室的建成和設(shè)施的更新速度落后,形成培育出的學(xué)生偏重于公式推導(dǎo)、運算和數(shù)學(xué)模型解析,知識構(gòu)架以數(shù)理認知為主,在經(jīng)濟學(xué)、管理學(xué)、計算機學(xué)等領(lǐng)域的認知較少,知識探究和觀察的目光短淺,解決現(xiàn)實困難的能力不足。大數(shù)據(jù)時代雖然需要統(tǒng)計人才擁有數(shù)據(jù)處理和解析所需求的基礎(chǔ)素養(yǎng)和技術(shù),但是更加側(cè)重它從海量的數(shù)據(jù)里掌控市場機遇,發(fā)現(xiàn)和發(fā)掘商業(yè)價值,為所處行業(yè)制造利益的內(nèi)在潛力、奮發(fā)精神和探究欲望。
三、新形勢下統(tǒng)計學(xué)的改革
信息時代對于統(tǒng)計人員的素質(zhì)提出了更高的需求,統(tǒng)計學(xué)的教育方式也需要進行部分改革。
首先,統(tǒng)計人員應(yīng)該提升對于新技術(shù)的敏感性。因為信息技術(shù)的不斷發(fā)展、不斷更新,這就需要統(tǒng)計人員具備職業(yè)敏感性,及時學(xué)習(xí)和理解新技能,能在大數(shù)據(jù)的環(huán)境下熟練運用專業(yè)技能。其次,統(tǒng)計人員應(yīng)該提升團隊合作意識。作為統(tǒng)計人員不僅要做好本職工作,還要及時了解團隊內(nèi)部各成員的工作進展?fàn)顩r,相互學(xué)習(xí)、互相共享信息資源。最后,統(tǒng)計人員應(yīng)該具備自主創(chuàng)新能力。信息化社會的知識更新十分迅速,統(tǒng)計人員唯有不斷學(xué)習(xí)、不斷革新,才能夠適應(yīng)大數(shù)據(jù)時代的需求。
結(jié)語
大數(shù)據(jù)和統(tǒng)計學(xué)兩者在本質(zhì)、探究目標(biāo)、數(shù)據(jù)處理對象和技能工具等部分,有聯(lián)系也有差異。大數(shù)據(jù)時代的到來不但對統(tǒng)計學(xué)的固定探究方式和價值觀念帶來一定的沖擊,并且致使統(tǒng)計學(xué)教育面對在教師知識結(jié)構(gòu)、教育內(nèi)容、教育方式和人才培育方式等方面的眾多挑戰(zhàn)。所以,為了適應(yīng)大數(shù)據(jù)時代的發(fā)展潮流和培育更加有效、素養(yǎng)更高、適應(yīng)能力更強的統(tǒng)計專業(yè)人才,統(tǒng)計學(xué)教師和統(tǒng)計教育都需要跟上時代,積極做出對應(yīng)的調(diào)整和改革。(作者單位:太原市統(tǒng)計局調(diào)查監(jiān)測中心)
摘 要:隨著我國經(jīng)濟發(fā)展水平的不斷提高,各行各業(yè)得到了顯著發(fā)展,數(shù)據(jù)統(tǒng)計學(xué)方法也變得日趨多樣,數(shù)據(jù)挖掘是建立在數(shù)據(jù)庫與人工智能基礎(chǔ)上發(fā)展起來的一種高新技術(shù),其功能是從眾多的數(shù)據(jù)當(dāng)中挖掘到最有價值的信息,進而實現(xiàn)對數(shù)據(jù)資源的高效利用。聚類分析能夠被當(dāng)成一種數(shù)據(jù)分析工具,能真實反映出數(shù)據(jù)分布情況,本文主要對統(tǒng)計學(xué)在數(shù)據(jù)挖掘中的應(yīng)用進行了探討,從而表現(xiàn)統(tǒng)計學(xué)在數(shù)據(jù)挖掘應(yīng)用中的重要性。
關(guān)鍵詞:統(tǒng)計學(xué)方法;數(shù)據(jù)挖掘;應(yīng)用分析
數(shù)據(jù)挖掘就是指從眾多實際應(yīng)用數(shù)據(jù)中獲取批量大、有噪聲、且隨機性強的數(shù)據(jù),將潛在的信息與數(shù)據(jù)提取出來,就是從數(shù)據(jù)中挖掘有價值的知識,而大多數(shù)原始數(shù)據(jù)具有一定的結(jié)構(gòu)化特征,比如,關(guān)系數(shù)據(jù)庫中的數(shù)據(jù);也可以通過文本、圖形、圖像等半結(jié)構(gòu)化發(fā)掘有用知識,這些知識可以是數(shù)學(xué)的也可以是非數(shù)學(xué)形式的;數(shù)據(jù)挖掘能以歸納形式存在,能夠被廣泛應(yīng)用到信息查詢、信息管理、信息決策控制中,方便數(shù)據(jù)的維護與管理。由此可見,數(shù)據(jù)挖掘是一門交叉性強的學(xué)科,加強對其的研究非常有意義,下面將對統(tǒng)計方法在數(shù)據(jù)挖掘中的具體應(yīng)用進行分析。
一、數(shù)據(jù)挖掘與統(tǒng)計學(xué)的關(guān)系
(一)數(shù)據(jù)挖掘的內(nèi)涵
通常來說,數(shù)據(jù)挖掘的定義較為模糊,沒有明確界定,大部分對其的定義只是停留在其背景與觀點的內(nèi)容上。通過對不同觀點的統(tǒng)一整理,人們最終將其描述為:從大量多樣化的信息中發(fā)現(xiàn)隱晦性、規(guī)律性等潛在信息,并對這些信息進行創(chuàng)造、加工的過程。數(shù)據(jù)挖掘作為一門重要的交叉學(xué)科,能夠?qū)?shù)據(jù)庫、人工智能、機器學(xué)習(xí)、統(tǒng)計學(xué)等眾多的科學(xué)融入到一起,從而實現(xiàn)技術(shù)與理論的創(chuàng)新與發(fā)展[1]。其中,數(shù)據(jù)庫、人工智能與統(tǒng)計學(xué)是數(shù)據(jù)挖掘當(dāng)中的三大支柱理論。數(shù)據(jù)挖掘的目的是從數(shù)據(jù)庫當(dāng)中發(fā)掘各種隱含的知識與信息,此過程的方法非常多,有統(tǒng)計學(xué)知識、遺傳算法、粗集方法、決策法、模糊邏輯法等,還可以應(yīng)用向鄰近的可視技術(shù)、模式識別技術(shù)等,在以上所有技術(shù)的支持上能夠使數(shù)據(jù)挖掘更為科學(xué)、有序。
(二)數(shù)據(jù)挖掘與統(tǒng)計學(xué)間的關(guān)系
通常來說,統(tǒng)計學(xué)的主要功能是對統(tǒng)計原理與統(tǒng)計方法進行研究的科學(xué)。具體來說就是指對數(shù)字資料進行的收集、整理、排序、分析、利用的過程,數(shù)字資料是各種信息的歸納與總結(jié),可以將其作為特性原理的認知、推理方法[2]。而統(tǒng)計學(xué)則表示的是使用專業(yè)的統(tǒng)計學(xué)、概率理論原理等對各種屬性關(guān)系的統(tǒng)計與分析過程,通過分析成功找到屬性間的關(guān)聯(lián)與發(fā)展的規(guī)律。在此過程中,統(tǒng)計分析方法是數(shù)據(jù)挖掘最為重要的手段之一。
在數(shù)據(jù)挖掘這一課題被提出來之前,統(tǒng)計分析技術(shù)對于人們來說更熟悉,也是人們?nèi)粘i_展工作、尋找數(shù)據(jù)間規(guī)律最常使用的方法。但是不能簡單的將數(shù)據(jù)挖掘作為統(tǒng)計學(xué)的延伸與替代工具,而是要將兩者的區(qū)別認識到位,再結(jié)合兩者間的不同特點分析其應(yīng)用特點[3]。大部分的統(tǒng)計學(xué)分析技術(shù)都是建立在數(shù)學(xué)理論與技巧上的,預(yù)測通常較為準(zhǔn)確,效果能夠讓大部分人滿意。數(shù)據(jù)挖掘能夠充分借鑒并吸收統(tǒng)計學(xué)技術(shù),在融入到自身特點以后成為一種數(shù)據(jù)挖掘技術(shù)。
統(tǒng)計學(xué)與數(shù)據(jù)挖掘存在的目標(biāo)都是一致的,就是不斷對數(shù)據(jù)結(jié)構(gòu)進行發(fā)掘。鑒于統(tǒng)計學(xué)與數(shù)據(jù)挖掘在目標(biāo)上的一致性,致使很多研究學(xué)者與專家將數(shù)據(jù)挖掘作為了統(tǒng)計學(xué)的一個分支機構(gòu)[4]。但是這種認知非常不正確,因為數(shù)據(jù)挖掘不僅體現(xiàn)在與統(tǒng)計學(xué)的關(guān)系上還體現(xiàn)在思想、工具與方法上,尤其是在計算機科學(xué)領(lǐng)域?qū)?shù)據(jù)挖掘起到的作用非常大。比如,通過借助數(shù)據(jù)庫技術(shù)與人工智能的學(xué)習(xí),能夠關(guān)注到更多統(tǒng)計學(xué)與數(shù)據(jù)挖掘上的共通點,但是兩者存在的差異依然非常大。數(shù)據(jù)挖掘就是指對大量的數(shù)據(jù)信息不斷挖掘的過程,DM能夠?qū)?shù)據(jù)模式內(nèi)的數(shù)據(jù)關(guān)系進行充分挖掘,并對觀測到的數(shù)據(jù)庫處理有著極高的關(guān)注度。
二、數(shù)據(jù)挖掘的主要過程
從數(shù)據(jù)本身出發(fā)探討數(shù)據(jù)挖掘過程,數(shù)據(jù)挖掘的過程分為信息的收集、數(shù)據(jù)集成、數(shù)據(jù)處理、數(shù)據(jù)變換、數(shù)據(jù)挖掘?qū)嵤┑冗^程。
首先,要將業(yè)務(wù)對象確定下來,明確不同業(yè)務(wù)定義,并認清數(shù)據(jù)挖掘的目的,這是做好數(shù)據(jù)挖掘最關(guān)鍵的一步,也是最重要的一步,雖然挖掘的結(jié)果不能被準(zhǔn)確預(yù)測到,但卻需要對問題的可預(yù)見性進行探索[5]。其次,還要做好數(shù)據(jù)準(zhǔn)備工作,包含數(shù)據(jù)清理、數(shù)據(jù)變換等工作,數(shù)據(jù)清理的實際意義是將噪聲與空缺值補全,針對這一問題,可以使用平滑技術(shù),而空缺值的處理則是屬性中最常見的,可以將統(tǒng)計中最可能出現(xiàn)的值作為一個空缺值[6]。
信息收集指的是按照特定的數(shù)據(jù)分析對象,可以將分析中需要的特征信息抽象出來,并在此基礎(chǔ)上選擇出較為科學(xué)、適合的信息收集方法,將全部的信息全部錄入到特定的數(shù)據(jù)庫中。如果數(shù)據(jù)量較大,則可以選擇一個專門的管理數(shù)據(jù)的倉庫,實現(xiàn)對信息的有效保護與管理;數(shù)據(jù)集成就是指將來源不同、格式不同、性質(zhì)不同、特點不同的數(shù)據(jù)集成到一起,進而為企業(yè)提供更為全面、系統(tǒng)的數(shù)據(jù)共享平臺;數(shù)據(jù)變換就是通過聚集、概化、規(guī)范化等方式對數(shù)據(jù)進行挖掘,對于一些實用數(shù)據(jù),則可以通過分層與分離方式實現(xiàn)對數(shù)據(jù)的轉(zhuǎn)換;數(shù)據(jù)挖掘就是結(jié)合數(shù)據(jù)倉庫中的數(shù)據(jù)信息點,并選擇正確的分析方法實現(xiàn)對有價值數(shù)據(jù)的挖掘,事例推理、規(guī)則推理、遺傳算法等都是應(yīng)用較多的方法[7]。
三、統(tǒng)計學(xué)方法中的聚類分析
在統(tǒng)計學(xué)聚類方法基礎(chǔ)上能夠構(gòu)建出潛在的概率分布假設(shè),可以使用試圖優(yōu)化的方法構(gòu)建數(shù)據(jù)與統(tǒng)計模型的擬合效果?;诮y(tǒng)計學(xué)聚類方法當(dāng)中,Cobweb方法是在1987年由Fisher提出的,能夠以分類樹作為層次聚類創(chuàng)建的方法,在分類樹上,每一個節(jié)點都能代表著一個概念,該方法就是對節(jié)點概率描述的過程。Cobweb方法還使用了啟發(fā)式估算方式,使用分類效用對分類樹的構(gòu)建進行指導(dǎo),從而實現(xiàn)對最高分類的劃分目的,能夠?qū)⒉煌诸悓ο笕繗w類到一個類別中,并依據(jù)這些內(nèi)容創(chuàng)建出一個新的類別。但是這種方法也存在一定局限性,局限性在于假設(shè)的屬性概率分布都是獨立的,并不能始終處于成立狀態(tài)中。
只有在掌握了Cobweb算法以后才能對概念聚類算法的特點進行探究。Cobweb算法能夠以分類樹方式創(chuàng)建層次聚類,可以將概率表現(xiàn)為p(Ai=Vii/Ck)條件概率,其中,Ai=Vij是一個類別下的,同屬于一個值對,Ck是概念類中的一種。在給出一個特定的對象以后,Cobweb能夠?qū)⑷繉ο笳系揭粋€節(jié)點上,從而計算出分類效應(yīng),分數(shù)最高的效用就是對象所在的節(jié)點位置[8]。如果對象構(gòu)建失去節(jié)點,則Cobweb能夠給出一個新的節(jié)點,并對其進行分類使用,這種節(jié)點計算方法起步較晚,能夠?qū)ΜF(xiàn)有的節(jié)點與計算相互對比,從而劃分出最高的分類指標(biāo),將全部對象統(tǒng)一到已有的分類中,從而構(gòu)建出一個新的類別。
Classitci是Cobw eb方法的一種延伸與發(fā)展,能夠使用其完成聚類數(shù)據(jù)的處理,在該方法下,節(jié)點中的每一個存儲屬性都是處于連續(xù)分布狀態(tài)中,能夠?qū)⑵渥鳛榉诸愋Ч拚姆椒?,并以度量的形式表現(xiàn)出來,這種度量基礎(chǔ)上能夠?qū)崿F(xiàn)連續(xù)性的積分,從而降低分散發(fā)生率,該方法是積分過程而不是對屬性的求和過程。
Auto Class方法也是一種應(yīng)用較為普遍的聚類方法,該方法主要采用統(tǒng)計分析對結(jié)果類的數(shù)目進行估算,還可以通過模型搜索方式分析空間中各種分類的可能性,還能夠自動對模型數(shù)量與模型形態(tài)進行描述。在一定類別空間中,不同的類別內(nèi)屬性存在關(guān)聯(lián)性,不同的類別間具有相互繼承性,在層次結(jié)構(gòu)當(dāng)中,共享模型參數(shù)是非常重要的。
還有一種使用較為普遍的模型是混合模型,混合模型在統(tǒng)計學(xué)聚類方法上使用也非常普遍。該方法最為基本的思想就是概率分布決定著每一種聚類狀態(tài),并且模型中的每一個數(shù)據(jù)都是由多個概率在分布狀態(tài)下產(chǎn)生的?;旌夏P瓦€能夠作為一種半?yún)?shù)密度評估方法,其能夠?qū)?shù)估計與非參數(shù)估計的優(yōu)點全部集中到一起,并將參數(shù)估計法與非參數(shù)估價法的諸多優(yōu)點融合到一起,因為模型具有一定復(fù)雜性,為此,不能將其限制在概率密度函數(shù)表達形式上,這種復(fù)雜性決定了模型與求解存在關(guān)聯(lián),與樣本集合的聯(lián)系非常少。通過以上的研究可以了解到,數(shù)據(jù)發(fā)掘中應(yīng)用聚類方法非常有效,并且較為常見。比如,構(gòu)建出Cobweb模型與混合模型,采用Clara與Clarans方法中的抽樣技術(shù),將Denclue方法用在概率密度函數(shù)中。
結(jié)束語
統(tǒng)計學(xué)方法自產(chǎn)生開始已經(jīng)有非常久遠的歷史,將嚴(yán)謹?shù)臄?shù)學(xué)邏輯作為基礎(chǔ),將分類算法假定作為獨立條件,屬性值之前能夠相互保持獨立,對假定進行計算,當(dāng)假定成立時,可以再與其他分類算法進行對比,這種分類算法準(zhǔn)確性非常高。為此,其不僅能夠?qū)B續(xù)值進行預(yù)測,還可以通過線性回歸方程對系數(shù)進行比較,從而歸納出結(jié)果。
摘 要:大數(shù)據(jù)已經(jīng)承成為助力互聯(lián)網(wǎng)+發(fā)展的重要手段,成為創(chuàng)客實現(xiàn)夢想星天地的必要途徑,其已經(jīng)成為我們生活中不可缺少的一部分,大數(shù)據(jù)正在以一種前所未有的態(tài)勢推動著各行各業(yè)的發(fā)展,其蓬勃發(fā)展態(tài)勢也標(biāo)志大數(shù)據(jù)時代的襲來。
關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計學(xué)
大數(shù)據(jù)時代以迅雷不及掩耳之勢席卷世界,在全球范圍內(nèi)掀起了前所未有的數(shù)據(jù)革命浪潮。相對于政府單位的統(tǒng)計數(shù)據(jù)來說,大數(shù)據(jù)主要利用的是多層次、多樣化的數(shù)據(jù)采集方式,整合了多種數(shù)據(jù)的開發(fā)優(yōu)勢,并且利用現(xiàn)代科學(xué)技術(shù)手段和高速處理以及信息架構(gòu)數(shù)據(jù)等資源,兼具極高的使用價值和判斷決策能力。一方面,統(tǒng)計調(diào)查數(shù)據(jù)的多樣化發(fā)展趨勢和電子商務(wù)產(chǎn)業(yè)的不斷發(fā)展,為統(tǒng)計數(shù)據(jù)的使用方式和生產(chǎn)方式制造了不小的麻煩,不斷地挑戰(zhàn)者政府部門數(shù)據(jù)管理系統(tǒng)和統(tǒng)計數(shù)據(jù)的概念。另一方面,信息技術(shù)、網(wǎng)絡(luò)發(fā)展以及空間信息技術(shù)的不斷進步,為統(tǒng)計生產(chǎn)力的升級發(fā)展提供了廣闊的視角和空間。數(shù)據(jù)量急劇增長的電子化、信息化和產(chǎn)業(yè)化數(shù)據(jù),都成為了統(tǒng)計數(shù)據(jù)發(fā)展的重要來源。種類不斷增多的“大數(shù)據(jù)”資源,正在成為政府統(tǒng)計部門利用研究的重要領(lǐng)域。
一、大數(shù)據(jù)與統(tǒng)計學(xué)的區(qū)別
統(tǒng)計知識在大數(shù)據(jù)的利用研究中有多樣化的應(yīng)用形式,主要是對“大數(shù)據(jù)”進行肢解,對爆炸增長的數(shù)據(jù)信息進行搜索、分類以及整合主要依賴于統(tǒng)計學(xué)。因此,大數(shù)據(jù)的相關(guān)研究在一定程度上運用了統(tǒng)計學(xué)的知識。但是,大數(shù)據(jù)的使用尚未被統(tǒng)計學(xué)這門學(xué)科充分利用,這主要是因為大數(shù)據(jù)的運用方式,使用模式和統(tǒng)計學(xué)之間存在著重要差異。統(tǒng)計學(xué)主要利用的是樣本統(tǒng)計資源,樣本主要在根據(jù)既定的概率標(biāo)準(zhǔn)從總體中抽樣調(diào)查,但是隨機抽樣調(diào)查是帶有成本屬性的,例如消耗時間、資本投入的成本等。在樣本數(shù)量逐漸增加的情況下,樣本估計的誤差范圍是伴隨著總體樣本數(shù)量的增大而逐漸增加的,這是樣本統(tǒng)計學(xué)不能忽視的缺點。大數(shù)據(jù)時代最具代表性的就是海量的信息數(shù)據(jù)化以及即時電子商務(wù)信息,大數(shù)據(jù)在整體上呈現(xiàn)出“總體樣本數(shù)據(jù)化”的趨勢,這樣的特征恰好可以補充樣本統(tǒng)計的弊端。大數(shù)據(jù)環(huán)境下的整體樣本統(tǒng)計即使可以囊括全部的樣本容量,但是因為很多情況下數(shù)據(jù)具有非結(jié)構(gòu)性和半數(shù)據(jù)化的特征,而且大量的數(shù)據(jù)資源呈現(xiàn)的是重視尾部分布的狀態(tài),方差、標(biāo)準(zhǔn)差等標(biāo)準(zhǔn)化的方法變得毫無意義,整體依靠性和不穩(wěn)定性經(jīng)常會超越經(jīng)典時間內(nèi)的時間序列的整體假設(shè)性,所以概率論的應(yīng)用范圍呈現(xiàn)狹窄化的發(fā)展趨勢。因此,統(tǒng)計學(xué)在利用大數(shù)據(jù)進行樣本統(tǒng)計的過程中,可以對整體上的數(shù)據(jù)資源進行融合和選擇,這和樣本統(tǒng)計中的數(shù)據(jù)化處理技術(shù)存在異曲同工之妙。
二、大數(shù)據(jù)時代統(tǒng)計學(xué)教育的發(fā)展
1.全面培養(yǎng)人才素質(zhì)
統(tǒng)計學(xué)專業(yè)的學(xué)生需要具備良好與人交往能力。統(tǒng)計學(xué)的學(xué)生很多都是理科出身的學(xué)生,不善于交際。但是在日常的工作中,有數(shù)據(jù)經(jīng)驗的科學(xué)家應(yīng)該經(jīng)常和每個部門的工作人員交流,協(xié)同工作。怎么樣才能讓頗具專業(yè)性的數(shù)據(jù)分析結(jié)果讓普通的老百姓也可以讀懂,讓每個部門的工作人員都能無障礙地理解,這是不容易做到的。要訓(xùn)練自己的交往能力和溝通技能,主動地參加演講活動是不錯的渠道,演講活動鍛煉了演講者的自信,在整個演講的過程中,能否清晰地表達自己的思想以及給人以信服力是至關(guān)重要的。需要培養(yǎng)數(shù)據(jù)常識,廣其見聞。數(shù)據(jù)科學(xué)家經(jīng)常面對各種各樣的海量數(shù)據(jù),并需要從這些數(shù)據(jù)中挖掘出有價值的信息,這就需要數(shù)據(jù)科學(xué)家具有強烈的數(shù)據(jù)敏感性。對數(shù)據(jù)的敏感程度的訓(xùn)練不是一蹴而就的,要經(jīng)過長時間的積累和數(shù)據(jù)分析工作的磨練,同時也可以根據(jù)閱讀數(shù)據(jù)分析材料積累閱歷,提升對數(shù)據(jù)資源的敏感程度。
2.培養(yǎng)應(yīng)用型人才
大數(shù)據(jù)時代培養(yǎng)的數(shù)據(jù)科學(xué)家需要兩方面的基本素質(zhì),第一是概念性,也就前面所說的數(shù)據(jù)科學(xué)家需要掌握的基本素養(yǎng)和專業(yè)知識;第二是實踐性,也就是本文中我們提及的應(yīng)用型人才,也就是實際操作中處理數(shù)據(jù)的能力。在高校開展大數(shù)據(jù)分析研究生學(xué)科,最大的問題是沒有可用的數(shù)據(jù),這就需要高效與大數(shù)據(jù)企業(yè)合作,進行研究生的聯(lián)合培養(yǎng),注重學(xué)生的實際操作能力,這里面涉及到我們的應(yīng)用統(tǒng)計學(xué)專業(yè)碩士的雙導(dǎo)師培養(yǎng)制度,一名校內(nèi)導(dǎo)師一名校外導(dǎo)師,校內(nèi)導(dǎo)師注重學(xué)生的概念性,校外導(dǎo)師注重學(xué)生的實踐性,學(xué)生通過在校外導(dǎo)師單位的實習(xí),從而熟悉并且掌握實際工作中所需要的技能。
3.促進統(tǒng)計與數(shù)學(xué)、計算機學(xué)科合作
“大數(shù)據(jù)”時代需要的海量數(shù)據(jù)分析資源僅僅憑借統(tǒng)計學(xué)科單一學(xué)科的發(fā)展是不能滿足發(fā)展需求的,大數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)性特征已經(jīng)拋棄了傳統(tǒng)意義上的數(shù)據(jù)分析模式的非智能化框架,而且數(shù)據(jù)分析需要利用新型的數(shù)據(jù)運算方式以及計算機技能分析,這也是進行數(shù)據(jù)分析工作的攔路虎。所以,數(shù)據(jù)科學(xué)家的成長僅僅依靠單一的統(tǒng)計學(xué)科知識的學(xué)習(xí)是遠遠不夠的,其需要的是數(shù)學(xué)、計算機和統(tǒng)計學(xué)三門學(xué)科融合發(fā)展,緊密結(jié)合。三門學(xué)科之間交叉發(fā)展,融會貫通,這樣既可以發(fā)揮學(xué)科的優(yōu)勢資源,同時也能彌補其他學(xué)科的弊端。
三、結(jié)語
數(shù)據(jù)信息的爆炸式增長使我們在使用統(tǒng)計數(shù)據(jù)處理信息時需要更多的數(shù)據(jù)資源,更有甚者,在很多情況下可以利用全面化的數(shù)據(jù),數(shù)據(jù)資源不再是制約統(tǒng)計分析的唯一因素,大數(shù)據(jù)前提下的統(tǒng)計學(xué)效用和粘合度預(yù)測的準(zhǔn)確程度不斷提升,而且可以發(fā)現(xiàn)諸多在樣本統(tǒng)計基礎(chǔ)上未能顯現(xiàn)的細節(jié)。統(tǒng)計學(xué)關(guān)鍵優(yōu)勢就是“見微知著”,也是統(tǒng)計學(xué)在數(shù)據(jù)環(huán)境下的約束性妥協(xié)。在海量數(shù)據(jù)洶涌襲來的年代,充分發(fā)揮統(tǒng)計學(xué)的優(yōu)勢,和大數(shù)據(jù)資源整合發(fā)展,實現(xiàn)“以小見大”和“由繁入簡”的有效結(jié)合。
摘 要:文章通過闡述大數(shù)據(jù)及其目的,分析大數(shù)據(jù)與統(tǒng)計學(xué)的對比,對大數(shù)據(jù)對統(tǒng)計學(xué)的挑戰(zhàn)與機遇展開探討研究,旨在為相關(guān)人員基于大數(shù)據(jù)及其目的、大數(shù)據(jù)與統(tǒng)計學(xué)的對比的大數(shù)據(jù)對統(tǒng)計學(xué)的挑戰(zhàn)和機遇研究適用提供一些思路。
關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計學(xué);挑戰(zhàn);機遇;營銷
引言
國際數(shù)據(jù)公司的相關(guān)研究指出,2011年全球數(shù)據(jù)生產(chǎn)量達1.8ZB,且全球信息總量每隔兩年增長一倍[1]。在大數(shù)據(jù)時代下,對于統(tǒng)計學(xué)發(fā)展而言,挑戰(zhàn)與機遇并存,挑戰(zhàn)指的是現(xiàn)階段傳統(tǒng)統(tǒng)計學(xué)相關(guān)方法難以適用大數(shù)據(jù),機遇指的是基于統(tǒng)計學(xué),大數(shù)據(jù)展開數(shù)據(jù)處理、分析,促使大數(shù)據(jù)具備可視化特性。由此可見,研究大數(shù)據(jù)對統(tǒng)計學(xué)的挑戰(zhàn)和機遇有著十分重要的現(xiàn)實意義。
1.大數(shù)據(jù)及其目的
現(xiàn)階段,關(guān)于大數(shù)據(jù)仍舊沒有一個十分明確的界定,大數(shù)據(jù)起初是源自于技術(shù)領(lǐng)域。在信息量不斷擴大的情況下,使得常規(guī)電腦原有存儲空間已不能對新處理數(shù)據(jù)進行承載,新興數(shù)據(jù)處理技術(shù)得以產(chǎn)生,好比雅虎的Hadoop平臺、谷歌的MapReduce等。此類技術(shù)能夠?qū)┗瘜哟谓Y(jié)構(gòu)、一致性予以消除,促進數(shù)據(jù)無需通過常規(guī)數(shù)據(jù)庫表格進行排列,極大程度地提升了人們可處理的數(shù)據(jù)量[1]。
2.大數(shù)據(jù)與統(tǒng)計學(xué)的對比
2.1樣本統(tǒng)計與全樣本統(tǒng)計的區(qū)別
樣本統(tǒng)計屬于統(tǒng)計學(xué)不可或缺的依賴,樣本指的是結(jié)合相應(yīng)的概率自總體中隨機篩選并視作總體代表的集合內(nèi)容,值得一提的是隨機抽樣是需要成本的,包括社會關(guān)系、資金成本或者時間成本等?;跇颖緮?shù)量提升有限前提下,樣本估計誤差會隨著總體數(shù)量增多而增大,這亦是樣本統(tǒng)計無法避免的不足。大數(shù)據(jù)時代下,龐大的數(shù)據(jù)信息應(yīng)運而生,數(shù)據(jù)信息發(fā)展表現(xiàn)出總體即是樣本的態(tài)勢,該屬性很好的消除了樣本統(tǒng)計這一不足。大數(shù)據(jù)時代下的全樣本統(tǒng)計,通常情況下可對完全總體進行覆蓋,然而受大部分數(shù)據(jù)屬于半結(jié)構(gòu)、半結(jié)構(gòu)數(shù)據(jù)影響,使得概率論應(yīng)用遭受一定的制約[2]。鑒于此,將全樣本統(tǒng)計應(yīng)用到統(tǒng)計學(xué)中,應(yīng)當(dāng)就總體數(shù)據(jù)展開相應(yīng)的歸納、篩選,即好比在樣本統(tǒng)計中展開數(shù)據(jù)預(yù)處理。
2.2預(yù)測分析與非預(yù)測分析的區(qū)別
統(tǒng)計學(xué)的創(chuàng)立,是為了對變量相互相關(guān)關(guān)系展開分析,因此獲取數(shù)據(jù)是發(fā)生于變量確定之后的,數(shù)據(jù)分析價值是能夠被預(yù)測的。相較于統(tǒng)計學(xué)的預(yù)測分析,龐大數(shù)據(jù)將互聯(lián)網(wǎng)、傳感器作為載體,存在于分析需求之前,因此構(gòu)建于大數(shù)據(jù)上的分析多為非預(yù)測性分析。在統(tǒng)計學(xué)中,出現(xiàn)大數(shù)據(jù)無法有效應(yīng)用局面,這是由于不具備非預(yù)測分析所需的龐大數(shù)據(jù),龐大數(shù)據(jù)產(chǎn)生與數(shù)據(jù)中心、存儲系統(tǒng)存在緊密的聯(lián)系,并非短期產(chǎn)生。也就是說,統(tǒng)計學(xué)中大數(shù)據(jù)的應(yīng)用發(fā)展,說明了非預(yù)測分析正逐步取代傳統(tǒng)統(tǒng)計學(xué)預(yù)測分析,數(shù)據(jù)多次利用正逐步取代傳統(tǒng)數(shù)據(jù)一次性利用的。
3.大數(shù)據(jù)對統(tǒng)計學(xué)的挑戰(zhàn)與機遇
3.1數(shù)據(jù)生產(chǎn)、處理與應(yīng)用的轉(zhuǎn)變
相關(guān)統(tǒng)計部門經(jīng)開展嚴(yán)格的統(tǒng)計設(shè)計工作,獲得相關(guān)的統(tǒng)計數(shù)據(jù),數(shù)據(jù)的預(yù)處理分別有數(shù)據(jù)清洗、非全面數(shù)據(jù)填補以及數(shù)據(jù)矯正等。大數(shù)據(jù)時代下的統(tǒng)計手段尚不十分明確,自大數(shù)據(jù)流環(huán)境而言,要不斷探索新型抽樣方法,并確保抽樣方法的實時、連貫及可行性。除去傳統(tǒng)的統(tǒng)計分析方法,還應(yīng)當(dāng)開發(fā)大數(shù)據(jù)動態(tài)分析、數(shù)據(jù)流算法等[3]。
3.2大數(shù)據(jù)時代對市場營銷的機遇
3.2.1大數(shù)據(jù)營銷的特點與價值
大數(shù)據(jù)營銷的特點:I.數(shù)據(jù)采集多平臺化特點,即大數(shù)據(jù)時代下,大數(shù)據(jù)的數(shù)據(jù)大多來源于不同的領(lǐng)域、不同的渠道。II.時效性特點,隨著信息技術(shù)的急速發(fā)展,互聯(lián)網(wǎng)用戶消費、購物行為方式往往會瞬間出現(xiàn)轉(zhuǎn)變。國際先進大數(shù)據(jù)營銷企業(yè)AdTime基于此大數(shù)據(jù)營銷特點,采取了時間營銷措施,即采取相應(yīng)的技術(shù)方式全面獲悉用戶所需,于第一時間對用戶當(dāng)下的需求進行回應(yīng),以使用戶在下決心購買的最佳時間及時看到對應(yīng)的產(chǎn)品廣告。III.個性化特點,在大數(shù)據(jù)時代下,廣告商傳統(tǒng)媒體導(dǎo)向的營銷理念逐步由受眾導(dǎo)向取代,現(xiàn)如今,廣告商可應(yīng)用大數(shù)據(jù)了解用戶的地理方位,需求內(nèi)容等信息,達到對用戶個性化營銷的目的。
大數(shù)據(jù)營銷的價值:I.升級營銷與用戶的匹配度,大數(shù)據(jù)營銷不僅可提供給企業(yè)了解用戶有效的途徑,還能夠于網(wǎng)絡(luò)環(huán)境下,選取相關(guān)技術(shù)方法達到對用戶精確定位的目的,從而開展好營銷工作,升級營銷與用戶的匹配度。II.改善用戶體驗,大數(shù)據(jù)營銷促使企業(yè)真正意義上認識到用戶及其所使用企業(yè)產(chǎn)品情況,以給予用戶最人性化的提醒。
3.2.2大數(shù)據(jù)營銷的應(yīng)用
(1)與消費者建立緊密關(guān)系
現(xiàn)如今,我國一些企業(yè)營銷行為仍舊處于個性化定位信息、創(chuàng)意設(shè)計階段,而無法對不同消費者展開個性化的營銷活動。大數(shù)據(jù)時代下,經(jīng)采用相關(guān)數(shù)據(jù)分析技術(shù)方法,基于對消費群體喜好、傳媒接觸習(xí)慣等展開有效的分析,達到特定營銷活動明確開展的目的,實現(xiàn)企業(yè)精心開展的營銷活動精準(zhǔn)的輻射至目標(biāo)消費群體處,與消費者建立緊密關(guān)系,極大的改善營銷效率、質(zhì)量[4]。
(2)掌握競爭對手數(shù)據(jù)
企業(yè)通過對競爭對手數(shù)據(jù)的有效掌握,獲悉競爭對手發(fā)展?fàn)顩r,基于此幫助企業(yè)制定科學(xué)合理的產(chǎn)品價格,提升企業(yè)產(chǎn)品市場競爭優(yōu)勢。與此同時,企業(yè)務(wù)必要全面實施以事實為前提的決策手段,廣泛地應(yīng)用數(shù)據(jù)分析方式對企業(yè)每一個發(fā)展運營步驟進行優(yōu)化,經(jīng)對企業(yè)一系列數(shù)據(jù)的充分優(yōu)化、對接,促使業(yè)務(wù)環(huán)節(jié)中潛在的價值得以被有效挖掘,降低生產(chǎn)成本,知己知彼,促使企業(yè)在日趨白熱化的市場競爭中占據(jù)有利位置。
(3)挖掘企業(yè)內(nèi)部數(shù)據(jù)
“市場未動,數(shù)據(jù)先行”儼然轉(zhuǎn)變?yōu)閲H上企業(yè)有效運營發(fā)展的一致認識,為了提升企業(yè)管理效率,要求企業(yè)要充分挖掘企業(yè)內(nèi)部數(shù)據(jù),并展開有效的整合、分析,以為企業(yè)相關(guān)人員做決策提供有利的參考依據(jù),提升決策準(zhǔn)確性,促進企業(yè)可持續(xù)發(fā)展。
3.2.4 企業(yè)的應(yīng)用案例――以亞馬遜為例
在應(yīng)用大數(shù)據(jù)開展市場營銷方面,美國亞馬遜公司一直處于領(lǐng)先地位。亞馬遜研發(fā)出“用戶未下單,先發(fā)貨”功能,即結(jié)合用戶的購物需求數(shù)據(jù)信息,分析用戶想要購買的產(chǎn)品,達到用戶未下單,提前發(fā)貨的目的。此外,亞馬遜通過對用戶檢索信息的分析,評估流感的傳播,但這僅僅為海量檢索數(shù)據(jù)中的一項用途,相同的數(shù)據(jù)能夠應(yīng)用于預(yù)測大選結(jié)果、預(yù)測某類產(chǎn)品市場行情等等,極大地降低了統(tǒng)計成本[5]。
3.3大數(shù)據(jù)時代對市場營銷的挑戰(zhàn)
3.3.1信息收集
大數(shù)據(jù)并非就是對數(shù)據(jù)信息展開盲目的收集,即便收集了再多的數(shù)據(jù),倘若這些數(shù)據(jù)并非是市場營銷所需要的,如此便會導(dǎo)致前期收集來的數(shù)據(jù)信息,變成一堆“數(shù)據(jù)垃圾”。鑒于此,為了避免這一情況發(fā)生,務(wù)必要充分分析業(yè)務(wù)需求,再對自身存在價值的數(shù)據(jù)展開收集、歸納,如此方可實現(xiàn)大數(shù)據(jù)的有效收集應(yīng)用。
3.3.2經(jīng)驗與數(shù)據(jù)
數(shù)據(jù)采集完畢后,面對參差不齊的數(shù)據(jù),還應(yīng)當(dāng)做好數(shù)據(jù)評估工作,評估對何種目標(biāo)受眾開展市場營銷工作。鑒于此,要求采取科學(xué)合理的手段,將這些參差不齊的數(shù)據(jù)整合成可被市場營銷實踐應(yīng)用的,經(jīng)結(jié)合過去的經(jīng)驗,與采集數(shù)據(jù)進行有機融合,實現(xiàn)對目標(biāo)受眾的有效分析確定。
3.3.3分析與優(yōu)化
數(shù)據(jù)分析,一方面是實現(xiàn)數(shù)據(jù)優(yōu)化,一方面是進行決策層面上的調(diào)整、轉(zhuǎn)變。此環(huán)節(jié)對于專業(yè)人才的需求提出了嚴(yán)苛的挑戰(zhàn)。數(shù)據(jù)分析、數(shù)據(jù)優(yōu)化對于專業(yè)人才的知識框架要求大不相同,這要求相關(guān)企業(yè)不僅要培養(yǎng)專業(yè)的數(shù)據(jù)分析人才,還要打造數(shù)據(jù)優(yōu)化人才隊伍。
3.4大數(shù)據(jù)營銷的未來發(fā)展趨勢
信息技術(shù)不斷發(fā)展,單一媒體導(dǎo)向的“消費者碎片化”儼然無法達到企業(yè)對于數(shù)據(jù)多樣性的需求。大數(shù)據(jù)時代下,媒體的跨界融合實現(xiàn)對“碎片化”受眾的充分聚合。在科學(xué)技術(shù)技術(shù)不斷進步的背景下,跨媒介、跨平臺、跨終端的多途徑將不斷被開拓,將使龐大的數(shù)據(jù)信息獲取多維度的整合,并且在多樣化網(wǎng)絡(luò)環(huán)境下,消費者主觀信息與客觀數(shù)據(jù)有機融合,構(gòu)筑全面用戶數(shù)據(jù)庫環(huán)節(jié),將成為未來大數(shù)據(jù)營銷發(fā)展的必然趨勢[6]。
4.結(jié)束語
總而言之,大數(shù)據(jù)為傳統(tǒng)統(tǒng)計學(xué)帶來了嚴(yán)峻的考驗,也為傳統(tǒng)統(tǒng)計學(xué)有效發(fā)展創(chuàng)造了良好的契機。在大數(shù)據(jù)時展潮流中,我們應(yīng)當(dāng)充分的認識到大數(shù)據(jù)對于傳統(tǒng)統(tǒng)計學(xué)而言,是補充而不是更替,構(gòu)建于樣本統(tǒng)計、預(yù)測分析內(nèi)容上的傳統(tǒng)統(tǒng)計學(xué),仍舊于社會統(tǒng)計、經(jīng)濟分析中占據(jù)著主導(dǎo)位置。大數(shù)據(jù)時代下,為了實現(xiàn)企業(yè)市場營銷的有效開展,相關(guān)人員務(wù)必要不斷專研研究、總結(jié)經(jīng)驗,全面分析大數(shù)據(jù)與統(tǒng)計學(xué)的對比,充分認識大數(shù)據(jù)對統(tǒng)計學(xué)的挑戰(zhàn)和機遇,“與消費者建立緊密關(guān)系”、“掌握競爭對手數(shù)據(jù)”、“挖掘企業(yè)內(nèi)部數(shù)據(jù)”等,積極促進企業(yè)市場營銷的科學(xué)合理化。
摘要:
基于理念分析和比較研究方法,對大數(shù)據(jù)的分析方法和傳統(tǒng)統(tǒng)計學(xué)分析方法的關(guān)聯(lián)性和差異進行了對比分析,從方法的基本思想、量化形式、數(shù)據(jù)來源、分析范式、分析方法、分析視角等角度揭示了兩種社會科學(xué)分析方法存在的聯(lián)系與差異。
關(guān)鍵詞:
大數(shù)據(jù);統(tǒng)計學(xué);研究方法
隨著信息技術(shù)的日益發(fā)展與普及,信息以及數(shù)據(jù)在社會經(jīng)濟發(fā)展過程中發(fā)揮的作用越來越重要?,F(xiàn)如今,“大數(shù)據(jù)”時代已經(jīng)來臨,于是如何更有效地利用數(shù)據(jù)快速做出科學(xué)決策也已成為眾多企業(yè)甚至是國家所共同關(guān)注的焦點問題。在數(shù)據(jù)處理和分析方法方面,《統(tǒng)計學(xué)》以及在其基礎(chǔ)上發(fā)展而來的實證統(tǒng)計方法是當(dāng)前的主流,這些方法可以幫助數(shù)據(jù)持有者從大量的數(shù)據(jù)中挖掘有價值的信息,并為其相關(guān)決策提供理論支撐和方法支持。然而,傳統(tǒng)的實證統(tǒng)計方法在最新出現(xiàn)的大數(shù)據(jù)情境下,卻呈現(xiàn)出了諸多缺陷,例如傳統(tǒng)數(shù)據(jù)收集方法無法實現(xiàn)大規(guī)模(甚至是總體)數(shù)據(jù)的收集,傳統(tǒng)統(tǒng)計方法和分析軟件無法處理大規(guī)模數(shù)據(jù),等等。于是,在將傳統(tǒng)統(tǒng)計學(xué)方法應(yīng)用于最新的大數(shù)據(jù)情境和問題之前,需要首先明確大數(shù)據(jù)所要求的處理方法與傳統(tǒng)的統(tǒng)計學(xué)處理方法存在哪些關(guān)聯(lián)和區(qū)別,然后才能夠決定是否可以應(yīng)用既有統(tǒng)計學(xué)理論和方法來處理某些大數(shù)據(jù)問題。
1大數(shù)據(jù)的界定
根據(jù)一位美國學(xué)者的研究,大數(shù)據(jù)可以被定義為:it means data that’s too big, too fast, or too hard for existing tools to process。也就是說,該學(xué)者認為:在關(guān)于大數(shù)據(jù)的所有定義中,他傾向于將之定義為那類“太大”、“太快”,或現(xiàn)存工具“太難”處理的數(shù)據(jù)。一般而言,大數(shù)據(jù)的特征可以概括為四個V:一是量大(Volume);二是流動性大(Velocity),典型的如微博;三是種類多(Variety),多樣性,有結(jié)構(gòu)化數(shù)據(jù),也有半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù);四是價值大(Value),這些大規(guī)模數(shù)據(jù)可以為持有企業(yè)或者組織創(chuàng)造出巨大的商業(yè)或社會價值。
Victor在其最新著作《大數(shù)據(jù)時代――生活、工作與思維的大變革》中指出,大數(shù)據(jù)時代,思維方式要發(fā)生3個變革:第一,要分析與事物相關(guān)的所有數(shù)據(jù),而不是依靠分析少量數(shù)據(jù)樣本;要總體,不要樣本。第二,要樂于接受數(shù)據(jù)的紛繁復(fù)雜,而不再追求精確性。第三,不再探求難以捉摸的因果關(guān)系,應(yīng)該更加注重相關(guān)關(guān)系。這些變革反映出了大數(shù)據(jù)處理方式與傳統(tǒng)統(tǒng)計學(xué)分析方法的很多關(guān)聯(lián)以及主要不同。因此,下面我們分別針對兩者的聯(lián)系和區(qū)別進行討論。
2大數(shù)據(jù)與統(tǒng)計學(xué)分析方法的聯(lián)系
從18世紀(jì)中葉至今,統(tǒng)計學(xué)已經(jīng)經(jīng)歷了兩百多年的發(fā)展歷程,不論是基礎(chǔ)理論還是社會應(yīng)用都極其堅實而豐富。大數(shù)據(jù)作為一種新興的事物規(guī)律認知和挖掘思維,也將會對人類的價值體系、知識體系和生活方式產(chǎn)生重要影響,甚至引發(fā)重大改變。作為兩種認知世界和事物規(guī)律的基本方法,它們在以下兩個方面存在緊密關(guān)聯(lián)。
(1)挖掘事物規(guī)律的基本思想一致。統(tǒng)計學(xué)(statistics)探索事物規(guī)律的基本方法是:通過利用概率論建立數(shù)學(xué)模型,收集所觀察系統(tǒng)的數(shù)據(jù),進行量化分析和總結(jié),做出推斷和預(yù)測,為相關(guān)決策提供依據(jù)和參考。對于大數(shù)據(jù),維克托指出,大數(shù)據(jù)思維的來臨使人類第一次有機會和條件,在非常多的領(lǐng)域和非常深入的層次獲得和使用全面數(shù)據(jù)、完整數(shù)據(jù)和系統(tǒng)數(shù)據(jù),深入探索現(xiàn)實世界的規(guī)律,獲取過去不可能獲取的知識。通過這兩個定義可以看出,不論是傳統(tǒng)的統(tǒng)計學(xué)方法還是新興的大數(shù)據(jù)分析方法,都是以數(shù)據(jù)為基礎(chǔ)來揭示事物特征以及發(fā)展趨勢的。
(2)均采用量化分析方式。大數(shù)據(jù)分析的基礎(chǔ)是數(shù)據(jù)化,也就是一種把各種各樣現(xiàn)象轉(zhuǎn)變?yōu)榭芍票矸治龅牧炕问降倪^程。不論是傳統(tǒng)統(tǒng)計學(xué)中所應(yīng)用的數(shù)據(jù)(定性和定量數(shù)據(jù)),還是大數(shù)據(jù)時代即將被轉(zhuǎn)化和采用其他形式數(shù)據(jù)(如文字、圖像等),最終都是通過量化分析方法來揭示數(shù)據(jù)中所蘊含的事物特征與發(fā)展趨勢。
3大數(shù)據(jù)與統(tǒng)計學(xué)分析方法的區(qū)別
(1)基礎(chǔ)數(shù)據(jù)不同。在大數(shù)據(jù)時代,我們可以獲得和分析更多的數(shù)據(jù),有時候甚至可以處理和某個特別現(xiàn)象相關(guān)的所有數(shù)據(jù),而不再依賴于隨機抽樣。這意味著,與傳統(tǒng)統(tǒng)計學(xué)數(shù)據(jù)相比,大數(shù)據(jù)不僅規(guī)模大,變化速度快,而且數(shù)據(jù)來源、類型、收集方法都有根本性變化。
①在數(shù)據(jù)來源方面,在大數(shù)據(jù)背景下,我們需要的紛繁多樣的數(shù)據(jù)可以分布于全球多個服務(wù)器上,因此我們可以獲得體量巨大的數(shù)據(jù),甚至是關(guān)于總體的所有數(shù)據(jù)。而統(tǒng)計學(xué)中的數(shù)據(jù)多是經(jīng)由抽樣調(diào)查而獲得的局部數(shù)據(jù),因此我們能夠掌握的事“小數(shù)據(jù)量”。這種情況下,因為需要分析的數(shù)據(jù)很少,所以必須盡可能精確的量化我們的數(shù)據(jù)。綜上,大數(shù)據(jù)情況下,分析人員可以擁有大量數(shù)據(jù),因而不需要對一個現(xiàn)象刨根問底,只需要掌握事物大體的發(fā)展方向即可;然而傳統(tǒng)的小數(shù)據(jù)情況下則需要十分注意所獲得數(shù)據(jù)的精確度。
②在數(shù)據(jù)類型與收集方面,在既往模式下,數(shù)據(jù)的收集是耗時且耗力的,大數(shù)據(jù)時代所提出的“數(shù)據(jù)化”方式,將使得對所需數(shù)據(jù)的收集變得更加容易和高效。除了傳統(tǒng)的數(shù)字化數(shù)據(jù),就連圖像、方位、文本的字、詞、句、段落等等,世間萬物都可以成為大數(shù)據(jù)范疇下的數(shù)據(jù)。屆時,一切自然或者社會現(xiàn)象的事件都可以被轉(zhuǎn)化為數(shù)據(jù),我們會意識到本質(zhì)上整個世界都是由信息構(gòu)成的。
(2)分析范式不同。在小數(shù)據(jù)時代,我們往往是假想世界是如何運行的,然后通過收集和分析數(shù)據(jù)來驗證這種假想。也就是說,傳統(tǒng)統(tǒng)計實證分析的基本范式為:(基于文獻)提出理論假設(shè)-收集相關(guān)數(shù)據(jù)并進行統(tǒng)計分析-驗證理論假設(shè)的真?zhèn)?。然而,在不久的將來,我們將會在大?shù)據(jù)背景下探索世界,不再受限制于傳統(tǒng)的思維模式和特定領(lǐng)域里隱含的固有偏見,我們對事物的研究始于數(shù)據(jù),并可以發(fā)現(xiàn)以前不曾發(fā)現(xiàn)的聯(lián)系。換言之,大數(shù)據(jù)背景下,探索事物規(guī)律的范式可以概括為:數(shù)據(jù)觀察與收集――數(shù)據(jù)分析――描述事物特征/關(guān)系。
(3)數(shù)據(jù)分析方法不同。傳統(tǒng)統(tǒng)計學(xué)主要是基于樣本的“推斷分析”,而大數(shù)據(jù)情境下則是基于總體數(shù)據(jù)的“實際分析”,即直接得出總體特征,并可以分析出這些特征出現(xiàn)的概率。
(4)分析視角不同。傳統(tǒng)的實證統(tǒng)計意在弄清事物之間的內(nèi)在聯(lián)系和作用機制,但大數(shù)據(jù)思維模式認為因果關(guān)系是沒有辦法驗證的,因此需要關(guān)注的是事物之間的相關(guān)關(guān)系。大數(shù)據(jù)并沒有改變因果關(guān)系,但使因果關(guān)系變得意義不大,因而大數(shù)據(jù)的思維是告訴我們“是什么”而不是“為什么”。換言之,大數(shù)據(jù)思維認為相關(guān)關(guān)系盡管不能準(zhǔn)確地告知我們某事件為何會發(fā)生,但是它會提醒我們這件事情正在發(fā)生,因此相關(guān)關(guān)系的發(fā)現(xiàn)就可以產(chǎn)生經(jīng)濟和社會價值了。
4結(jié)語
綜上,相對于傳統(tǒng)而言,大數(shù)據(jù)思維主要包括三個重大轉(zhuǎn)變。首先,要分析與某事物相關(guān)的所有數(shù)據(jù),而不是依靠分析捎來能夠的數(shù)據(jù)樣本;其次,研究人員應(yīng)樂于接受數(shù)據(jù)的紛繁復(fù)雜,而不再追求精確性;最后,認知世界的思想發(fā)生了轉(zhuǎn)變,不再探求難以捉摸的因果關(guān)系,轉(zhuǎn)而關(guān)注事物的相關(guān)關(guān)系。以上三個轉(zhuǎn)變構(gòu)成了大數(shù)據(jù)思維的核心。在統(tǒng)計學(xué)的進一步應(yīng)用和發(fā)展完善過程中,需要結(jié)合以上轉(zhuǎn)變所產(chǎn)生的挑戰(zhàn),思考有效的統(tǒng)計學(xué)發(fā)展對策。
摘 要:21世紀(jì),隨著互聯(lián)網(wǎng)和信息技術(shù)的飛快發(fā)展,數(shù)據(jù)正在成為巨大的經(jīng)濟資產(chǎn),成為新世紀(jì)的礦產(chǎn)和資源,為企業(yè)帶來全新的創(chuàng)業(yè)方向、商業(yè)模式和投資機會。21世紀(jì)的學(xué)科不是經(jīng)濟學(xué),也不是醫(yī)學(xué),是統(tǒng)計學(xué)在大數(shù)據(jù)時代的崛起。
關(guān)鍵詞:統(tǒng)計學(xué);大數(shù)據(jù);利用;發(fā)展
統(tǒng)計學(xué)是通過搜索、整理、分析數(shù)據(jù)等手段,以達到推斷所測對象的本質(zhì),甚至預(yù)測對象未來的一門綜合性科學(xué)。其中用到了大量的數(shù)學(xué)及其它學(xué)科的專業(yè)知識,它的使用范圍幾乎覆蓋了社會科學(xué)和自然科學(xué)的各個領(lǐng)域。隨著統(tǒng)計學(xué)發(fā)展的同時,一個大規(guī)模生產(chǎn)、分享和應(yīng)用數(shù)據(jù)的時代正在開啟:大數(shù)據(jù)的真實價值就像漂浮在海洋中的冰山,絕大部分的數(shù)據(jù)都隱藏在表面下等著人類去探索。
1 利用所有的數(shù)據(jù)
在傳統(tǒng)的統(tǒng)計學(xué)中,由于記錄,存儲,分析數(shù)據(jù)的工具不夠好,所以總是傾向于從總體中抽取樣本來分析,因為統(tǒng)計學(xué)的一個目的就是用盡可能少的數(shù)據(jù)來證實可能重大的發(fā)現(xiàn)。統(tǒng)計學(xué)家證明:采樣分析的準(zhǔn)確性隨著采樣隨機性的增大而大幅度提高,但是與樣本數(shù)量的增大關(guān)系不大。當(dāng)樣本數(shù)量達到了某個值的時候,從新個體身上得到的信息會越來越少,就同經(jīng)濟學(xué)中的邊際遞減效應(yīng)一樣。
在大數(shù)據(jù)時代,不使用隨機分析的方法,而是采用所有的數(shù)據(jù)。即“樣本=總體”。統(tǒng)計抽樣其實只是為了在技術(shù)受限的特定時期,解決當(dāng)時存在的一些特定問題而產(chǎn)生的。慢慢的,就會拋棄樣本分析。
2 接受不精確
對小數(shù)據(jù)而已,統(tǒng)計學(xué)已經(jīng)可以把數(shù)據(jù)處理的很好了,但是在大數(shù)據(jù)時代,太多的數(shù)據(jù)使原始統(tǒng)計方法捉襟見肘,因為數(shù)據(jù)量的大增會使得結(jié)果不太精確。執(zhí)迷于精確性是信息缺乏時代和模擬時代的產(chǎn)物,只有接受不精確性才能進入我們從未涉足的鄰域。接受不精確是從“小數(shù)據(jù)”到“大數(shù)據(jù)”的重要轉(zhuǎn)變之一。因為擁有更大的數(shù)據(jù)量所帶來的利益遠遠超過增加一點精確性,所以也就能夠接受不精確的存在了。要想得到大規(guī)模數(shù)據(jù)帶來的好處,混亂應(yīng)該是一種標(biāo)準(zhǔn)途徑,而不應(yīng)該是盡量避免。
3 追求相關(guān)關(guān)系而不是確定因果
在小數(shù)據(jù)時代,相關(guān)關(guān)系也是有的。統(tǒng)計分析的目的在于如何根據(jù)統(tǒng)計數(shù)據(jù)確定變量之間的關(guān)系形態(tài)及其關(guān)聯(lián)的程度,并探索其內(nèi)在的數(shù)量規(guī)律。人們在實踐中發(fā)現(xiàn),變量之間的關(guān)系分為兩種:函數(shù)關(guān)系和相關(guān)關(guān)系。相關(guān)與回歸是處理變量之間的一種統(tǒng)計方法。變量之間存在的不確定的數(shù)量關(guān)系,稱為相關(guān)關(guān)系。一般來說,可以用散點圖和相關(guān)系數(shù)來描述和測度相關(guān)關(guān)系。
相關(guān)關(guān)系的核心是量化兩個數(shù)據(jù)之間的數(shù)理關(guān)系,它沒有絕對,只有可能性。大數(shù)據(jù)的相關(guān)分析法更準(zhǔn)確,更快,而且不易受偏見的影響。知道是什么就夠了,沒必要知道是什么。通過探求“是什么”而不是“為什么”,相關(guān)關(guān)系幫我們更好的了解這個世界。如果凡事皆有因果的話,那么我們就沒有決定任何事的自由了。
4 數(shù)據(jù)的來源并非那么簡單
在一般看來,要想得到一些你所需要的數(shù)據(jù)是需要通過各種不同方法測量或是記錄才能得到,而有時候,數(shù)據(jù)會從你意想不到的地方得到。也許你精心地設(shè)計了你的實驗或是探究,但是到了真正操作才會發(fā)現(xiàn)事情并不像你想象的那么簡單。
首先,由于在大數(shù)據(jù)時代,數(shù)據(jù)不是那么的有規(guī)律,所以才要考慮數(shù)據(jù)的一系列問題。這些數(shù)據(jù)或是資料是不是一定要自己去得到,或是可以參考別人已經(jīng)有過的結(jié)果,這樣可以節(jié)省精力和時間。如果是參考別人的數(shù)據(jù)要考慮時效性和使用范圍。也許不是專門為你的設(shè)想而準(zhǔn)備的數(shù)據(jù)。大的數(shù)據(jù)庫有著小數(shù)據(jù)庫所沒有的價值,大數(shù)據(jù)的核心就是挖掘出大的數(shù)據(jù)庫所擁有的獨特的價值。
5 數(shù)據(jù)的利用方式
在統(tǒng)計學(xué)中,對數(shù)據(jù)的利用不僅包括對數(shù)據(jù)求平均值,方差,分位點,可以的話還要得到數(shù)據(jù)中的某種關(guān)系或是聯(lián)系,如父母的身高會不會對下一代產(chǎn)生影響,不僅要分析父母的身高,還要分析孩子的身高,從中發(fā)現(xiàn)有沒有相關(guān)關(guān)系,得出自己的結(jié)論。
在大數(shù)據(jù)時代,數(shù)據(jù)沒這么簡單的讓你下手,所以對數(shù)據(jù)的利用方法也隨著情況的不同而不同。數(shù)據(jù)的用途已經(jīng)從基本的用途移動到了二級用途,使得數(shù)據(jù)隨著時間的推移而變得更有價值。明白了隱藏在冰山下面的絕大部分數(shù)據(jù)的價值后,創(chuàng)新型企業(yè)就能夠提取其潛在價值并獲得潛在的巨大收益。盡管如此,數(shù)據(jù)再利用的重要性還沒有被充分認識到。要解鎖這些數(shù)據(jù),就必須通過新一代統(tǒng)計人員的不懈努力并借助新一代的方法和工具。
隨著大數(shù)據(jù)的出現(xiàn),數(shù)據(jù)的總和比部分更有價值。將數(shù)據(jù)的總體組合在一起,重組組合本身的價值也比單個更大。如果決定使用有生產(chǎn)價值的數(shù)據(jù),就需要不斷的更新數(shù)據(jù)庫并淘汰無用的信息。即使數(shù)據(jù)基于基本用途的價值會減少,但潛在價值卻仍然強大。潛在的數(shù)據(jù)價值需要通過創(chuàng)新的分析來釋放。不出意外,給數(shù)據(jù)的潛在價值貼上價格標(biāo)簽會帶來無限商機。
6 小結(jié)
個人認為統(tǒng)計學(xué)和數(shù)據(jù)挖掘一起可以更好的利用數(shù)據(jù)。一個可以對數(shù)據(jù)進行有效合理的分析,一個可以用多種多樣的算法來更好地處理數(shù)據(jù)。在大數(shù)據(jù)時代,重要的是數(shù)據(jù)自身和大數(shù)據(jù)的思維觀念。如果能做到數(shù)據(jù),技能和思維三者具備,就能更好地服務(wù)于大數(shù)據(jù)時代,就能在大數(shù)據(jù)時代有非常大的競爭優(yōu)勢。
摘 要:廣泛使用電算化處理統(tǒng)計數(shù)據(jù)的今天,學(xué)習(xí)統(tǒng)計學(xué)而不會使用統(tǒng)計學(xué)軟件,在實際工作應(yīng)用中寸步難行,本文從教材的選用;強化理論基礎(chǔ),重視實踐技能;培養(yǎng)學(xué)生職業(yè)能力,激發(fā)學(xué)生學(xué)習(xí)興趣等方面對大數(shù)據(jù)背景下高職院校統(tǒng)計學(xué)運用SPSS軟件研究進行了探討。
關(guān)鍵詞:大數(shù)據(jù);高職院校;統(tǒng)計學(xué);spss軟件
在2014年11月下《科技風(fēng)》雜志上發(fā)表了“大數(shù)據(jù)背景下高職院校統(tǒng)計學(xué)的學(xué)習(xí)現(xiàn)狀研究”, 對大數(shù)據(jù)背景下統(tǒng)計學(xué)在我國高職院校開設(shè)的現(xiàn)狀及存在的問題進行了剖析,通過調(diào)查研究發(fā)現(xiàn),目前在大數(shù)據(jù)背景下,高職院校開設(shè)的統(tǒng)計學(xué)課程運用SPSS軟件的應(yīng)用已成為必然。
1 教材的選用
總所周知,《統(tǒng)計學(xué)》課程是高職院校財經(jīng)類專業(yè)的學(xué)生中開設(shè)的一門公共專業(yè)基礎(chǔ)課程,也是學(xué)生工作后實際應(yīng)用比較廣泛的一門學(xué)科,小到自己的日常生活,大到工作都離不開統(tǒng)計數(shù)字,靠傳統(tǒng)的手工計算辦法早就行不通了,特別是互聯(lián)網(wǎng)的應(yīng)用,大數(shù)據(jù)背景下,如何在眾多的信息中篩選出有用的信息,在學(xué)生學(xué)習(xí)的過程中教材和軟件是必不可少的。
目前,統(tǒng)計學(xué)――基于SPSS系列教材,高等教育出版社、中國人銀民大學(xué)出版社等都出版過本科、研究生使用的教材,專門為高職院校財經(jīng)類的學(xué)生使用而出版的統(tǒng)計學(xué)教材很少,目前,通過多方面調(diào)查,筆者認為比較適合高職院校選用的是人民郵電出版社的《SPSS統(tǒng)計分析實用教程》,由謝蕾蕾、宋志剛、何旭洪主編,2013年出版。這本教材以SPSS16.0為基礎(chǔ),詳細介紹了多種常用統(tǒng)計分析方法的原理和實踐技能。全書分為十一章,主要內(nèi)容包括SPSS簡介;變量、數(shù)據(jù)文件、系統(tǒng)參數(shù);統(tǒng)計描述;統(tǒng)計圖制作;均值比較和T檢驗;方差分析;相關(guān)分析;回歸分析;聚類分析和判別分析;因子分析和非參數(shù)檢驗等,結(jié)合實際問題詳細介紹使用SPSS解決這些問題的步驟和結(jié)果。
這本教材克服了在選用傳統(tǒng)統(tǒng)計學(xué)教材時,只注重理論知識講授,死記硬背公式。學(xué)生們對統(tǒng)計計算不在望而生畏,對復(fù)雜的統(tǒng)計公式及數(shù)字計算,由于軟件的使用變得簡單了。因此,現(xiàn)在高職院校的學(xué)生必須要學(xué)習(xí)使用spss軟件,教材是學(xué)生學(xué)習(xí)過程中不可缺少的,選好教材尤為重要。
2 強化理論基礎(chǔ),重視實踐技能
2.1 轉(zhuǎn)變教學(xué)觀念,理論引導(dǎo)下,重點強調(diào)應(yīng)用
統(tǒng)計學(xué)是一門實踐性較強的學(xué)科,學(xué)生既要掌握扎實的基礎(chǔ)理論知識,也要熟練運用各種計算工具,才能具備高超的解決實際工作中問題的能力。這樣,必須對傳統(tǒng)的高職統(tǒng)計學(xué)課程進行改革。我們學(xué)校在講授這門課時,介紹統(tǒng)計的基本理論、基本概念、基本方法的同時,側(cè)重對統(tǒng)計軟件使用的講解,很好的將二者有機結(jié)合起來,做到學(xué)以至用。
2.2 以企業(yè)為依托,實現(xiàn)校企共育
全面建立和完善“校企共育”的人才培養(yǎng)模式,主動順應(yīng)黃河三角洲高效生態(tài)經(jīng)濟區(qū)和山東半島藍色經(jīng)濟區(qū)發(fā)展帶來的產(chǎn)業(yè)結(jié)構(gòu)優(yōu)化升級和企業(yè)崗位需求變化,推行“基于工作崗位”系統(tǒng)化課程改革,突出學(xué)生職業(yè)崗位能力的培養(yǎng),增強社會服務(wù)能力,為企、事業(yè)單位提供高素質(zhì)技能型人才。
按照“知能兼?zhèn)洌聵I(yè)為本”的財經(jīng)人才培養(yǎng)要求,以統(tǒng)計職業(yè)崗位要求為目標(biāo),以就業(yè)為導(dǎo)向,打破傳統(tǒng)學(xué)科體系,建立以知識、能力、素質(zhì)并重的課程體系及工學(xué)結(jié)合的校內(nèi)外實踐教學(xué)機制,構(gòu)建符合統(tǒng)計職業(yè)培養(yǎng)要求的人才培養(yǎng)模式;采取專職教師“頂崗實踐”和兼職教師“項目指導(dǎo)”相結(jié)合的方式,建設(shè)一支具有優(yōu)秀專業(yè)帶頭人、品質(zhì)優(yōu)良、專兼結(jié)合的“雙師”素質(zhì)教師比例達到95%以上的教學(xué)團隊;確立與職業(yè)要求相適應(yīng)的教學(xué)標(biāo)準(zhǔn),通過課堂教學(xué)與崗位實踐一體化,著力培養(yǎng)學(xué)生的實踐能力、創(chuàng)造能力,為spss軟件的應(yīng)用提供了有利條件。
3 培養(yǎng)學(xué)生職業(yè)能力,激發(fā)學(xué)生學(xué)習(xí)興趣
3.1 深入企業(yè)工作崗位,由讓他學(xué)變成我要學(xué)
山東鋁業(yè)職業(yè)學(xué)院依托山東鋁業(yè)公司辦學(xué),山東鋁業(yè)公司隸屬于中國鋁業(yè)公司,是全國成立的首家職業(yè)教育集團,我院的學(xué)生,具有其他院校學(xué)生無可比擬的學(xué)習(xí)優(yōu)勢,我們學(xué)院在學(xué)生學(xué)習(xí)的過程中,為調(diào)動學(xué)生學(xué)習(xí)的積極性,將學(xué)生帶到企業(yè)有關(guān)崗位,如到銷售處,現(xiàn)場看我們的銷售人員如果對收集來的數(shù)據(jù)進行處理、加工、整理到提取出有用的信息,將spss軟件的應(yīng)用過程讓學(xué)生親身體會,企業(yè)導(dǎo)師認真講解、操作示范,激發(fā)了學(xué)生的學(xué)習(xí)興趣。特別是老師們以通俗易懂的語言對統(tǒng)計方法的核心思想進行系統(tǒng)講解,輔助以“操作示意圖”的方式對SPSS軟件的操作進行了詳細介紹,帶領(lǐng)學(xué)生以看圖做題的方式非常簡單方便地學(xué)會用SPSS軟件完成各種統(tǒng)計方法的計算工作,面對眾多數(shù)據(jù),同學(xué)們個個都想試試,看看雜亂無章的初始數(shù)據(jù),在spss軟件的操作下,很快得出自己想要的數(shù)據(jù),真的由讓他學(xué)變成我要學(xué)。
3.2 改革考核辦法,注重職業(yè)能力
隨著統(tǒng)計學(xué)教學(xué)的改革,我們改革了考核辦法,引導(dǎo)教師采用過程考核的方式促進學(xué)生有效學(xué)習(xí)。建立了《山東鋁業(yè)職業(yè)學(xué)院考試管理規(guī)定》和考試模式改革相關(guān)通知和制度,使課程考核方式真實反映學(xué)生完成實際工作任務(wù)能力的最佳方式進行考試。課程考核采用過程考核與結(jié)果考核相結(jié)合、理論考核與實踐考核相結(jié)合的模式,每門課程都進行了考核評價方案設(shè)計。目前我院財經(jīng)專業(yè)以培養(yǎng)職業(yè)能力為核心的教學(xué)方法,得到社會承認,培養(yǎng)的學(xué)生已獲得企業(yè)認可。
綜上所述,在大數(shù)據(jù)時代,高職財經(jīng)學(xué)生spss軟件的應(yīng)用學(xué)習(xí)很好地解決了傳統(tǒng)統(tǒng)計學(xué)理論與實際相脫節(jié)的問題,激發(fā)學(xué)生的學(xué)習(xí)興趣,培養(yǎng)學(xué)生解決實際問題的職業(yè)能力,有利于推動學(xué)生就業(yè)。
【摘要】大數(shù)據(jù)對統(tǒng)計學(xué)的發(fā)展帶來了巨大的機遇與挑戰(zhàn)。文章分析了大數(shù)據(jù)與統(tǒng)計學(xué)之間的基本關(guān)系,并針對大數(shù)據(jù)環(huán)境下的統(tǒng)計學(xué)課程教學(xué)提出了對策與建議。
【關(guān)鍵詞】大數(shù)據(jù) 統(tǒng)計學(xué) 挑戰(zhàn) 機遇 教學(xué)
1.引言
“大數(shù)據(jù)”時代的來臨和“大數(shù)據(jù)”處理技術(shù)的發(fā)展深深的影響著統(tǒng)計學(xué)的發(fā)展。能否利用傳統(tǒng)的統(tǒng)計理論和統(tǒng)計方法對海量的數(shù)據(jù)做出快速、準(zhǔn)確的處理并獲取相關(guān)信息?如何對傳統(tǒng)的統(tǒng)計理論與方法進行改進或探索新的統(tǒng)計理論和方法來對大數(shù)據(jù)進行挖掘與處理以獲取信息?如何在“大數(shù)據(jù)”時代背景下培養(yǎng)符合市場需求的統(tǒng)計分析師或數(shù)據(jù)分析師?如何將“大數(shù)據(jù)”處理技術(shù)融入相關(guān)統(tǒng)計學(xué)課程教學(xué)以促進數(shù)據(jù)處理與分析技術(shù)的發(fā)展?這些都是我們在統(tǒng)計學(xué)相關(guān)課程教學(xué)過程中必須思考的一個問題。
2.大數(shù)據(jù)與統(tǒng)計學(xué)
“大數(shù)據(jù)”隨著社交網(wǎng)絡(luò)、物聯(lián)網(wǎng)、云計算等的興起而產(chǎn)生。一般認為大數(shù)據(jù)具有規(guī)模性、多樣性、實時性及價值性四個基本特征,包含分析、帶寬和內(nèi)容三個要素。“大數(shù)據(jù)”在數(shù)據(jù)來源、數(shù)據(jù)結(jié)構(gòu)和處理方法方面對傳統(tǒng)的統(tǒng)計分析方法產(chǎn)生了沖擊。第一,在大數(shù)據(jù)背景下,數(shù)據(jù)來源不再是原來的簡單抽樣,而是“樣本即總體”,直接將總體作為研究對象。第二,在大數(shù)據(jù)時代,研究對象也不是原來單一的結(jié)構(gòu)化數(shù)據(jù),由于數(shù)據(jù)的多樣化與規(guī)?;覀兏嗟氖茄芯糠墙Y(jié)構(gòu)數(shù)據(jù),采用人工智能來進行數(shù)據(jù)挖掘和信息獲取。第三,數(shù)據(jù)處理方法也不是簡單的采用傳統(tǒng)的假設(shè)檢驗方法進行研究,特別是對于統(tǒng)計學(xué)中的異常點,不再采取以往的丟棄或者平滑處理方式。
“大數(shù)據(jù)”處理技術(shù)對統(tǒng)計學(xué)的發(fā)展提出了巨大挑戰(zhàn),但我們必須認識到學(xué)科之間的發(fā)展是相互交融的,“大數(shù)據(jù)處理技術(shù)”其本質(zhì)上是數(shù)據(jù)處理與分析技術(shù),其發(fā)展對統(tǒng)計學(xué)學(xué)科的發(fā)展也有積極的一面,同時統(tǒng)計學(xué)作為一門獨立的學(xué)科,有其自身獨特的學(xué)科優(yōu)勢。首先,海量的數(shù)據(jù)有利于提高各類統(tǒng)計分析的精度,如減小抽樣誤差等。其次,較之于傳統(tǒng)的統(tǒng)計學(xué)方法,現(xiàn)有的“大數(shù)據(jù)”分析方法難度較大、成本較高、耗時較長。而在實際的應(yīng)用中,我們關(guān)心的不是數(shù)據(jù)量的多少,而是數(shù)據(jù)量所蘊含的信息。傳統(tǒng)的統(tǒng)計學(xué)分析方法是以較少的數(shù)據(jù)進行精確度相對較高的統(tǒng)計分析,這是“大數(shù)據(jù)”分析所無法替代的。另一方面,統(tǒng)計學(xué)在數(shù)據(jù)收集方法、模型選擇、模型假設(shè)以及模型診斷方面有很大優(yōu)勢。而且并不是所有的問題都具有海量的數(shù)據(jù),并不是每一個“大數(shù)據(jù)”問題都適合用現(xiàn)有的“大數(shù)據(jù)處理技術(shù)”來處理。
3.對策與建議
3.1 夯實基礎(chǔ)教學(xué)
針對以上的分析我們可以看出,大數(shù)據(jù)對統(tǒng)計學(xué)的發(fā)展既是機遇,又是挑戰(zhàn)。因此我們在教學(xué)過程中要夯實統(tǒng)計學(xué)基礎(chǔ)知識的教學(xué),講清楚統(tǒng)計學(xué)的基本原理與基本方法,特別是數(shù)據(jù)分析與數(shù)據(jù)處理的基本原理與方法。對于許多傳統(tǒng)領(lǐng)域,如生物、醫(yī)藥以及質(zhì)量與可靠性工程等,我們面對的多是“小數(shù)據(jù)”而不是大數(shù)據(jù),因此基于樣本的統(tǒng)計分析方法仍然是進行此類問題研究的最有效的科學(xué)手段。
另一方面,我們要結(jié)合大數(shù)據(jù)技術(shù)的特點,對統(tǒng)計學(xué)的基本知識進行拓展教育,引導(dǎo)學(xué)生思考怎樣將已有的統(tǒng)計學(xué)基本原理與方法運用到大數(shù)據(jù)處理的技術(shù)研究中。如在大數(shù)據(jù)環(huán)境下怎樣進行數(shù)據(jù)的收集、篩選與甄別、存儲與分析等,如何分析并厘清可能的數(shù)據(jù)來源與范圍,如何建立相關(guān)指標(biāo)體系并對數(shù)據(jù)進行分類,如何制定或調(diào)整相應(yīng)的統(tǒng)計參考標(biāo)準(zhǔn),以及如何對依靠非傳統(tǒng)數(shù)據(jù)源加工生產(chǎn)的統(tǒng)計數(shù)據(jù)進行規(guī)范的統(tǒng)計推斷等。
隨著大數(shù)據(jù)時代的來臨,各行各業(yè)對具有統(tǒng)計背景知識人才的需求必定越來越多。因此,在統(tǒng)計學(xué)教學(xué)過程中,一定要結(jié)合各專業(yè)的特點,特別是“大數(shù)據(jù)”的特點,切實加強統(tǒng)計學(xué)的基礎(chǔ)知識教學(xué)與拓展教學(xué)。
3.2 加強統(tǒng)計學(xué)專業(yè)軟件教學(xué)
“大數(shù)據(jù)”環(huán)境下,對統(tǒng)計人才需求也發(fā)生了變化。面對海量的數(shù)據(jù)與多樣化的數(shù)據(jù),一名合格的統(tǒng)計人才或數(shù)據(jù)分析人才不單需要良好的統(tǒng)計素養(yǎng)與扎實的統(tǒng)計基礎(chǔ)知識,更需要具有數(shù)據(jù)的存儲與整理能力、計算能力以及數(shù)據(jù)分析與處理能力等。這就要求在教學(xué)過程中,加強統(tǒng)計軟件或數(shù)學(xué)軟件的教學(xué)。
針對傳統(tǒng)的“數(shù)學(xué)證明+手工計算”或“重理論輕專業(yè)統(tǒng)計軟件”的統(tǒng)計學(xué)課程教學(xué)模式,可將統(tǒng)計軟件或數(shù)學(xué)軟件融入課堂教學(xué)并安排一定的課時上機學(xué)習(xí)統(tǒng)計軟件,以此提高學(xué)生數(shù)據(jù)處理能力,加深對統(tǒng)計學(xué)基本原理的理解與掌握。
在加強統(tǒng)計軟件或數(shù)學(xué)軟件,如SPSS、R、SAS以及Matlab的教學(xué)過程中,要擯棄“會軟件的操作即會統(tǒng)計技術(shù)”的思維,要讓學(xué)生真正掌握相關(guān)操作與相關(guān)算法,深入思考算法的實現(xiàn)與相關(guān)理論的應(yīng)用。同時引導(dǎo)學(xué)生思考對“大數(shù)據(jù)處理”的技術(shù)要求,包括數(shù)據(jù)搜集、發(fā)掘、存儲以及計算分析過程中的算法與設(shè)備要求等,引導(dǎo)學(xué)生針對大數(shù)據(jù)進行軟件升級與開發(fā)。
3.3 突出案例教學(xué)與實踐教學(xué)
大數(shù)據(jù)的產(chǎn)生和發(fā)展源于規(guī)模經(jīng)濟問題或超規(guī)模經(jīng)濟問題的研究。每一個大數(shù)據(jù)問題的研究都是與實際經(jīng)濟或社會問題緊密相聯(lián)的,因此,在實際教學(xué)過程中,要突出案例教學(xué)與實踐教學(xué),由易到難,通過案例教學(xué)逐步引入大數(shù)據(jù)的概念以及大數(shù)據(jù)處理的基本技術(shù),提高學(xué)生的分析全局觀以及進行實際數(shù)據(jù)分析與處理的能力。
教學(xué)改革的目的是培養(yǎng)在“大數(shù)據(jù)”時代背景下,符合市場需求的專業(yè)統(tǒng)計人才,而合格的專業(yè)統(tǒng)計人才必須具備良好的統(tǒng)計實踐能力。案例教學(xué)與統(tǒng)計實踐活動是培養(yǎng)學(xué)生統(tǒng)計實踐能力的有效途徑。因此,在教學(xué)過程中,一方面,教師可融合各種與實際問題相關(guān)的案例進行分析和講解,加深學(xué)生對相關(guān)統(tǒng)計理論知識的理解,激發(fā)學(xué)生的學(xué)習(xí)興趣,培養(yǎng)學(xué)生解決實際問題的能力。另一方面,教師可以組織多種形式的課堂或課堂外的統(tǒng)計實踐活動以培養(yǎng)學(xué)生統(tǒng)計實踐。如,指導(dǎo)學(xué)生針對他們感興趣的與經(jīng)濟、社會發(fā)展相關(guān)的統(tǒng)計實際問題展開統(tǒng)計研究,設(shè)計調(diào)查問卷,收集數(shù)據(jù)、整理和分析數(shù)據(jù),撰寫研究報告,實現(xiàn)對實際問題的分析和解決等。
4.結(jié)束語
總之,在“大數(shù)據(jù)”環(huán)境下我們既要積極面對挑戰(zhàn),又要緊緊抓住機遇,切實結(jié)合“大數(shù)據(jù)”的特點和“大數(shù)據(jù)處理技術(shù)”發(fā)展的需求,既加強對傳統(tǒng)的統(tǒng)計學(xué)方法、統(tǒng)計理論的教學(xué),又積極開展 “大數(shù)據(jù)“環(huán)境下的拓展教學(xué),推動統(tǒng)計學(xué)的發(fā)展,在數(shù)據(jù)收集、數(shù)據(jù)分析以及統(tǒng)計制度等方面進行改革和創(chuàng)新。
阿根廷一直被懷疑有低估其通貨膨脹數(shù)據(jù)的嫌疑,以避免為那些與通貨膨脹指數(shù)掛鉤的政府債券支付高利率。希臘和意大利也被指稱在加入歐元區(qū)前對預(yù)算赤字數(shù)據(jù)進行過粉飾,這種做法使希臘政府從投資者處獲得了較低的借款利率。其他一些國家也常被懷疑對增長數(shù)據(jù)進行潤色。這個名單還可以繼續(xù)盤點下去,世界各地許多國家都有因戰(zhàn)略原因而篡改經(jīng)濟數(shù)據(jù)的嫌疑,意在吸引投資者或獲取較低成本的債務(wù)融資。
筆者搜集了100多個國家近20年的國際收支平衡數(shù)據(jù),運用統(tǒng)計學(xué)對這些數(shù)據(jù)進行檢驗。從理論上來說,這些數(shù)據(jù)的首位數(shù)字不應(yīng)呈均勻分布,而應(yīng)出現(xiàn)本福特定律所揭示的特殊分布規(guī)律。根據(jù)本福特統(tǒng)計定律,較小的數(shù)值(比如1、2和3)在首位數(shù)字中出現(xiàn)的頻率應(yīng)當(dāng)比較高數(shù)值的數(shù)字出現(xiàn)的頻率高。
由于任何數(shù)據(jù)只要數(shù)量足夠大即應(yīng)符合本福特定律,因此該定律可用于檢驗自1990年代以來,各國的審計和財務(wù)數(shù)據(jù)是否出現(xiàn)過篡改。我們利用這一方法來檢驗國際收支平衡標(biāo)準(zhǔn)化數(shù)據(jù),發(fā)現(xiàn)一系列的國家都謊報了宏觀經(jīng)濟數(shù)據(jù)。盡管這種方法無法使他們查證某一政府具體在哪一時點了虛假信息,但仍可通過某些特征,例如匯率類型或海外資產(chǎn)頭寸,來對國家進行分類,從中總結(jié)出一定的規(guī)律。
誰是做假賬的家伙?
第一類不符合本福特定律的國家是采用了“固定匯率”機制的國家,在這類國家中,還有一個子類,即允許資本自由流動的那些國家,其公布的經(jīng)濟數(shù)據(jù)的統(tǒng)計分布偏離了本福特定律,與標(biāo)準(zhǔn)的分布差距的幅度尤其大。這些國家都有強大的篡改不良數(shù)據(jù)的誘因,因為其貨幣一旦受到攻擊,就會面臨爆發(fā)經(jīng)濟危機的高風(fēng)險。國際收支平衡對于這些國家來說格外重要,因為投資者可以從國際收支平衡推斷出該國經(jīng)濟的對外失衡程度――例如國家整體借貸需求以及融資構(gòu)成、是否出現(xiàn)熱錢等。這些問題都會影響該國中央銀行在危機狀態(tài)下保衛(wèi)其貨幣的能力。相反,使用浮動匯率制度的國家,其數(shù)據(jù)分布與本福特定律的吻合程度較高。
另一類首位數(shù)字分布異常的國家是那些有“經(jīng)常賬戶赤字”的國家,這類國家同樣有著對經(jīng)濟數(shù)據(jù)進行篡改的強大誘因,使其需要對外偽裝出穩(wěn)健的形象。當(dāng)你向世界其他地區(qū)借款時,你不希望自己看起來很慘。類似地,那些在凈海外資產(chǎn)項目上負債最多的國家,也有著可疑的數(shù)據(jù),可以從中發(fā)現(xiàn)同樣的問題。從地域上來看,一些非洲國家和中東地區(qū)國家的經(jīng)濟數(shù)據(jù)的首位數(shù)字分布也比較引人懷疑,有的拉美國家也是如此。但數(shù)據(jù)篡改實際上是經(jīng)濟誘因問題,而非文化問題。的確,在經(jīng)濟困難時期,國家經(jīng)濟數(shù)據(jù)更易遭到篡改。在2008年的最后一個季度,烏克蘭和斯洛伐克等國家甚至拒絕公開數(shù)據(jù),預(yù)防爆發(fā)貨幣危機,避免使已發(fā)生的貨幣危機進一步惡化。
最后,如果數(shù)據(jù)造假是個普遍現(xiàn)象,那么數(shù)字是否還有意義?在任何情況下,投資者對經(jīng)濟數(shù)據(jù)都會留有戒心,持保留態(tài)度。即使是在環(huán)境比較透明的西方國家,甚至是經(jīng)濟強健的德國,也會對失業(yè)率的定義進行調(diào)整,使政府能夠好看一點的經(jīng)濟數(shù)據(jù)。
(作者為巴黎HEC商學(xué)院經(jīng)濟學(xué)教授)
1 對基線資料進行統(tǒng)計學(xué)分析
搜集資料應(yīng)嚴(yán)密遵守隨機抽樣設(shè)計,保證樣本從同質(zhì)的總體中隨機抽取,除了對比因素外,其他可能影響結(jié)果的因素應(yīng)盡可能齊同或基本接近,以保證組間的齊同可比性。因此,應(yīng)對樣本的基線資料進行統(tǒng)計學(xué)分析,以證明組間的齊同可比性。
2 選擇正確的統(tǒng)計檢驗方法
研究目的不同、設(shè)計方法不同、資料類型不同,選用的統(tǒng)計檢驗方法則不同。例如:2組計量資料的比較應(yīng)采用t檢驗;而多組(≥3組)計量資料的比較應(yīng)采用方差分析(即F檢驗),如果組間差異有統(tǒng)計學(xué)意義,想了解差異存在于哪兩組之間,再進一步做q檢驗或LSD-t檢驗。許多作者對多組計量資料進行比較時采用兩兩組間t檢驗的方法是錯誤的。又如:等級資料的比較應(yīng)采用Ridit分析或秩和檢驗或行平均得分差檢驗。許多作者對等級資料進行比較時采用檢驗的方法是錯誤的。
3 假設(shè)檢驗的推斷結(jié)論不能絕對化
假設(shè)檢驗的結(jié)論是一種概率性的推斷,無論是拒絕H0還是不拒絕H0,都有可能發(fā)生錯誤(Ⅰ型錯誤和Ⅱ型錯誤)。因此,假設(shè)檢驗的推斷結(jié)論不能絕對化。
4 P值的大小并不表示實際差別的大小
研究結(jié)論包括統(tǒng)計結(jié)論和專業(yè)結(jié)論兩部分。統(tǒng)計結(jié)論只說明有無統(tǒng)計學(xué)意義,而不能說明專業(yè)上的差異大小。P值的大小不能說明實際效果的“顯著”或“不顯著”。統(tǒng)計結(jié)果的解釋和表達,應(yīng)說對比組之間的差異有(或無)統(tǒng)計學(xué)意義,而不能說對比組之間有(或無)顯著的差異。P≤0.01比P≤0.05更有理由拒絕H0,并不表示P≤0.01時比P≤0.05時實際差異更大。只有將統(tǒng)計結(jié)論和專業(yè)知識有機地結(jié)合起來,才能得出恰如其分的研究結(jié)論。若統(tǒng)計結(jié)論與專業(yè)結(jié)論一致,則最終結(jié)論也一致;若統(tǒng)計結(jié)論與專業(yè)結(jié)論不一致,則最終結(jié)論需根據(jù)專業(yè)知識而定。判斷被試因素的有效性時,要求在統(tǒng)計學(xué)上和專業(yè)上都有意義。
5 假設(shè)檢驗結(jié)果表達
P值傳統(tǒng)采用0.05和0.01這2個界值,現(xiàn)在提倡給出P的具體數(shù)值和檢驗統(tǒng)計量的具體數(shù)值(小數(shù)點后保留3位有效數(shù)字),主要理由是:①以前未推廣統(tǒng)計軟件之前,需要通過查表估計P值,現(xiàn)在使用統(tǒng)計軟件會自動給出具體的P值和檢驗統(tǒng)計量的具體值(t值、F值、χ2值等)。②方便根據(jù)具體情況判斷問題。例如P = 0.051與P = 0.049都是小概率,不能簡單地斷定P = 0.051無統(tǒng)計學(xué)意義而P = 0.049有統(tǒng)計學(xué)意義。③便于對同類研究結(jié)果進行綜合分析。
6 統(tǒng)計學(xué)符號的使用
統(tǒng)計學(xué)符號的使用應(yīng)按照GB3358-82《統(tǒng)計名詞及符號》的規(guī)定,具體可參閱本刊稿約中的有關(guān)要求。