亚洲激情综合另类男同-中文字幕一区亚洲高清-欧美一区二区三区婷婷月色巨-欧美色欧美亚洲另类少妇

首頁 公文范文 決策樹下房地產(chǎn)市場的數(shù)據(jù)挖掘

決策樹下房地產(chǎn)市場的數(shù)據(jù)挖掘

發(fā)布時(shí)間:2022-03-05 04:47:38

序言:寫作是分享個(gè)人見解和探索未知領(lǐng)域的橋梁,我們?yōu)槟x了1篇的決策樹下房地產(chǎn)市場的數(shù)據(jù)挖掘樣本,期待這些樣本能夠?yàn)槟峁┴S富的參考和啟發(fā),請(qǐng)盡情閱讀。

決策樹下房地產(chǎn)市場的數(shù)據(jù)挖掘

以某知名房地產(chǎn)企業(yè)某商品住宅項(xiàng)目2014~2015年的銷售成交記錄(801條)和訪問接待記錄(865條)為樣本,通過剔除“實(shí)質(zhì)貧數(shù)據(jù)”的客戶人口統(tǒng)計(jì)信息改進(jìn)數(shù)據(jù)集,同時(shí)通過對(duì)已成交購房者按“消費(fèi)狀態(tài)”(即“剛需”“首改”“再改”和“升級(jí)”)進(jìn)行決策樹分類,得到“利益相關(guān)者”和“以投資為導(dǎo)向”兩個(gè)穩(wěn)定的關(guān)鍵變量。以此指導(dǎo)對(duì)訪談數(shù)據(jù)集的分類,發(fā)現(xiàn)購房者在與銷售人員接觸時(shí),首先關(guān)注的是房源的面積大小,而非如價(jià)格、戶型等其他信息,在兼顧精度的同時(shí),發(fā)現(xiàn)可以直接指導(dǎo)人工銷售的知識(shí)規(guī)則。

一、引言

近年來,我國住房消費(fèi)市場不斷發(fā)育成熟,房地產(chǎn)行業(yè)也逐漸積累了大量的客戶信息數(shù)據(jù)。這些房地產(chǎn)交易數(shù)據(jù)與客戶數(shù)據(jù),與宏觀經(jīng)濟(jì)數(shù)據(jù)、房地產(chǎn)供給數(shù)據(jù)以及交易后服務(wù)數(shù)據(jù)一道構(gòu)成了房地產(chǎn)市場的數(shù)據(jù)體系。這些數(shù)據(jù)對(duì)房地產(chǎn)企業(yè)經(jīng)營的各個(gè)環(huán)節(jié),尤其是后端銷售環(huán)節(jié)具有重要意義(李海洋,2017)。但由于房地產(chǎn)交易不同于簡單的網(wǎng)上購物,消費(fèi)者必須借助專業(yè)銷售人員的幫助才能完成交易,而消費(fèi)者與銷售人員之間的信息不對(duì)稱,許多“大數(shù)據(jù)”在交易完成前都無法獲得,因此針對(duì)歷史數(shù)據(jù)的預(yù)測方法就無法使用。如何從這種名義上是大數(shù)據(jù),實(shí)質(zhì)上卻是“貧數(shù)據(jù)”的房地產(chǎn)客戶數(shù)據(jù)中獲得有價(jià)值的信息,使數(shù)據(jù)真正可以應(yīng)用與指導(dǎo)實(shí)踐就成了一個(gè)重要的問題。本文在現(xiàn)有研究和決策樹的成熟模型基礎(chǔ)上,試圖改善這兩個(gè)問題,讓機(jī)器學(xué)習(xí)不僅獲得數(shù)據(jù)分析結(jié)果同時(shí)也獲得知識(shí),并可以將知識(shí)直接服務(wù)于人工房地產(chǎn)銷售業(yè)務(wù)。

二、基于決策樹的市場數(shù)據(jù)挖掘模型構(gòu)建思路

決策樹是一種重要的預(yù)測型數(shù)據(jù)挖掘技術(shù),這種算法主要通過貪婪算法遞歸實(shí)現(xiàn)分類與預(yù)測功能。其系列算法起源于Hunt、Marin和Stone在1966年提出的單概念學(xué)習(xí)系統(tǒng)。Quinlan(1987)提出的ID3算法正式建立了決策樹的算法框架。決策樹分類預(yù)測的實(shí)現(xiàn)流程大致如下:(1)在理解問題的基礎(chǔ)上,對(duì)數(shù)據(jù)進(jìn)行清洗、賦值、標(biāo)準(zhǔn)化等預(yù)處理;(2)進(jìn)一步使用具體決策樹分類方法,利用訓(xùn)練樣本構(gòu)建決策樹,并通過測試集樣本檢驗(yàn)決策樹的效果;(3)根據(jù)結(jié)果調(diào)試相關(guān)參數(shù)與方法改進(jìn)模型。決策樹在標(biāo)準(zhǔn)選擇、改進(jìn)思路和效果評(píng)價(jià)上有著多種不同規(guī)則。目前在許多理論與應(yīng)用研究上,對(duì)模型效果的評(píng)價(jià)主要聚焦于預(yù)測精度。通過設(shè)置代價(jià)系統(tǒng)、改變抽樣機(jī)制等方式,追求相關(guān)問題預(yù)測精度的最大化。但本文參考決策樹在多個(gè)領(lǐng)域的應(yīng)用研究(Liang等,2015;Kretser等,2015;Dhurandhar等,2015)認(rèn)為,除此之外,研究方向還應(yīng)包括:分析樣本數(shù)據(jù)集與生成的數(shù)規(guī)則的關(guān)系、規(guī)則復(fù)雜度與預(yù)測準(zhǔn)確性的折衷等方面。前一個(gè)問題是聯(lián)系決策樹算法與現(xiàn)實(shí)中具體應(yīng)用的橋梁,而后一個(gè)問題則是將單純的分類算法提升到系統(tǒng)科學(xué)的角度進(jìn)行多目標(biāo)的決策體系構(gòu)建。本文即從這兩個(gè)問題出發(fā),首先從研究房地產(chǎn)銷售數(shù)據(jù)的特性,站在從房地產(chǎn)交易的具體情境上分析數(shù)據(jù)的可得性及穩(wěn)定性,以建立適當(dāng)?shù)臄?shù)據(jù)集。此外,鑒于房地產(chǎn)交易的復(fù)雜性,消費(fèi)者必然會(huì)借助專業(yè)銷售人員的幫助完成交易,因此,房地產(chǎn)數(shù)據(jù)挖掘更應(yīng)該對(duì)房地產(chǎn)銷售人員的服務(wù)過程形成協(xié)助。房地產(chǎn)銷售人員在服務(wù)過程中,對(duì)單個(gè)客戶的精準(zhǔn)把握自然是一方面,但在同樣的時(shí)間里用盡可能少的交流,掌握切中購房需求的要害問題,對(duì)更多客戶形成基本正確的判斷,也是其拓展渠道提升業(yè)績的方式。因此本文希望通過數(shù)據(jù)挖掘,得到分類標(biāo)準(zhǔn)穩(wěn)定并易于解釋的決策樹規(guī)則。

三、數(shù)據(jù)分析

(一)數(shù)據(jù)說明與預(yù)處理

本文采用的數(shù)據(jù)包含兩部分,均源自某綜合性知名房地產(chǎn)企業(yè)的數(shù)據(jù)庫,一部分是該企業(yè)在環(huán)渤海地區(qū)某城市一處住宅小區(qū)銷售中心2014年成立以來的商品房住宅銷售成交記錄共801條;另一部分為該銷售中心自成立以來的訪問接待記錄共865條。對(duì)這些一手?jǐn)?shù)據(jù)做進(jìn)一步清洗,在成交數(shù)據(jù)中剔除值缺失、明顯輸入錯(cuò)誤記錄24條,剩余有效記錄777條;以同樣的標(biāo)準(zhǔn)剔除訪問接待記錄中的無效記錄43條,剩余有效記錄823條。成為本文用于挖掘的數(shù)據(jù)集。其中成交數(shù)據(jù)中包括50個(gè)字段,剔除沒有信息含量的“序號(hào)”“組別”“職業(yè)顧問”“樓號(hào)”等字段后。所謂數(shù)據(jù)穩(wěn)定性強(qiáng),是指這類數(shù)據(jù)反映的信息是客觀事實(shí),一般不具有隨意性。如購房人的身份信息家庭信息無法根據(jù)消費(fèi)者的意愿改變,但購房需求的細(xì)節(jié)如戶型、周邊配套設(shè)施等,屬于消費(fèi)者的主觀意愿,本身沒有客觀事實(shí)與之對(duì)應(yīng),也就無穩(wěn)定性可言。數(shù)據(jù)的隱瞞成本,是指消費(fèi)者不披露該信息對(duì)于購房交易而言,是否影響交易的完成與完成質(zhì)量。房地產(chǎn)的銷售人員相對(duì)于消費(fèi)者始終處于信息不對(duì)稱的劣勢地位。消費(fèi)者具有選擇是否披露自身相關(guān)信息的主動(dòng)權(quán)。消費(fèi)者在交易完成前,出于各種原因(家庭安全、隱私保護(hù)等)選擇不披露與房產(chǎn)交易無直接關(guān)聯(lián)的信息,就不會(huì)造成交易上的損失,因而隱瞞成本低。但如果一個(gè)消費(fèi)者在與銷售人員交流時(shí)隱瞞其對(duì)于價(jià)格、戶型或周邊設(shè)施等消費(fèi)需求,這樣的隱瞞將會(huì)對(duì)交易造成直接的影響?;谶@一分析,容易發(fā)現(xiàn):盡管房屋成交后的數(shù)據(jù)集由于產(chǎn)權(quán)登記這一流程,擁有上表中所有字段的信息,但在房地產(chǎn)交易完成之前,銷售人員難以獲得與消費(fèi)者本次購房無直接關(guān)聯(lián)的人口統(tǒng)計(jì)數(shù)據(jù)和其他消費(fèi)習(xí)慣數(shù)據(jù)。因此,在數(shù)據(jù)集中應(yīng)將兩個(gè)門類的數(shù)據(jù)剔除,只保留后兩個(gè)類型做進(jìn)一步分析。在成交數(shù)據(jù)集中,各個(gè)字段均隱瞞成本較高,或如消費(fèi)者信息來源這類信息由于導(dǎo)流渠道的確定性而無法隱瞞,因此均可以作為數(shù)據(jù)挖掘的數(shù)據(jù)集適用。

(二)實(shí)驗(yàn)結(jié)果及分析

基于上述數(shù)據(jù)處理后,在SPSS16.0平臺(tái)上進(jìn)行決策樹分析?;谇罢鹿?jié)的論述,本文以二項(xiàng)分枝,能生成較為簡明的樹規(guī)則CRT分類方法為主要方法,以CHAID為參考方法進(jìn)行分析。針對(duì)所研究的問題,不同于類似銀行信用、航班延誤等預(yù)測,房地產(chǎn)的不同類型客戶各有其價(jià)值與風(fēng)險(xiǎn),剛需消費(fèi)者潛在價(jià)值可能偏低,但需求迫切成交的幾率也大,高端升級(jí)型消費(fèi)者潛在價(jià)值更高,但需求更多元,完成交易的幾率較小。很難說哪類誤判有更大的代價(jià)。因此,本文的分析中不設(shè)置成本偏好的不對(duì)稱性。

1.對(duì)訪談客戶記錄的分析

通過觀察訪談數(shù)據(jù)集可以發(fā)現(xiàn),這一數(shù)據(jù)集建立決策樹模型并分類的問題在于:缺少一個(gè)核心指標(biāo)或組合規(guī)則將消費(fèi)者加以區(qū)分,并以此為“類”對(duì)數(shù)據(jù)集進(jìn)行分類,這與訪談數(shù)據(jù)沒有結(jié)構(gòu)化的設(shè)計(jì)、信息獲得也比較零散有關(guān)。因此,本文首先對(duì)成交數(shù)據(jù)進(jìn)行分析,試圖解決對(duì)客戶需求進(jìn)行分類的“類”以何種規(guī)則確定的問題。

2.對(duì)成交記錄分析

通過對(duì)交易數(shù)據(jù)的觀察發(fā)現(xiàn),消費(fèi)者的住宅消費(fèi)狀態(tài)這一信息具有優(yōu)良特性:首先由于全國建立產(chǎn)權(quán)信息登記制度,消費(fèi)者這一信息基本上屬于確定信息;其次,根據(jù)現(xiàn)行法規(guī),處于不同住宅消費(fèi)狀態(tài)的消費(fèi)者在所適用的稅收、貸款等交易內(nèi)容會(huì)有很大不同,在這一信息上選擇保留,將使自己在交易中蒙受損失。此外,房地產(chǎn)交易是大宗交易,客戶的消費(fèi)次數(shù)不可以直接反映出其財(cái)富水平、交易經(jīng)驗(yàn)等相關(guān)信息,可以作為客戶細(xì)分的變量。因此本文擬對(duì)消費(fèi)狀態(tài)(即剛需、首改、再改、升級(jí))作為客戶細(xì)分的標(biāo)準(zhǔn),進(jìn)行決策樹分類。這一分類規(guī)則有一定的經(jīng)濟(jì)含義,首先婚房與給父母買房,屬于有利益相關(guān)者,這一類需求往往迫切缺乏考慮的余地,因此往往是剛需用戶。而其他客戶中,又以“關(guān)注住宅質(zhì)量”還是“單純?yōu)橥顿Y而購房”加以區(qū)分。已有一套住房的客戶,首次購買改善性住房時(shí)往往更注重房屋升值空間,愿意升值犧牲居住質(zhì)量;而已有多次購房經(jīng)歷的消費(fèi)者,再次購房往往更關(guān)注生活質(zhì)量;而已經(jīng)購買過改善性住房,但其購買住房還沒有達(dá)到升級(jí)標(biāo)準(zhǔn)的再改客戶在分類中并不明顯,是因?yàn)槠浼婢吡耸赘目蛻襞c升級(jí)客戶的特征。此外通過觀察在CRT規(guī)則的右枝第二層可以發(fā)現(xiàn),剛需客戶關(guān)注設(shè)施環(huán)境等問題的比例遠(yuǎn)大于關(guān)注價(jià)格與升值空間,這一點(diǎn)與剛需客戶往往購房自住或給家人居住,同時(shí)該筆交易對(duì)其家庭財(cái)富影響巨大有關(guān)?;谝陨戏治隹芍嫦嚓P(guān)人與投資導(dǎo)向是對(duì)房地產(chǎn)客戶細(xì)分的關(guān)鍵規(guī)則,其他的規(guī)則并不重要,這一點(diǎn)對(duì)房地產(chǎn)的銷售人員如何進(jìn)行溝通有一定指導(dǎo)意義。

3.投資深度重分類與訪談?dòng)涗浽衮?yàn)證

以消費(fèi)狀態(tài)對(duì)客戶細(xì)分的主要規(guī)則是,是否有利益相關(guān)者和是否以投資為導(dǎo)向?;谶@一認(rèn)識(shí),進(jìn)一步對(duì)訪談數(shù)據(jù)集進(jìn)行分析。兩種方法的相互驗(yàn)證表明這樣一個(gè)觀點(diǎn):無論是通過“利益相關(guān)人”還是“質(zhì)量敏感”來分類,對(duì)客戶區(qū)分度最大的因素都是住房面積。這一點(diǎn)不難解釋:當(dāng)客戶主動(dòng)聯(lián)系具體銷售中心接受訪談時(shí),可以斷定其對(duì)于自身經(jīng)濟(jì)條件和諸如學(xué)區(qū)等關(guān)鍵因素均已形成判斷,而所聯(lián)系的樓盤,則恰好是其通過對(duì)自身信息判斷后找出的選項(xiàng),這一點(diǎn)可以啟發(fā)銷售人員,在同客戶溝通時(shí),首先根據(jù)上述判斷,溝通房源本身的戶型面積等問題,可以提高溝通效率。同時(shí)應(yīng)注意,分枝的葉子集形式也有一定的信息含量,應(yīng)注意到:傾向于購買大戶型住宅的客戶主要是“中間層”,“剛需”客戶與“升級(jí)”客戶則有購買小戶型的傾向。

四、結(jié)論與政策建議

由于房地產(chǎn)消費(fèi)者與銷售人員間的信息不對(duì)稱,許多在交易完成前都無法獲得的“大數(shù)據(jù)”被用于數(shù)據(jù)挖掘和預(yù)測,造成“實(shí)質(zhì)的貧數(shù)據(jù)”。本文通過對(duì)房地產(chǎn)銷售數(shù)據(jù)穩(wěn)定性與隱瞞成本的判斷,剔除客戶人口統(tǒng)計(jì)信息,改進(jìn)了數(shù)據(jù)集。同時(shí)通過對(duì)已成交購房者按“消費(fèi)狀態(tài)”進(jìn)行決策樹分類,得到“利益相關(guān)者”和“以投資為導(dǎo)向”兩個(gè)穩(wěn)定的關(guān)鍵變量。以此指導(dǎo)對(duì)訪談數(shù)據(jù)集的分類,發(fā)現(xiàn)購房者在與銷售人員接觸時(shí),首先關(guān)注的是房源的面積大小,而非如價(jià)格、戶型等其他信息。本文在兼顧預(yù)測精度的同時(shí),發(fā)現(xiàn)了可以直接用于指導(dǎo)人工銷售業(yè)務(wù)的知識(shí)規(guī)則,房地產(chǎn)銷售人員可借助以上規(guī)則,提高溝通效率、改善銷售業(yè)績。根據(jù)以上結(jié)論,地方在制定住房政策時(shí),也應(yīng)充分利用數(shù)據(jù)挖掘的技術(shù)及其發(fā)現(xiàn)的知識(shí):一方面,地方政府應(yīng)與房地產(chǎn)企業(yè)建立更加系統(tǒng)的信息共享機(jī)制,建立認(rèn)識(shí)住房需求的信息抓手,以便對(duì)已經(jīng)存在的住宅交易進(jìn)行市場調(diào)節(jié);另一方面,地方政府可進(jìn)一步善用擁有的戶籍等信息,加強(qiáng)對(duì)居民房產(chǎn)需求的理解,進(jìn)而改善區(qū)域內(nèi)房地產(chǎn)開發(fā)的事前規(guī)劃,使市場更加平穩(wěn)有序地發(fā)展。

優(yōu)秀范文
激情内射日本一区二区三区| 国产一级精品色特级色国产| 国产av天堂一区二区三区粉嫩| 黑丝国产精品一区二区| 中日韩美女黄色一级片| 久热久热精品视频在线观看| 好吊日在线观看免费视频| 免费在线观看激情小视频| 日本加勒比不卡二三四区| 日本一本不卡免费视频 | 亚洲国产日韩欧美三级| 国产亚洲欧美另类久久久| 麻豆蜜桃星空传媒在线观看| 成人精品日韩专区在线观看| 精品日韩av一区二区三区| 人人爽夜夜爽夜夜爽精品视频| 成人午夜爽爽爽免费视频| 99久久精品久久免费| 国产精品第一香蕉视频| 高中女厕偷拍一区二区三区| 老司机精品视频在线免费看| 欧美精品久久男人的天堂| 又大又长又粗又黄国产| 欧美熟妇喷浆一区二区| 国产精品成人一区二区三区夜夜夜| 亚洲综合一区二区三区在线| 国产日韩欧美在线播放| 国内欲色一区二区三区| 大香伊蕉欧美一区二区三区| 亚洲高清中文字幕一区二三区| 殴美女美女大码性淫生活在线播放| 国产原创中文av在线播放| 日韩免费av一区二区三区| 欧美午夜一级艳片免费看| 国产成人精品视频一区二区三区| 欧美有码黄片免费在线视频| 成人免费高清在线一区二区| 欧美日韩国产二三四区| 在线日本不卡一区二区| 大屁股肥臀熟女一区二区视频| 国产日产欧美精品大秀|