時空大數(shù)據(jù)支持下的存量規(guī)劃方法論
1.3非監(jiān)督分類與矩陣分解在研究中的使用
分時人口密度數(shù)據(jù)作為曲線類數(shù)據(jù),其自身特點非常適合使用機器學(xué)習(xí)的方法進行非監(jiān)督分類。筆者將數(shù)據(jù)整理為休息日的24小時分時人口數(shù)據(jù)與工作日的24小時分時人口數(shù)據(jù),共48個時刻,結(jié)合20種不同類型POI的數(shù)量,對3層空間尺度的研究單元進行k-means聚類分析。
為了能夠確定k-means中k的取值,筆者對每組數(shù)據(jù)均進行了silhouette檢驗,尋找每組合適的k值,保證在分類過程中,既不會出現(xiàn)因為k值過小而忽略某些特征,也不會出現(xiàn)因為k值過大使得多組分類結(jié)果高度重合的情況。
為了對時間活動的趨勢規(guī)律和地塊人口活動規(guī)模進行進一步區(qū)分,筆者分別使用了歸一化的48個時刻數(shù)據(jù)和未歸一化的數(shù)據(jù)進行非監(jiān)督學(xué)習(xí),使分類結(jié)果更加詳細(xì)。在進行48個時刻的非監(jiān)督分類同時,筆者也嘗試了使用非負(fù)矩陣分解(NMF)的方法,將每個研究單元48個時刻中的特征提取出來,在放大特征的基礎(chǔ)上進行非監(jiān)督分類。
2研究結(jié)果
2.1地塊尺度研究結(jié)果
地塊尺度的分類方法是,采用非負(fù)矩陣分解(NMF)的方法先對歸一化后的48個變量進行降維(降成5維),然后采用k-means聚類的方法對降維之后的5個變量進行聚類。多次進行silhouette檢驗,發(fā)現(xiàn)k=9時,分類精度最高。
從地塊尺度分類結(jié)果圖可以看出,該方法對商務(wù)辦公、商業(yè)商務(wù)混合、商業(yè)識別度最高,對游憩—公園、居住主導(dǎo)、商住混合—居住為主等功能的地塊也有較好的識別度,而混合—居住主導(dǎo)及其他兩類混合類則無法準(zhǔn)確判斷,實際上這3類在五環(huán)內(nèi)的地塊中所占比例非常小,可以說,總體上基于地塊尺度的地塊分類方法具有較高的精度。
地塊尺度分類結(jié)果
除對典型的功能區(qū)有較高的識別度之外,該分類對非典型功能區(qū)中精細(xì)地塊也能有較好的識別。以奧林匹克森林公園所在區(qū)域為例,這塊區(qū)域包括了居住、商業(yè)、辦公、游憩公園等多種類型。
地塊1經(jīng)過機器學(xué)習(xí)識別出的結(jié)果是游憩公園類型,所表現(xiàn)的曲線特征為周末人多、平時人少、高峰在下午14—17點,與人們游憩娛樂的行為習(xí)慣一致,進一步對比百度地圖的結(jié)果,發(fā)現(xiàn)該地塊為奧林匹克森林公園南園所在地,為綠地類型用地。
地塊2經(jīng)過機器學(xué)習(xí)識別出的結(jié)果是商務(wù)主導(dǎo)用地,曲線特征為明顯的周末幾乎無人、平時人多、10—18點長高峰的特征,與人們工作的行為習(xí)慣一致,而在百度地圖中顯示該地塊為京東總部未搬遷之前的辦公所在地,為商務(wù)辦公用地類型。
地塊3識別的結(jié)果是商業(yè)主導(dǎo)的用地類型,曲線表現(xiàn)為周末、平時略突出的雙高峰特征,由于該購物中心為片區(qū)級購物中心,主要服務(wù)周邊居住、辦公的人群,因此商業(yè)特征相較商業(yè)中心不太明顯,但仍表現(xiàn)為商業(yè)主導(dǎo)的特征,而百度地圖上顯示該地塊為漂亮陽光廣場,為商業(yè)服務(wù)業(yè)用地類型。曲線以及地圖實景均驗證了本部分所用分類方法在精細(xì)地塊尺度上具有較高的識別度。
奧林匹克森林公園區(qū)域地塊識別功能、對應(yīng)曲線、實際功能
編輯:lianqi