电竞比分网-中国电竞赛事及体育赛事平台

分享

空間數(shù)據(jù)智能:概念、技術(shù)與挑戰(zhàn)

 漢無為 2022-02-15

僅做學(xué)術(shù)分享,如有侵權(quán),聯(lián)系刪除

轉(zhuǎn)載于 :專知

圖片

 隨著空間數(shù)據(jù)體量的持續(xù)增長,空間數(shù)據(jù)所蘊(yùn)含的價值巨大.傳統(tǒng)的數(shù)據(jù)感知存儲技術(shù)和處理分析方法已然不能充分挖掘海量空間數(shù)據(jù)的價值.因此,空間數(shù)據(jù)智能,一個專注于海量空間數(shù)據(jù)的研究與應(yīng)用的多學(xué)科交叉的領(lǐng)域,正扮演著越來越重要的角色.本文介紹了空間數(shù)據(jù)智能的概念、空間數(shù)據(jù)智能領(lǐng)域所面臨的技術(shù)挑戰(zhàn)及空間數(shù)據(jù)智能的關(guān)鍵技術(shù),同時介紹了空間數(shù)據(jù)智能在社會生活中的典型應(yīng)用場景,最后對空間數(shù)據(jù)智能研究的發(fā)展做出了展望.

https://crad./CN/10.7544/issn1000-1239.20220108

引言

空間數(shù)據(jù)是描述自然地理空間和人類活動空間 所包含的人、物體、事件的信息.通常來說,空間數(shù)據(jù) 具有空間位置信息、時間信息和屬性信息.與土地一 樣,具有空間位置信息的空間數(shù)據(jù)是一個國家擁有 的具有戰(zhàn)略意義的重要資源.我國幅員遼闊、人口眾 多,加上這十多年來快速發(fā)展的數(shù)字化建設(shè),空間數(shù) 據(jù)的現(xiàn)有量級十分巨大.伴隨著各類傳感器和全球 定位系統(tǒng)的更加廣泛使用,諸如遙感數(shù)據(jù)、地圖測 繪、交通軌跡數(shù)據(jù)、手機(jī)信令數(shù)據(jù)、APP打卡數(shù)據(jù)等 空間數(shù)據(jù)將持續(xù)增長,并帶來巨大的價值. 

面對海量異構(gòu)的空間數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)感知存儲技術(shù)和處理分析方法顯然已經(jīng)不適用,亟需對應(yīng) 的科學(xué)技術(shù)的發(fā)展,這正是空間數(shù)據(jù)智能逐漸興起 的原因.空間數(shù)據(jù)智能是利用先進(jìn)通信技術(shù)、人工智 能方法、大數(shù)據(jù)分析、先進(jìn)計算機(jī)技術(shù)等技術(shù)方法對 空間數(shù)據(jù)進(jìn)行更好地感知、采集、分享、管理、分析及 應(yīng)用的一個多學(xué)科交叉的研究領(lǐng)域.空間數(shù)據(jù)智能 旨在通過相關(guān)理論和技術(shù)的突破,充分釋放空間數(shù) 據(jù)的潛在價值,讓海量空間數(shù)據(jù)賦能于各行各業(yè),服 務(wù)于我國經(jīng)濟(jì)社會的發(fā)展. 隨著空間數(shù)據(jù)智能的持續(xù)發(fā)展,空間數(shù)據(jù)智能 逐漸形成了數(shù)據(jù)感知、數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)據(jù)安 全等主要發(fā)展方向,分別專注于數(shù)據(jù)的獲取與感知、 數(shù)據(jù)的存儲與管理、數(shù)據(jù)的加工和深入分析、數(shù)據(jù)的 隱私和安全等方面.

1 空間數(shù)據(jù)智能的挑戰(zhàn)和關(guān)鍵技術(shù) 

1.1 技術(shù)挑戰(zhàn) 

空間數(shù)據(jù)的持續(xù)增長對于空間數(shù)據(jù)智能而言, 既是機(jī)遇又伴隨挑戰(zhàn).空間數(shù)據(jù)智能所面臨的主要 挑戰(zhàn)包括數(shù)據(jù)感知、數(shù)據(jù)分析處理、數(shù)據(jù)應(yīng)用、數(shù)據(jù) 隱私與安全、高精度地圖等方面. 

1) 數(shù)據(jù)感知.如何全方位、高效、實時和可靠地 感知空間數(shù)據(jù),從現(xiàn)有海量的傳感器中收集空間數(shù) 據(jù),打造一個海陸空一體化的空間數(shù)據(jù)體系,是目前 面臨的一個關(guān)鍵挑戰(zhàn).隨著物聯(lián)網(wǎng)的快速發(fā)展,無處 不在的傳感器每天都在高速生產(chǎn)海量的空間數(shù)據(jù), 急需探究一種能夠滿足在不同類型傳感器和碎片化 的數(shù)據(jù)生產(chǎn)過程中實現(xiàn)高效穩(wěn)定采集數(shù)據(jù)的方法. 

2) 數(shù)據(jù)分析處理.如何處理結(jié)構(gòu)復(fù)雜、高維、高 噪音和多源異構(gòu)的海量空間數(shù)據(jù)是目前面臨的一個 主要挑戰(zhàn),傳統(tǒng)的空間數(shù)據(jù)處理技術(shù)已不能滿足現(xiàn)有的實時動態(tài)計算需求,迫切需要構(gòu)建一套具備整 合、清洗、儲存和處理海量空間數(shù)據(jù)的技術(shù)體系. 

3) 數(shù)據(jù)應(yīng)用.面對多源異構(gòu)的海量空間數(shù)據(jù), 如何利用大數(shù)據(jù)、云計算和人工智能等新一代信息 技術(shù)實現(xiàn)數(shù)據(jù)價值的挖掘和分析,并針對不同的應(yīng) 用場景提供個性化、高效、實時和有用的價值服務(wù), 也是目前面臨的一個主要挑戰(zhàn). 

4) 數(shù)據(jù)隱私與安全.如何在充分利用空間數(shù)據(jù) 的價值的同時做好空間數(shù)據(jù)的隱私和安全保護(hù)是一 個非常重大的挑戰(zhàn),空間數(shù)據(jù)直接耦合了大量的位 置信息,關(guān)乎個人隱私和國家安全,因此,做好空間 數(shù)據(jù)的隱私與安全保護(hù)是未來的一個極其重要的研 究工作. 

5) 高精度地圖.現(xiàn)有的位置服務(wù)往往存在精度 低、基準(zhǔn)差異大、延時高、穩(wěn)定性差等痛點,無法滿足 人們對高效精準(zhǔn)的位置服務(wù)的日益增長的需求,特 別是在自動駕駛和出行導(dǎo)航方面,因此迫切需要構(gòu) 建一套具備高精度、統(tǒng)一基準(zhǔn)和實時穩(wěn)定的地圖服 務(wù)體系.

1.2 關(guān)鍵技術(shù) 

1.2.1 時空數(shù)據(jù)庫 

時空數(shù)據(jù)庫旨在存儲與管理同時具備時間和空 間屬性的時空數(shù)據(jù).時空數(shù)據(jù)是包含對象、過程、事 件及其在空間、時間、語義等方面的關(guān)聯(lián)關(guān)系.例如, 對于移動物體,其在移動過程中產(chǎn)生的軌跡數(shù)據(jù)就 屬于時空數(shù)據(jù).因此,時空數(shù)據(jù)庫可以捕捉具有空間 參考的移動對象的運(yùn)動變化,即通過增加時間維度, 將原先的空間數(shù)據(jù)模型擴(kuò)展為時空數(shù)據(jù)模型[1],并 為時空數(shù)據(jù)提供高性能的讀寫和計算服務(wù).根據(jù)時 空數(shù)據(jù)庫的存儲和計算特點,時空數(shù)據(jù)庫可以分為 分布式時空數(shù)據(jù)庫、AI賦能時空數(shù)據(jù)庫、新型硬件 時空數(shù)據(jù)庫等. 

1) 分布式時空數(shù)據(jù)庫.由于 GPS定位設(shè)備的廣 泛普及和移動計算的快速發(fā)展,時空數(shù)據(jù)的規(guī)模呈 爆炸性增長[2],這對大規(guī)模時空數(shù)據(jù)的存儲和處理 帶來了巨大挑戰(zhàn).鑒于此,現(xiàn)有工作提出了基于批式 或流式 分 布 式 處 理 平 臺 (如 Hadoop,Spark,Flink 等)的分布式時空數(shù)據(jù)庫系統(tǒng)[3G5]、分布式時空索引 及更新策略[6]等. 

2) AI賦能時空數(shù)據(jù)庫.時空數(shù)據(jù)的核心價值是 蘊(yùn)含于其中的深層信息∕知識.通過 AI技術(shù)可以捕 獲時空數(shù)據(jù)中隱含知識和數(shù)據(jù)價值,能夠?qū)崿F(xiàn)更加 智能高效的數(shù)據(jù)庫管理與應(yīng)用.為此,現(xiàn)有工作提出了基于神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)型索引[7]、基于強(qiáng)化學(xué)習(xí)的 參數(shù)調(diào)優(yōu)[8]、基于遷移學(xué)習(xí)的基數(shù)估計[9]以及基于 深度學(xué)習(xí)的異常檢測[10]等. 

3) 新型硬件時空數(shù)據(jù)庫.?dāng)?shù)據(jù)庫系統(tǒng)大多依賴 多級內(nèi)存層次結(jié)構(gòu)(如磁盤、主內(nèi)存和多個級別的處 理器緩存),而計算機(jī)硬件與各個級別的設(shè)備都直接 影響到數(shù)據(jù)庫性能.傳統(tǒng)的以 CPU 為計算中心的數(shù) 據(jù)庫技術(shù)面臨“能耗墻,內(nèi)存墻”的限制.近年來,新 型硬件(如 GPU,NPU 等)被廣泛應(yīng)用,借助其高吞 吐、低延遲、易擴(kuò)展的特點以及其與 AI的強(qiáng)交互能 力,新型硬件時空數(shù)據(jù)庫正在快速發(fā)展.例如,現(xiàn)有 工作提出了基于 GPU 的時空數(shù)據(jù)庫系統(tǒng)[11],以提 高時空數(shù)據(jù)的實時查詢能力. 

針對數(shù)據(jù)庫系統(tǒng)的研究,除了需要提供高性能 的讀寫和計算服務(wù)外,還要求數(shù)據(jù)庫在與用戶進(jìn)行交 互時提供高可用性.時空數(shù)據(jù)庫可用性主要體現(xiàn)在為 用戶提供對預(yù)期之外的時空查詢結(jié)果的解釋,滿足用 戶從時空數(shù)據(jù)庫查詢中得到精確和完整查詢結(jié)果的 期望[12G13].現(xiàn)有工作提出了針對反向topGk 查詢的 why和 whyGnot問題處理框架[14]、路網(wǎng)中基于范圍 skyline查詢的 why和 whyGnot問題處理方法[15]、 概率反向skyline查詢的causality與responsibility 計算方法[16]等.

1.2.2 空間感知技術(shù)和時空數(shù)據(jù)挖掘 

空間信息的感知依賴于傳感器技術(shù)和網(wǎng)絡(luò)技 術(shù),是空間數(shù)據(jù)智能的神經(jīng)末梢.然而現(xiàn)實世界是復(fù) 雜多變的,因此需要可靠的、泛在的、實時更新的感 知層收集可靠的時空信息.空間感知技術(shù)可從傳輸 網(wǎng)絡(luò)和接口來分類,根據(jù)網(wǎng)絡(luò)范圍主要分為衛(wèi)星網(wǎng)、 互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和無線傳感網(wǎng)技術(shù)[17]:1)衛(wèi)星網(wǎng)可 以通過航天衛(wèi)星、航天飛機(jī)、無人機(jī)等裝置進(jìn)行衛(wèi)星 定位、對地觀測、地圖繪制,大氣層云圖繪制等;2)互 聯(lián)網(wǎng)通過智能手機(jī)、移動終端、智能穿戴設(shè)備等采集 人的移動性數(shù)據(jù)、社交媒體等;3)物聯(lián)網(wǎng)主要通過工 業(yè)和家用網(wǎng)絡(luò)中常見的 RFID 室內(nèi)外定位,監(jiān)控設(shè) 備,監(jiān)測傳感器等低能耗消耗的傳感器來收集環(huán)境 數(shù)據(jù);4)無線傳感網(wǎng)可將其末段傳感器采集的數(shù)據(jù) 如地震、電磁、溫度、濕度、噪聲、光強(qiáng)度等借助物聯(lián) 網(wǎng),廣域網(wǎng)或者衛(wèi)星網(wǎng)絡(luò)傳輸給網(wǎng)絡(luò)所有者.

由空間感知技術(shù)采集到的多源異構(gòu)時空數(shù)據(jù), 經(jīng)過有效強(qiáng)大的時空數(shù)據(jù)庫存儲和管理,最后由時 空數(shù)據(jù)挖掘技術(shù)來探索發(fā)現(xiàn)數(shù)據(jù)價值并給各類應(yīng)用 提供有力支撐.空間數(shù)據(jù)中的數(shù)據(jù)挖掘技術(shù)進(jìn)行簡單分類如下:1)時空數(shù)據(jù)預(yù)處理方法:軌跡分段和壓 縮、地圖匹配、區(qū)域劃分和缺值補(bǔ)全等;2)傳統(tǒng)的統(tǒng) 計方法:回歸分析、判別分析、因子分析、歷史平均和 自回歸等;3)傳統(tǒng)的機(jī)器學(xué)習(xí)方法:聚類方法、隱空 間模型、條件隨機(jī)場等;4)前沿的機(jī)器學(xué)習(xí)方法:深 度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、元學(xué)習(xí)、遷移學(xué)習(xí)、持續(xù)學(xué)習(xí)和對 比學(xué)習(xí)等;5)可視化方法:時序數(shù)據(jù)可視化、軌跡可 視化、集體趨勢時空可視化、聚類可視化、地圖可視 化和相似性探索可視化等.?dāng)?shù)據(jù)挖掘方法十分豐富, 需要綜合使用多種技術(shù)來挖掘空間數(shù)據(jù)中存在的價 值,為人所用.

1.2.3 時空數(shù)據(jù)安全與隱私 

為了更好地保障用戶對其個人數(shù)據(jù)的使用知情 權(quán)和處理權(quán),歐洲政府于2018年出臺了用戶隱私保 護(hù)政策?通用數(shù)據(jù)保護(hù)條例?(GDPR).中國在3年后 也頒布了?中華人民共和國數(shù)據(jù)安全法?,加快填補(bǔ) 國內(nèi)數(shù)據(jù)安全保護(hù)的空白.其中,由于時空數(shù)據(jù)可以 用于城市規(guī)劃、智能交通和商業(yè)分析等應(yīng)用,并且往 往涉及到公共事件、政策等方面的敏感信息,因此保 障時空數(shù)據(jù)的安全與隱私更是對維護(hù)國家安全有重 要意義.在城市發(fā)展的過程中,依據(jù)空間數(shù)據(jù)的時空 特性,我們認(rèn)為在數(shù)據(jù)采集、數(shù)據(jù)處理和數(shù)據(jù)發(fā)布 3個階段有不同的隱私保護(hù)要求. 

1)數(shù)據(jù)采集.由于設(shè)備和環(huán)境的限制,采集到 的連續(xù)數(shù)據(jù)在空間上和時間上都很強(qiáng)的不確定性[18]. 尤其是個人軌跡數(shù)據(jù)會更加稀疏,因為用戶不會隨 時訪問位置服務(wù)并貢獻(xiàn)數(shù)據(jù).為了保護(hù)這一階段用 戶的隱私,同時得到高質(zhì)量的時空數(shù)據(jù),目前的研究 工作提出了在神經(jīng)網(wǎng)絡(luò)模型中引入注意力機(jī)制[19]; 采用眾感知框架的同時結(jié)合壓縮感知[20]等. 

2)數(shù)據(jù)處理.在挖掘空間數(shù)據(jù)包含大量可用信 息時,安全和隱私面臨的挑戰(zhàn)更加嚴(yán)峻.如果研究者 還是以普通的深度學(xué)習(xí)框架對數(shù)據(jù)進(jìn)行處理,中心 化地處理大規(guī)模的未脫敏數(shù)據(jù),不僅會加重中心服 務(wù)器的負(fù)擔(dān)、浪費(fèi)邊緣計算資源,更重要的是大量用 戶的隱私安全得不到保障.目前,新型的聯(lián)邦學(xué)習(xí)框 架[21]已經(jīng)掀起了一陣研究熱潮,致力于解決深度學(xué) 習(xí)過程中隱私泄露問題.聯(lián)邦學(xué)習(xí)具有極高的可擴(kuò) 展性,并能很好地與其他隱私保護(hù)方法相結(jié)合,例如 同態(tài)加密[22]和差分隱私[23]等密碼學(xué)方法.

3)數(shù)據(jù)發(fā)布.在發(fā)布收集到的原始數(shù)據(jù)或是處 理好的數(shù)據(jù)結(jié)果時,平衡好用戶隱私和數(shù)據(jù)可用性 之間的關(guān)系時非常重要的.常見的方法包括 KG匿名和對數(shù)據(jù)進(jìn)行模糊處理[24],保障了每個用戶的敏感 信息能夠藏匿于打包的數(shù)據(jù)集中.

2 空間數(shù)據(jù)智能的典型應(yīng)用場景 

2.1 城市交通應(yīng)用 

國家“十四五”規(guī)劃進(jìn)一步明確了要大力推進(jìn)智 能交通的發(fā)展,促進(jìn)交通領(lǐng)域的數(shù)字化和智能化提 升.空間數(shù)據(jù)智能技術(shù)是實現(xiàn)智能交通的關(guān)鍵技術(shù), 通過依托無處不在的城市交通時空數(shù)據(jù),借助物聯(lián) 網(wǎng)、移動互聯(lián)網(wǎng)、大數(shù)據(jù)、云計算、人工智能和數(shù)字孿 生等新一代信息技術(shù),可以有效地實現(xiàn)交通時空數(shù) 據(jù)的價值分析和共享,能夠?qū)崟r動態(tài)精準(zhǔn)地提供道 路交通狀態(tài)信息、位置導(dǎo)航服務(wù)、出行客流情況和環(huán) 境天氣關(guān)聯(lián)影響[25],在實現(xiàn)交通智能化管理的同時 也可以進(jìn)一步有效地促進(jìn)自動駕駛和車路協(xié)同系統(tǒng) 的發(fā)展. 未來通過借助空間數(shù)據(jù)智能技術(shù),能夠大大加 快城市交通由信息化向智能化的轉(zhuǎn)型,為廣大乘客、 交通機(jī)構(gòu)和政府部門提供智能化的交通出行和管理 服務(wù).對廣大乘客而言,空間數(shù)據(jù)智能技術(shù)能夠為用 戶帶來精準(zhǔn)的位置服務(wù)和個性化的出行線路規(guī)劃, 為用戶提供舒適便捷的出行服務(wù),同時這也是滿足 了社會在出行過程中對時空服務(wù)日益增長的需求. 對于交通管理機(jī)構(gòu),空間數(shù)據(jù)智能技術(shù)可以幫助其 提升交通管理的效率,有效地解決交通擁堵和交通 事故等問題.與此同時,空間數(shù)據(jù)智能技術(shù)能夠有效 輔助政府部門進(jìn)行交通規(guī)劃、商業(yè)選址和基礎(chǔ)建設(shè) 的相關(guān)決策,加快智能鐵路、智慧機(jī)場、智能公路、智 慧港口和智慧車站的建設(shè),從而進(jìn)一步促進(jìn)智慧城 市的發(fā)展[26]. 

2.2 城市防災(zāi)應(yīng)急 

除了在城市交通上的應(yīng)用外,空間數(shù)據(jù)智能的 另一個主要的應(yīng)用方向為在城市尺度下的防災(zāi)應(yīng)急 應(yīng)用.依據(jù)災(zāi)難發(fā)生的時間,可與將應(yīng)用劃分為三大 類:災(zāi)難發(fā)生前的預(yù)測、災(zāi)難發(fā)生過程中的緊急調(diào) 度、災(zāi)難發(fā)生后的災(zāi)害管理. 1)災(zāi)難發(fā)生前的預(yù)測.通常而言,災(zāi)難可以劃 分為2類,即洪水、臺風(fēng)、地震、泥石流等自然災(zāi)難, 以及車禍、踩踏事件等人為災(zāi)難.這些災(zāi)難絕大部分 都不會毫無預(yù)兆的發(fā)生,在現(xiàn)有的研究中,依據(jù)土壤 類型、降雨量、氣候、海拔、經(jīng)緯度、植被等可以觀測 的空間數(shù)據(jù)進(jìn)行統(tǒng)計分析,包括地震、洪水、臺風(fēng)等災(zāi)難在內(nèi)的自然災(zāi)害都能夠被提前預(yù)知[27],從而提 前做好預(yù)防的準(zhǔn)備,減少突發(fā)的自然災(zāi)難所帶來的 經(jīng)濟(jì)損失.而在2.1節(jié)城市交通應(yīng)用的基礎(chǔ)上所衍 生的交通故障預(yù)測[28],未來的交通擁堵預(yù)測[29]以 及人流的預(yù)測[30]等方向也有著成熟的方法,通過城 市尺度的空間數(shù)據(jù)準(zhǔn)確地預(yù)測了未來的交通、人群 流向,在有政府干預(yù)的前提下,交通事故、踩踏事件 等人為災(zāi)難數(shù)量也能夠得到有效的控制,從源頭遏 止不必要的經(jīng)濟(jì)損失. 2)災(zāi)難發(fā)生時的緊急調(diào)度.在災(zāi)難剛剛發(fā)生的 時候,救援人員難以提前到場,此時受災(zāi)人僅能夠依 靠自己逃離受災(zāi)地點,而不正確的應(yīng)對行為以及撤 離路線通常會引發(fā)二次受災(zāi).在歷史的空間數(shù)據(jù),尤 其是人群過往的軌跡數(shù)據(jù)以及相應(yīng)位置的地理以及 建筑結(jié)構(gòu)數(shù)據(jù)的支持下,目前這一階段較為成熟的 應(yīng)用方向包括了小范圍的突發(fā)狀態(tài)下(例如火災(zāi)現(xiàn) 場)的人群疏散引導(dǎo)[31],以及城市尺度下的重大災(zāi) 難時(例如突發(fā)的地震)的人流方向推導(dǎo)[32].相比于 能夠采集到大量數(shù)據(jù)的災(zāi)前預(yù)測方向以及災(zāi)難后的 災(zāi)害管理方向,災(zāi)難發(fā)生時的應(yīng)用由于缺乏足夠的 數(shù)據(jù)支持,目前還有更多的研究空間. 3)災(zāi)難發(fā)生后的災(zāi)害管理.在2021年7月20日 時,河南省鄭州市連遭暴雨襲擊,同時產(chǎn)生了嚴(yán)重的 內(nèi)澇現(xiàn)象,損失極其嚴(yán)重.但是在災(zāi)后的救援過程之 中,一份收集受災(zāi)人員的空間位置以及受災(zāi)說明的 數(shù)據(jù)的騰訊文檔卻發(fā)揮了極大的作用.在短短1天 內(nèi)其訪問量超過了250萬次,并且據(jù)不完全統(tǒng)計至 少救助了超過85名受災(zāi)群眾.這充分說明了空間數(shù) 據(jù)在災(zāi)難發(fā)生期間能夠發(fā)揮重大的作用.在現(xiàn)有的 研究之中,災(zāi) 后 的 災(zāi) 害 管 理 主 要 以 救 援 路 線 的 規(guī) 劃[33]以及救援物資分配[34]為主.依據(jù)災(zāi)后受災(zāi)人員 的位置,各個地方的受災(zāi)情況進(jìn)行規(guī)劃,從而盡可能 地減少災(zāi)難發(fā)生后的損失.

2.3 傳染病防疫 

基于人群傳播網(wǎng)絡(luò)的傳染病給人類社會帶來了 廣泛的影響,而傳染病的傳播和人的移動息息相關(guān). 通過整合人口遷徙相關(guān)的空間數(shù)據(jù),比如個人 GPS 軌跡、交通軌跡、航班數(shù)據(jù)等,結(jié)合傳染病物理傳播 模型和深度學(xué)習(xí)等方法進(jìn)行建模,空間數(shù)據(jù)智能可 以在疫情預(yù)警、疫情預(yù)測、疫情排查、疫情物資配置 等方面發(fā)揮重要作用. 

1) 空間數(shù)據(jù)智能助力疫情預(yù)警.基于區(qū)域間的 人口流動數(shù)據(jù)建模,可以預(yù)測下一個可能爆發(fā)的疫情區(qū)域[35],為各個地區(qū)提前預(yù)防、防疫政策調(diào)整提供 科學(xué)依據(jù). 

2)空間數(shù)據(jù)智能協(xié)助疫情傳播預(yù)測.在發(fā)生疫 情后,根據(jù)該地區(qū)包括人口遷徙[36]、交通運(yùn)輸[37]在 內(nèi)的空間數(shù)據(jù),進(jìn)行空間數(shù)據(jù)驅(qū)動的預(yù)測模型的建 立及傳播模擬,可以對傳染病的傳播態(tài)勢進(jìn)行預(yù)測, 了解疫情發(fā)展態(tài)勢和峰值時間等,協(xié)助醫(yī)療專家對 疫情發(fā)展做出更加精確的評估,輔助政府部門制定 防疫政策. 

3)空間數(shù)據(jù)智能協(xié)助疫情排查,通過對包括個 人軌跡在內(nèi)的空間數(shù)據(jù)的整合以及密接判定模型的 建立,空間 數(shù) 據(jù) 智 能 方 法 可 以 快 速 鎖 定 密 接 接 觸 者[38].作為一種重要的“技防”,空間數(shù)據(jù)智能可以 讓傳染病排查工作在傳統(tǒng)的流行病學(xué)調(diào)查的基礎(chǔ)上 變得更加高效精準(zhǔn). 

4)空間數(shù)據(jù)智能優(yōu)化疫情物資配給[39].傳染病 爆發(fā)區(qū)域?qū)Ψ揽匚镔Y的需求量大,空間數(shù)據(jù)智能通 過先進(jìn)的計算機(jī)及通信技術(shù)整合各地的物資數(shù)據(jù), 利用算法優(yōu)化物資配置并規(guī)劃派送方案,并結(jié)合對 潛在風(fēng)險區(qū)域的挖掘,協(xié)助防疫物資科學(xué)儲備.

2.4 智慧能源 

為實現(xiàn)“碳達(dá)峰”和“碳中和”的目標(biāo),“十四五” 期間我國將加快能源數(shù)字化轉(zhuǎn)型,建設(shè)清潔低碳、安 全高效的現(xiàn)代智慧零碳能源體系.空間數(shù)據(jù)智能技 術(shù)通過利用物聯(lián)網(wǎng)、云計算、大數(shù)據(jù)、人工智能和5G 等技術(shù),可以實時感知能源領(lǐng)域的時空信息,集成多 種能源(電、煤、石油、天然氣、供冷、供熱等)的生產(chǎn)、 傳輸、存儲、消費(fèi)、交易等時空數(shù)據(jù)于一體[40],建立 能源體系的數(shù)字底座,實現(xiàn)風(fēng)光儲一體化、石油管道 運(yùn)輸規(guī)劃、電力供應(yīng)、綠色能源交易、用戶需求預(yù)測 等能源全生命周期管理環(huán)節(jié)的價值挖掘和分析[41], 構(gòu)建能源價值的一體化智能服務(wù)平臺. 

空間數(shù)據(jù)智能技術(shù)可以大大提升能源領(lǐng)域的數(shù) 字化、自動化和智能化,做到零碳能源智能生產(chǎn),實 現(xiàn)能源的脫碳生產(chǎn)和清潔利用;建立分布式智慧能 源網(wǎng)絡(luò),提高能源的傳輸和利用效率;同時實現(xiàn)多能 協(xié)同供應(yīng)與調(diào)度管理,充分發(fā)揮多種能源相互配合 使用的優(yōu)勢.除此之外,空間數(shù)據(jù)智能技術(shù)還可以提 供能源的智能交易服務(wù),實時高效地滿足供需側(cè)的 多樣化需求;打造低碳車聯(lián)網(wǎng)能源服務(wù),促進(jìn)新能源 汽車的快速發(fā)展,減少道路交通的碳排放和空氣污 染;同時提供一站式園區(qū)智慧能源服務(wù),降低園區(qū)能 耗強(qiáng)度和碳排放強(qiáng)度.因此,空間數(shù)據(jù)智能技術(shù)能夠全面助力能源的數(shù)字化轉(zhuǎn)型,加快雙碳目標(biāo)的實現(xiàn). 

2.5 國土空間規(guī)劃 

國家“十四五”規(guī)劃提出要推進(jìn)完善新型城鎮(zhèn)化 戰(zhàn)略,構(gòu)建國土空間開發(fā)保護(hù)的新格局.如何在可持 續(xù)發(fā)展的目標(biāo)下,研究土地利用變化過程,預(yù)測土地 利用未來發(fā)展趨勢,實現(xiàn)地區(qū)土地利用的數(shù)量、功 能、布局、強(qiáng)度等系統(tǒng)性優(yōu)化,是當(dāng)前國土空間規(guī)劃 研究的重點.空間數(shù)據(jù)智能技術(shù)是構(gòu)建國土空間開 發(fā)新格局,實現(xiàn)土地資源高效利用和合理配置,為土 地管理部門提供成熟決策方法的關(guān)鍵技術(shù)[42]. 通過借助空間數(shù)據(jù)智能技術(shù),將不同部門的多 源地理數(shù)據(jù)(地形地貌、遙感影像、地表覆蓋、測繪基 準(zhǔn)、土壤、植被、環(huán)境監(jiān)測等)聚合在一起,實現(xiàn)統(tǒng)一 數(shù)據(jù)訪問接口,構(gòu)建數(shù)據(jù)庫集成管理和統(tǒng)計分析系 統(tǒng),逐步構(gòu)建地理時空信息云平臺,旨在實現(xiàn)國土空 間規(guī)劃“一張圖”,為政府部門提供準(zhǔn)確標(biāo)準(zhǔn)的數(shù)據(jù) 支撐. 通過借助空間數(shù)據(jù)智能技術(shù),構(gòu)建融合統(tǒng)計方 法和地理學(xué)定律的空間計量模型,可以評估土地儲 備潛力,預(yù)測未來土地儲備需求量和土地價格;構(gòu)建 人類活動與基礎(chǔ)設(shè)施的時空關(guān)聯(lián)關(guān)系模型,可以自 動提取城市邊界,分析城市混合功能空間結(jié)構(gòu),實現(xiàn) 城市功能區(qū)的精細(xì)化管理和動態(tài)監(jiān)測;構(gòu)建土地利 用變化模擬模型,可以挖掘復(fù)雜驅(qū)動力因素對城市 發(fā)展的驅(qū)動機(jī)制,分析主導(dǎo)影響因素,預(yù)測不同情景 下的未來土地利用;構(gòu)建多目標(biāo)土地利用優(yōu)化模型, 可以提升用地強(qiáng)度利用效率,對土地資源進(jìn)行空間 合理調(diào)控,實現(xiàn)經(jīng)濟(jì)發(fā)展、環(huán)境保護(hù)、社會公平和區(qū) 域協(xié)調(diào)的平衡,為國土規(guī)劃部門提供有效的解決方 案和決策支持.

3 未來展望 

3.1 多模態(tài)數(shù)據(jù)融合和數(shù)據(jù)庫的易用性 

隨著5G 和物聯(lián)網(wǎng)技術(shù)的快速發(fā)展、以及時空 應(yīng)用場景的不斷變化,時空數(shù)據(jù)庫在不斷發(fā)展的同 時,也面臨了諸多亟需解決的挑戰(zhàn)性難題,如多模態(tài) 數(shù)據(jù)融合.真實世界中時空數(shù)據(jù)除了時間序列和地 理位置數(shù)據(jù)外,還存在大量具有時空屬性的多模態(tài) 數(shù)據(jù),如 GPS文本、運(yùn)動圖像、交通視頻等,如何在 現(xiàn)有時空數(shù)據(jù)庫中融合具有時空屬性的多模態(tài)數(shù) 據(jù),以支持多模態(tài)時空數(shù)據(jù)融合處理,是時空數(shù)據(jù)庫 領(lǐng)域面臨的新挑戰(zhàn)。

此外,隨著以博客、社交網(wǎng)絡(luò)、基于位置的服務(wù) (locationbasedservice,LBS)等為代表的新型信息 發(fā)布方式的不斷涌現(xiàn),以及云計算、物聯(lián)網(wǎng)技術(shù)的不 斷發(fā)展,高精尖的數(shù)據(jù)庫技術(shù)逐漸進(jìn)入人們的視野, 并幫助一般用戶進(jìn)行感知和決策.然而,用戶并不精 通數(shù)據(jù)庫專業(yè)技術(shù),但仍然需要對許多事務(wù)進(jìn)行決 策,因此需要高可用、易懂易用的數(shù)據(jù)庫.“數(shù)據(jù)庫平 民化”已經(jīng)成為數(shù)據(jù)庫未來發(fā)展的一大趨勢,如何利 用即時查詢、查詢構(gòu)造等提升時空數(shù)據(jù)庫易用性是 時空數(shù)據(jù)庫領(lǐng)域面對的又一新挑戰(zhàn). 

3.2 新一代時空數(shù)據(jù)數(shù)據(jù)挖掘算法 

隨著移動智能設(shè)備和移動通信技術(shù)的快速發(fā) 展,空間數(shù)據(jù)的采集變得日益普遍,使得大規(guī)??臻g 數(shù)據(jù)在醫(yī)療、能源、交通等領(lǐng)域具有重要應(yīng)用價值, 然而與空間大數(shù)據(jù)相匹配的信息處理、知識提取算 法仍是亟待研究的領(lǐng)域.此外,人工智能和數(shù)據(jù)挖掘 算法在近十余年來取得了長足的發(fā)展,我國也在近 年提出了促進(jìn)人工智能和大數(shù)據(jù)國家戰(zhàn)略,指出人 工智能和數(shù)據(jù)挖掘技術(shù)將成為發(fā)展國民經(jīng)濟(jì)水平各 領(lǐng)域的重要抓手.在空間數(shù)據(jù)智能研究中,如何有效 地實現(xiàn)空間大數(shù)據(jù)和人工智能研究的深度融合、再 創(chuàng)新是重要的未來發(fā)展方向.

然而,在空間數(shù)據(jù)智能中,應(yīng)用并發(fā)展人工智能 和數(shù)據(jù)挖掘技術(shù)也存在以下幾點重要問題:首先,空 間數(shù)據(jù)往往體量巨大且結(jié)構(gòu)異質(zhì),這對發(fā)展、應(yīng)用的 人工智能模型的計算效率、空間復(fù)雜度和可并行度 等性能指標(biāo)提出了很高要求.其次,空間大數(shù)據(jù)由于 物體在空間上重疊、包含等原因,往往缺乏也難以獲 取高質(zhì)量數(shù)據(jù)標(biāo)簽.這使得現(xiàn)有算法模型大部分局 限在非監(jiān)督學(xué)習(xí)、弱監(jiān)督學(xué)習(xí)范式下,難以從大規(guī)模 無標(biāo)簽空間數(shù)據(jù)中提取出高質(zhì)量知識.此外,空間大 數(shù)據(jù)由于獲取渠道多元、大規(guī)模感知設(shè)備的精度低 等原因,存在數(shù)據(jù)質(zhì)量差、單位數(shù)據(jù)價值密度低等問 題.空間數(shù)據(jù)噪音在很大程度上受定位設(shè)備的影響, 如 GPS、蜂窩基站、WiFi熱點等,且不同數(shù)據(jù)渠道采 集的數(shù)據(jù)存在較大差異,難以有效融合.因此,在空 間數(shù)據(jù)智能中設(shè)計數(shù)據(jù)挖掘和人工智能算法需要有 效解決對數(shù)據(jù)質(zhì)量的兼容性問題,從而實現(xiàn)穩(wěn)健的 空間知識提?。?nbsp;

3.3 時空復(fù)雜性與復(fù)雜系統(tǒng) 

隨著社會分工的不斷深入,快速的城市化是過 去數(shù)十年中貫穿我國和世界各國的主旋律.空間上 的聚集和由信息技術(shù)發(fā)展帶來的高頻社交行為,使得復(fù)雜系統(tǒng)成為了研究人類社會及相關(guān)問題的必要 范式.

在此背景下,人的行為模式在不同空間尺度下 表現(xiàn)出完全不同的復(fù)雜行為模式.以交通規(guī)劃領(lǐng)域 為例,其在個體層面關(guān)注于出發(fā)地 目的地(OGD)的 建模,在聚合層面要建道路截面流量,而在城市區(qū)域 層面則要關(guān)注宏觀人群流動規(guī)律.復(fù)雜系統(tǒng)的內(nèi)在 特性使得微觀機(jī)制和宏觀規(guī)律間存在難以預(yù)測的非 線性效應(yīng),這位多尺度的空間數(shù)據(jù)智能研究提出了 獨特的挑戰(zhàn). 現(xiàn)有復(fù)雜系統(tǒng)研究主要采用演繹的研究方法, 即基于一系列預(yù)設(shè)的微觀機(jī)制推到、仿真宏觀的行 為規(guī)律.然而,這一研究范式無法有效利用日益豐富 的空間數(shù)據(jù),無法實現(xiàn)數(shù)據(jù)驅(qū)動的規(guī)律發(fā)現(xiàn)和知識 獲取.另一方面,單純的數(shù)據(jù)挖掘算法無法有效地和 已有復(fù)雜系統(tǒng)理論相結(jié)合,挖掘出的觀測規(guī)律在理 論完備性和可泛化能力上存在隱患.因此,空間數(shù)據(jù) 智能的未來研究中,一個重要方向是提出能有效結(jié) 合復(fù)雜系統(tǒng)理論與空間大數(shù)據(jù)的新研究范式,并且 解決其在社會各領(lǐng)域的有效應(yīng)用.

3.4 可解釋的時空關(guān)系建模 

近年來,機(jī)器學(xué)習(xí)領(lǐng)域取得了蓬勃發(fā)展,對于現(xiàn) 有的機(jī)器學(xué)習(xí)方法來說,單純追求預(yù)測精度是不夠 的,這類模型具有一個共同的特點,內(nèi)部結(jié)構(gòu)復(fù)雜, 運(yùn)行機(jī)制像一個黑盒子一樣.且大多數(shù)預(yù)測模型根 據(jù)相關(guān)性進(jìn)行預(yù)測,但相關(guān)性并不意味著因果關(guān)系, 模型輸出結(jié)果也難以得到有效解釋.因此,在未來, 正確性和可解釋性成為了機(jī)器學(xué)習(xí)特別是深度學(xué)習(xí) 要實現(xiàn)的目標(biāo). 

深度學(xué)習(xí)領(lǐng)域嘗試開展具有可解釋和分析能力 的關(guān)系模型,這些模型的一致目標(biāo)是探究能否找到 一個原因,來對模型結(jié)果進(jìn)行針對性的解釋以及可 靠的指導(dǎo).因此,深度學(xué)習(xí)開始結(jié)合一些因果發(fā)現(xiàn)與 因果推斷方法,例如因果圖、結(jié)構(gòu)因果模型等,通過 對觀測的時空數(shù)據(jù)進(jìn)行分析來揭示隱藏的因果信 息.因果分析也是快速發(fā)展的可解釋人工智能領(lǐng)域 的一個重要課題,旨在構(gòu)建可解釋和透明的算法,解 釋如何做出決定.從以往研究來看,因果關(guān)系已經(jīng)在 無數(shù)領(lǐng)域和場景下得到學(xué)習(xí),包括教育、醫(yī)學(xué)、經(jīng)濟(jì) 學(xué)、流行病學(xué)、氣象學(xué)和環(huán)境健康等.

因果學(xué)習(xí)與機(jī)器學(xué)習(xí)領(lǐng)域有著密切的關(guān)系.機(jī) 器學(xué)習(xí)領(lǐng)域的蓬勃發(fā)展促進(jìn)了因果發(fā)現(xiàn)和因果推斷 領(lǐng)域的研究與探討.例如,應(yīng)用決策樹、集成方法、深度神經(jīng)網(wǎng)絡(luò)等強(qiáng)大的機(jī)器學(xué)習(xí)方法,可以更準(zhǔn)確 地估計潛在的結(jié)果.因果學(xué)習(xí)是解釋分析的強(qiáng)大建 模工具,它可以使當(dāng)前的機(jī)器學(xué)習(xí)做出可解釋的預(yù) 測.因此,如何更進(jìn)一步將因果學(xué)習(xí)與機(jī)器學(xué)習(xí)連接 起來,克服認(rèn)識上的不透明性,從相關(guān)性最終獲得因 果性,是未來需要解決的難題.隨著數(shù)字傳感技術(shù)的 進(jìn)步與發(fā)展,以及時空數(shù)據(jù)庫的不斷豐富,發(fā)展具有 因果關(guān)系挖掘能力的模型或許是破解黑箱模型的關(guān)鍵。

---------?---------

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多