|
點上方藍(lán)字「三川匯文化產(chǎn)業(yè)」關(guān)注并星標(biāo)
生成式人工智能(AIGC)的不斷發(fā)展,給文旅行業(yè)帶來了新的機遇、問題和挑戰(zhàn)。文旅產(chǎn)業(yè)應(yīng)該如何把握以提高生產(chǎn)效率、激發(fā)具體應(yīng)用探索等在內(nèi)的機遇,如何應(yīng)對技術(shù)沖擊、版權(quán)歸屬、內(nèi)容監(jiān)管等多方面的問題與挑戰(zhàn),成為了目前需要緊迫探討的問題。本文結(jié)合保利影業(yè)、保利文娛科技相關(guān)實踐情況,從國家、行業(yè)和企業(yè)層面提出了相關(guān)對策建議,包括推進(jìn)技術(shù)研發(fā)、制定標(biāo)準(zhǔn)規(guī)范、加強培訓(xùn)監(jiān)管、提升行業(yè)技術(shù)水平等,以推動文旅行業(yè)高質(zhì)量發(fā)展。
作者 | 李挺偉,楊億,葉丹寧,李錚,包文文(保利影業(yè)、保利文娛科技研究中心) 編審 | 時光 編輯 | 半島 來源 | 三川匯文化產(chǎn)業(yè)(ID:schwhcy)  2023年,以大模型為代表的生成式人工智能(AIGC),席卷人工智能技術(shù)熱潮,為各行各業(yè)的創(chuàng)新發(fā)展和轉(zhuǎn)型升級提供了新的工具和能力。AIGC是現(xiàn)階段推動數(shù)字經(jīng)濟發(fā)展的重要力量,是當(dāng)前炙手可熱的研究和投資方向之一。一、生成式人工智能發(fā)展情況 (一)基本情況作為一項前沿技術(shù),生成式AI率先在教育、傳媒、電商、娛樂、影視等多個領(lǐng)域施展出驚人的創(chuàng)造力,它與實體經(jīng)濟的深度融合創(chuàng)新為提振居民消費、釋放內(nèi)需潛力注入了全新動能。目前來看,生成式AI主要有以下六種輸出模式:一是輸出文本,主要是生成通俗易懂、高質(zhì)量戶文本段落,并在復(fù)雜程度和細(xì)節(jié)把控方面滿足用戶需求。二是輸出圖片,即模型會根據(jù)文字或視覺提示生成具有可變性、創(chuàng)造性和不同逼真度的圖片。三是輸出音頻,目前AI可以輸出語音、音樂、歌曲內(nèi)容等,雖然未達(dá)到“驚艷”的程度,但在視頻內(nèi)容中已經(jīng)可以完成簡單的配樂。四是輸出視頻,與圖像輸出類似,模型可以根據(jù)用戶提示生成并輸出視頻,而視頻中的人、物、景完全由模型虛構(gòu)和創(chuàng)建。五是輸出代碼,即使用各種編程語言編寫計算機代碼,還可為開發(fā)人員自動總結(jié)、記錄和注釋代碼。六是輸出3D模型,即模型可根據(jù)文本或2D圖像輸出具有3D物體屬性的模型數(shù)據(jù)或函數(shù)集。 (二)以Sora為代表的生成式人工智能2023年3月,美國“開放人工智能研究中心”(OpenAI)的ChatGPT-4上線,模型性能和功能性得到進(jìn)一步提升,在寫作、作圖以及代碼生成等多模態(tài)專業(yè)領(lǐng)域已經(jīng)能夠極大地提升工作效率。今年,當(dāng)?shù)貢r間2月15日,谷歌推出了多模態(tài)大語言模型雙子座(Gemini)1.5 PRO,可以為不同模態(tài)執(zhí)行高度復(fù)雜的理解和推理任務(wù),分析和理解1小時長視頻、電影劇本的事件和細(xì)節(jié)。同日,OpenAI發(fā)布了文生視頻模型Sora,模型在時長和分辨率上大幅超越其他同類模型,可以說是里程碑式的產(chǎn)品。Sora在視頻生成中模擬了多種物理世界,世界中的動物、人物、建筑細(xì)節(jié)細(xì)致,人物的皮膚肌理、動物的毛發(fā)描繪清晰并對光影的反射、鏡頭移動等細(xì)節(jié)處理合理,使生成的視頻內(nèi)容具備了真實感。Sora的特點可概括為以下四點:一是視頻主體和背景的連貫性,能夠保持畫面穩(wěn)定性,時長長達(dá)1分鐘(同類產(chǎn)品一般在20秒以內(nèi));二是OpenAI的原生語言能力較為豐富,推測Sora對自然語言理解程度較高;三是生成不同長寬比的相同視頻內(nèi)容,能夠做到視頻主體內(nèi)容始終在畫面合適位置;四是Sora目前已有案例顯示出一些符合世界物理規(guī)律的現(xiàn)象模擬。Sora之所以是AI里程碑,是因為它再一次突破了AIGC用AI驅(qū)動內(nèi)容創(chuàng)作的上限,它所展現(xiàn)出來的能力對現(xiàn)有其他AI視頻生成工具的效果對比,幾乎可用“碾壓”來形容。另一方面,Sora目前還是一個不成熟的產(chǎn)品,Sora生成視頻中可能包含不合邏輯的圖像,存在無法準(zhǔn)確模擬復(fù)雜場景的物理原理和因果關(guān)系實例等現(xiàn)象,比如吹蠟燭火不熄滅,跑步機上方向錯誤等問題。盡管問題很多,但Sora展現(xiàn)了視頻模型未來的潛力,未來只要有足夠的數(shù)據(jù)和算力支持,就可能更深入的理解物理世界的規(guī)則。從年初蘋果發(fā)布Vision Pro頭戴式顯示設(shè)備、到各家PC大廠接連發(fā)布AIPC,到這次的OpenAI發(fā)布Sora,全世界對于人工智能的創(chuàng)新在加速,迭代地越來越快。今后用AI自動創(chuàng)作生成的內(nèi)容會影響很多的行業(yè)領(lǐng)域,對于熱點話題的“時效性覆蓋”將是AI的主要任務(wù),比拼的是AIGC的效率和駕馭AI的能力。二、生成式人工智能為文旅行業(yè)帶來的機遇 生成式人工智能的發(fā)展,可以說是一場新的工業(yè)革命,文旅行業(yè)是生成式人工智能應(yīng)用的重要領(lǐng)域之一。Sora作為一種先進(jìn)的人工智能助手,其核心技術(shù)在于大數(shù)據(jù)分析、自然語言處理和人工智能算法。這些技術(shù)在文旅產(chǎn)業(yè)中的應(yīng)用將有助于提高文旅產(chǎn)品的創(chuàng)新能力和服務(wù)水平。 (一)可作為元宇宙的內(nèi)容生成器和效率加速器元宇宙是一個龐大而復(fù)雜的虛擬世界,想要使用者在元宇宙獲得極佳的體驗,需要在場景和建模以及物理引擎上面投入大量資源,生成式人工智能技術(shù)目前也在嘗試進(jìn)行3D內(nèi)容生成,提高內(nèi)容生成效率和模型精度,Sora的出現(xiàn)與3D內(nèi)容生成相結(jié)合,將大大提升使用者的真實性體驗。 (二)可降低建立數(shù)字博物館的技術(shù)門檻通過積累文物模型數(shù)據(jù),結(jié)合生成式人工智能,將為文物的虛擬修復(fù)、展示和研究甚至文物鑒定提供有效的工具支持。通過AR技術(shù)也可以在不觸碰真實文物的前提下多角度觀察文物細(xì)節(jié)。同時,通過生成式人工智能,也可以為館藏產(chǎn)品進(jìn)行文物IP創(chuàng)新,創(chuàng)造出符合公眾喜聞樂見的IP形象。 (三)可加速文旅產(chǎn)業(yè)與相關(guān)產(chǎn)業(yè)的融合隨著5G、物聯(lián)網(wǎng)等新技術(shù)的不斷發(fā)展,文旅產(chǎn)業(yè)正加速與相關(guān)產(chǎn)業(yè)融合,Sora等人工智能技術(shù)將為這種融合提供有力支持。如與影視、動漫、游戲等行業(yè)合作,打造具有吸引力的文旅IP;在文旅小鎮(zhèn)、主題公園等項目中,像Sora這樣的各類AI模型可以提供智能化、數(shù)字化的解決方案,提升項目的運營效率和盈利能力。此外,生成式AI與各類AI大模型還可以推動文旅產(chǎn)業(yè)與科技的深度融合,如無人駕駛、智能交通等技術(shù)創(chuàng)新在文旅領(lǐng)域的應(yīng)用,為游客帶來更為便捷的出行體驗。對于文化遺產(chǎn)的保護(hù)和利用,AIGC可以幫助創(chuàng)建歷史場景的復(fù)原視頻,讓游客更直觀地了解歷史和文化,提高教育的趣味性和參與度。為了加速文旅與互聯(lián)網(wǎng)智慧融合,保利影業(yè)旗下的保利文娛科技推出一款A(yù)I速拍產(chǎn)品-VLOG速拍寶,賦能景區(qū)數(shù)字化升級,助力文旅產(chǎn)業(yè)高質(zhì)量發(fā)展。VLOG速拍寶為一鍵生VLOG產(chǎn)品,覆蓋100座以上的城市、25個省級行政區(qū)、100個以上的景區(qū),總設(shè)備數(shù)量達(dá)到2000臺以上。通過自動抓拍游客游覽過程,生成專屬VLOG。同時為景區(qū)和特定景點定制視頻模板,挖掘景區(qū)歷史文化底蘊,一鍵生成游客與景區(qū)相融合的微電影。另外,保利文娛科技旗下的全息投影顯示終端-空間云柜的全息數(shù)字人技術(shù),可在未來為博物館、景區(qū)、展廳、會議、文旅導(dǎo)覽等,提供1:1 真人還原的各類AI智能服務(wù)。三、問題與挑戰(zhàn) 技術(shù)進(jìn)步是一把雙刃劍,生成式人工智能在提升用戶體驗、提高生產(chǎn)效率的同時,也帶來了很多問題、挑戰(zhàn): (一)生成內(nèi)容的迭代調(diào)整存在難度目前來看,生成式人工智能難以真正輸出感性的、擬人化的深刻表達(dá),音頻的流暢度和真實感還有待加強,視覺感知能力的欠缺導(dǎo)致視頻或3D模型在精準(zhǔn)度、仿真度和還原度上難以兼顧。 (二)數(shù)據(jù)安全問題生成式人工智能時代,高頻度的人機交互使得個人信息全方位地暴露,泛濫的虛假信息進(jìn)入生成式人工智能龐大語料庫之中,隨即大規(guī)模傳播將會帶來社會危害。 (三)倫理與道德問題 生成式人工智能模型無法理解道德和文化問題,有可能無法很好的適應(yīng)當(dāng)?shù)氐纳鐣幕土?xí)俗,在創(chuàng)作上可能會存在偏見和誤解,對內(nèi)容制作方可能造成一定的風(fēng)險以及不良的社會影響。 (四)知識產(chǎn)權(quán)問題如果人工智能研發(fā)機構(gòu)在訓(xùn)練模型時沒有獲得訓(xùn)練數(shù)據(jù)提供者的明確授權(quán),很可能產(chǎn)生知識產(chǎn)權(quán)糾紛。另外,生成式人工智能產(chǎn)生的內(nèi)容是否受著作權(quán)和專利權(quán)保護(hù),目前仍存在很大爭議。保利影業(yè)旗下的科技公司保利視訊在數(shù)字水印、內(nèi)容安全、版權(quán)保護(hù)、音視頻監(jiān)測和溯源領(lǐng)域擁有先進(jìn)的技術(shù),可在知識產(chǎn)權(quán)保護(hù)方面發(fā)揮巨大作用,為文旅產(chǎn)業(yè)高質(zhì)量發(fā)展保駕護(hù)航。四、生成式人工智能賦能文旅高質(zhì)量發(fā)展的對策建議 作為文旅行業(yè)從業(yè)者,一方面要積極擁抱新技術(shù),另一方面應(yīng)加強企業(yè)對生成式人工智能的風(fēng)險防范意識。 (一)國家層面鼓勵生成式人工智能的技術(shù)研發(fā),激勵企業(yè)參與全球生成式人工智能的競爭與合作。推進(jìn)生成式人工智能科技安全立法和行業(yè)標(biāo)準(zhǔn)制定進(jìn)程,為有關(guān)算法的可專利性和生成內(nèi)容的商業(yè)秘密或作品認(rèn)定提供政策依據(jù)。兼顧制定多層次的行業(yè)標(biāo)準(zhǔn)及國家標(biāo)準(zhǔn)以配套法律政策文本的實施。生成式人工智能的監(jiān)管標(biāo)準(zhǔn)既要同國際接軌,又要考慮到我國生成式人工智能行業(yè)發(fā)展的特殊性,保證規(guī)則體系建構(gòu)的制度適配性。切實考慮企業(yè)參與生成式人工智能技術(shù)重大研發(fā)和海外競爭的核心利益,對生成式人工智能內(nèi)容實行包容審慎和分類分級監(jiān)管。除此之外,我國AI發(fā)展所需要的語料數(shù)據(jù)仍相對匱乏。有數(shù)據(jù)顯示,全球通用的50億大模型數(shù)據(jù)訓(xùn)練集里,中文語料的占比僅為1.3%。業(yè)內(nèi)人士指出,雖然我國的數(shù)據(jù)資源豐富,但是由于數(shù)據(jù)挖掘與流通不足,中文語料庫與英文等其它語言的數(shù)據(jù)語料庫相比仍有差距,可能成為阻礙大模型研發(fā)的重要因素。因此,進(jìn)一步規(guī)范、完善中文語料庫是訓(xùn)練和優(yōu)化AI大模型的重要基礎(chǔ)。語料庫的豐富充實或?qū)⑹官Y料查找更加便捷,進(jìn)一步降低了普通人的AI使用門檻,幫助普通人以更簡單的方式獲取更全面的信息。 (二)行業(yè)層面應(yīng)以場景理論為導(dǎo)向,分情景開展生成式人工智能的風(fēng)險識別及其防控。推動采用數(shù)字水印技術(shù)對知識產(chǎn)權(quán)進(jìn)行保護(hù),避免侵權(quán)行為。積極推進(jìn)通用大模型技術(shù)與垂直領(lǐng)域相融合,使模型更專注于專業(yè)領(lǐng)域能力,可以更高效的幫助行業(yè)企業(yè)實現(xiàn)價值。 (三)企業(yè)層面加強技術(shù)普及和員工培訓(xùn)。生成式人工智能作為創(chuàng)意效率工具,讓企業(yè)內(nèi)部做好迎接變革的準(zhǔn)備至關(guān)重要。加強內(nèi)容審核和技術(shù)監(jiān)管,鼓勵企業(yè)建立多部門協(xié)同的人工智能風(fēng)險治理團(tuán)隊,從數(shù)據(jù)、技術(shù)、產(chǎn)品、合規(guī)、法務(wù)、內(nèi)審等多視角,對生成式人工智能應(yīng)用從訓(xùn)練數(shù)據(jù)到輸出內(nèi)容進(jìn)行審核和監(jiān)管,確保符合法律法規(guī)和道德標(biāo)準(zhǔn)。另外,在應(yīng)用場景方面,AIGC可助力虛擬現(xiàn)實體驗提質(zhì)升級。目前來說,文旅體驗受制于時間和空間兩個維度,時間上無法沉浸式體驗歷史和未來,空間上受制于場景搭建和資源開發(fā)。未來,AIGC可根據(jù)用戶的個性化需求生成定制化的沉浸式體驗內(nèi)容,在已有基礎(chǔ)上打通虛擬空間,融合增強現(xiàn)實(AR)、虛擬現(xiàn)實(VR)和混合現(xiàn)實(MR)體驗,為游客提供突破時間和空間限制的虛擬旅游體驗。面對AIGC帶來的挑戰(zhàn),文旅產(chǎn)業(yè)需提升行業(yè)整體技術(shù)水平,培養(yǎng)專業(yè)人才,加強行業(yè)自律,確保內(nèi)容質(zhì)量,深化產(chǎn)業(yè)合作,實現(xiàn)產(chǎn)業(yè)鏈上下游企業(yè)協(xié)同發(fā)展,共享技術(shù)紅利,注重用戶隱私保護(hù)和數(shù)據(jù)安全,構(gòu)建可信賴的數(shù)字文旅生態(tài)。只有保持開放的心態(tài),緊跟技術(shù)發(fā)展趨勢,直面機遇和挑戰(zhàn),關(guān)注技術(shù)發(fā)展帶來的各類問題并積極應(yīng)對,持續(xù)推進(jìn)行業(yè)高質(zhì)量發(fā)展,才能在智能化時代立足于不敗之地。[1] 張成甦.生成式人工智能嵌入消費領(lǐng)域的機遇、風(fēng)險與應(yīng)對[EB/OL].工業(yè)技術(shù)經(jīng)濟,2024-02-23[2024-02-25].[2] GPT-4: Scaling Up Language Models[EB/OL]. OpenAI, 2023-03-17.[3] Sundar Pichai, Demis Hassabis. Our next-generation model: Gemini 1.5[EB/OL]. The Keyword, 2024-02-15. https://blog.google/technology/ai/google-gemini-next-generation-model-february-2024/?utm_source=gdm&utm_medium=referral&utm_campaign=gemini24#sundar-note[4] Video generation models as world simulators[EB/OL]. OpenAI, 2024-02-15. https:///research/video-generation-models-as-world-simulators[5] 晏軼超,程宇豪,陳琢,彭乙驄,吳思婧,張維天,李俊杰,李逸軒,高景南,張維夏,翟廣濤,楊小康.基于神經(jīng)網(wǎng)絡(luò)的生成式三維數(shù)字人研究綜述:表示、渲染與學(xué)習(xí)[J].中國科學(xué):信息科學(xué),2023,53(10):1858-1891.[6] 任澤平:Sora橫空出世,會顛覆哪些業(yè)[EB/OL]. 新浪財經(jīng),2024-2-20.[7] 全新人工智能模型 Sora對文旅產(chǎn)業(yè)的三大影響[EB/OL]. 七彩文旅,2024-2-22.[8] 孫那、鮑一鳴.生成式人工智能的科技安全風(fēng)險與防范[J/OL].陜西師范大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2024-02-19.[9] 陳永偉.超越ChatGPT:生成式AI的機遇、風(fēng)險與挑戰(zhàn)[J].山東大學(xué)學(xué)報:哲學(xué)社會科學(xué)版,2023,(3):127-143.[10] 生成式人工智能的風(fēng)險和機遇管理[EB/OL]. 普華永道, [2024-02-25].[11] 李兵兵.人民數(shù)據(jù)打造全球最大中文語義語料庫助力Sora新場景[EB/OL]. 人民數(shù)據(jù),2024-2-20 [2024-02-25].
|