看展,AI講解員做“搭子”
浦東美術(shù)館內(nèi),觀眾正在使用AI講解員了解畢加索的作品《裝扮成喜劇丑角的保羅》相關(guān)創(chuàng)作背景。 本報記者 孫亞慧攝 來源:人民日報海外版拿起手機(jī),點(diǎn)擊“視頻通話”,接通后將手機(jī)對向博物館內(nèi)的展品,屬于觀眾自己的AI講解員隨即上線。
“這幅畫作的立意與畢加索的童年有關(guān)嗎?”
“這一幅下方好像有缺損,是如何造成的?”
……
無論拋出什么問題,屏幕那頭總會送來耐心而專業(yè)的解答。它不僅能夠陪嘮,必要的時候,還會委婉糾正觀眾提問時出現(xiàn)的知識性錯誤。
在上海浦東美術(shù)館官方AI講解員的陪伴下,記者收獲了一次特別的看展經(jīng)歷。
美育資源突破時空限制
前不久,字節(jié)跳動旗下的AI工具豆包,正式成為“圖案的奇跡:盧浮宮印度、伊朗與奧斯曼的藝術(shù)杰作”與“非常畢加索:保羅·史密斯的新視角”兩大國際大展的官方AI講解員。
陸家嘴集團(tuán)副總經(jīng)理、浦東美術(shù)館董事長李旻坤表示,AI講解員可以極大豐富觀眾的看展體驗(yàn),讓藝術(shù)“千人千面”的風(fēng)采得以呈現(xiàn)。
“過去的展覽我們主要靠展簽、二維碼等來提供有限信息。人工導(dǎo)覽又受限于知識廣度,很難滿足每個人個性化的好奇心,每個人關(guān)注的點(diǎn)都不一樣。我們期待這位博學(xué)敏銳、持續(xù)精進(jìn)的AI講解員能成為連接觀眾與國際藝術(shù)瑰寶之間的智慧紐帶?!痹诶顣F坤看來,近年來展覽行業(yè)的許多變化,是科技改變生活的實(shí)例。一直以來,展覽的物理空間讓內(nèi)容呈現(xiàn)受到制約,隨著AI技術(shù)的引入,觀眾可以在看展時獲得更多信息,美育資源也將突破時空限制。
“如果AI講解員的信息足夠準(zhǔn)確,它就可以極大地豐富大家對于藝術(shù)作品的感知和體驗(yàn),這是很有意義的事情?!彼f。
字節(jié)跳動副總裁朱駿認(rèn)為,AI和用戶的交互在本質(zhì)上是一種對話體驗(yàn)。立足于產(chǎn)品設(shè)計,團(tuán)隊(duì)希望AI講解員能在觀展過程中,通過啟發(fā)式的對話和更具共情意味的提問,調(diào)動觀眾已有的看展感受和經(jīng)驗(yàn)。從“看見”到“理解”,AI可以幫助觀眾“讀懂”藝術(shù)。
最大挑戰(zhàn)是確保內(nèi)容準(zhǔn)確
在博物館場景中使用AI講解,技術(shù)上最大的挑戰(zhàn)是什么?
答案不言自明——確保內(nèi)容的準(zhǔn)確性。
據(jù)豆包逛展項(xiàng)目負(fù)責(zé)人李若瑄介紹,模型需要攻克3個核心難題:區(qū)分外觀高度相似的展品、解讀小眾稀缺的文物資料、在觀眾移動觀展時AI保持穩(wěn)定識別。
“以伊朗15世紀(jì)的牡丹紋盤為例,其風(fēng)格與明代永樂年間的青花牡丹紋盤非常接近,這就要求AI必須從細(xì)節(jié)入手,能精準(zhǔn)識別出文物細(xì)微的紋飾、工藝差異,給出正確信息。”李若瑄說。
多角度拍攝也會帶來識別挑戰(zhàn)。文物從不同視角拍攝時形態(tài)差異很大,AI必須穩(wěn)定識別出同一物品。此外,觀眾很難在逛展中為AI提供標(biāo)準(zhǔn)化的拍攝環(huán)境,畫面常有抖動、遮擋和光線變化,觀眾還會用口語化、連續(xù)提問的方式,這對AI的上下文理解和空間感知能力提出了很高的要求。
同時,很多展出的文物,尤其是盧浮宮特展中的藏品,互聯(lián)網(wǎng)上幾乎沒有公開信息。AI無法依賴網(wǎng)絡(luò)搜索,必須依靠與美術(shù)館深度合作的專屬數(shù)據(jù)庫才能準(zhǔn)確解讀。
記者在體驗(yàn)中發(fā)現(xiàn),即使有意識避開展品標(biāo)簽,AI也能夠快速精準(zhǔn)識別出具體展品。這背后,是豆包C1.8視覺語言模型提供的技術(shù)解決方案。該視覺語言模型包括圖像推理、多幀視頻分析、工具調(diào)用和自然對話理解等方面,以提供精準(zhǔn)、穩(wěn)定、人性化的AI導(dǎo)覽體驗(yàn)。
2025年5月,豆包上線了基于視覺推理模型的視頻通話功能,支持實(shí)時視頻問答與聯(lián)網(wǎng)搜索,憑借自然的交互體驗(yàn)吸引了不少用戶嘗試,為此次美術(shù)館場景的應(yīng)用積累了技術(shù)經(jīng)驗(yàn)。
從技術(shù)層面來看,視頻講解功能來自Seed1.8模型的強(qiáng)大支撐。目前,該模型在視頻感知、流式、視頻理解領(lǐng)域處于國際第一梯隊(duì)水平,不再局限于傳統(tǒng)AI“拍圖—提問—再拍圖—再提問”的斷點(diǎn)式交互,而是能實(shí)時跟隨觀眾視角移動,在與人的交互中持續(xù)理解觀眾眼前變化的場景,從而實(shí)現(xiàn)更加自然、連續(xù)的人機(jī)互動。
定制專屬觀展路徑
“看展,為什么非要按照規(guī)定順序看呢,可以按照我喜歡的方法或者順序去看嗎?”李旻坤的這番話引發(fā)了現(xiàn)場不少人的共鳴。
技術(shù)帶來的變革不僅改變了信息獲取方式,更重塑了觀展路徑與思維方式。在AI講解員的助力下,“沉浸式”看展的趣味性更強(qiáng)。
比如,傳統(tǒng)觀展流程遵循美術(shù)館設(shè)定的固定路線,所有觀眾按照同樣的順序完成標(biāo)準(zhǔn)化路徑。有了AI講解員作為看展“搭子”,觀眾可以打破固定模式,依據(jù)自身時間和興趣定制自己的觀展路徑。
AI講解員出現(xiàn)了,觀眾對人工講解員的需求會下降嗎?
在李旻坤看來,真人面對面之間的交流需求會一直存在,這正是AI講解員無法替代人工講解員的原因所在。“人與人之間的互動與人和AI的互動不一樣,各有各的樂趣,這同我們?nèi)粘I钪兴械男袨檫壿嬕粯?。人腦是有限的,想讓人像機(jī)器一樣博學(xué)很難,人工服務(wù)可以向著更聚焦、專業(yè)、精良的方向發(fā)展,為觀眾提供更加生動的看展體驗(yàn)?!?/p>
科技與文化的跨界合作正在重塑文化傳播的生態(tài)。在浩瀚文明面前,AI正在完成自己的使命——幫助人類更好去“看”,為求知與好奇鋪就一條隨時可以出發(fā)的路。
本報記者 孫亞慧
《人民日報海外版》(2026年02月11日 第 10 版)