人民網(wǎng)北京12月31日電 (記者趙竹青)據(jù)國家自然科學基金委員會網(wǎng)站消息,復旦大學智能復雜體系基礎理論與關鍵技術實驗室、現(xiàn)代語言學研究院張夢翰團隊與計算與智能創(chuàng)新學院邱錫鵬、黃萱菁團隊合作,揭示了僅通過預測訓練大語言模型能夠自發(fā)涌現(xiàn)出類人的概念表征及其組織結構。研究成果以“語言預測揭示涌現(xiàn)的類人概念表征”為題,于2025年10月31日發(fā)表于《美國科學院院刊》。
僅依賴下一個token預測訓練的大語言模型(LLMs)是否形成了類似于人類的概念是人工智能與認知科學共同關注的科學問題。研究團隊將“反向詞典”任務重構為概念探針,結合表征相似性分析(RSA)等計算方法,系統(tǒng)探究了LLMs在不同語境下構建概念表征的能力。研究團隊提出的模型能夠根據(jù)語言描述靈活推導概念,且其表征逐漸收斂于一種共享的、獨立于具體語境的關系結構。這些關系結構不僅能可靠預測模型在各項理解與推理任務中的表現(xiàn),還與SimLex-999、THINGS等人類心理行為數(shù)據(jù)高度一致。研究發(fā)現(xiàn)該表征與人腦視覺皮層等區(qū)域的神經(jīng)活動模式呈現(xiàn)顯著的對齊關系,這一發(fā)現(xiàn)驗證了表征模型與組織結構的生物學合理性。
研究表明,結構化的類人概念表征可以單純通過語言預測機制涌現(xiàn)。該研究不僅為利用大語言模型探索人類概念本質(zhì)提供了新窗口,也為推進人工智能與人類智能的深度對齊奠定了基礎。