報告題目:從視頻、文本到智能體策略學習
報告時間:2023年6月16日上午9:30
報告地點:437bwin必贏國際官網B405
報告人:盧宗青
報告人國籍:中國
報告人單位:北京大學
報告人簡介:北京大學437bwin必贏國際官網助理教授、博雅青年學者,國家海外高層次青年人才,智源學者,北京智源人工智能研究院多模態交互研究中心負責人。主要研究強化學習以及開放世界通用智能體。https://z0ngqing.github.io/
報告摘要:過去幾年強化學習研究取得了突破性成果,然而強化學習仍然面臨諸多挑戰,比如樣本效率低、難解決長程稀疏獎勵任務、策略缺乏泛化性等問題,使得強化學習難以廣泛應用。最近大模型的成功為解決強化學習的這些問題提供了新的思路。這次報告將介紹利用視頻與文本幫助智能體策略學習的一些探索以及如何在“我的世界(Minecraft)”中訓練可以完成復雜多樣任務的通用智能體的方法。強化學習與大模型的結合有可能實現 Daniel Kahneman 所描述的 System1/2 人類決策模型。
邀請人:羅勇