437bwin必贏國際官網(集團)有限公司-SouG百科

日日干日日摸-日日干天天操-日日干天天草-日日干天天插-精品一区二区三区在线观看-精品一区二区三区在线观看l

學術交流

首頁/ 科學研究/ 學術交流/ 正文

學術報告：從視頻、文本到智能體策略學習

發布時間：2023-06-14 瀏覽量：次

報告題目：從視頻、文本到智能體策略學習

報告時間：2023年6月16日上午9:30

報告地點：437bwin必贏國際官網B405

報告人：盧宗青

報告人國籍：中國

報告人單位：北京大學

報告人簡介：北京大學437bwin必贏國際官網助理教授、博雅青年學者，國家海外高層次青年人才，智源學者，北京智源人工智能研究院多模態交互研究中心負責人。主要研究強化學習以及開放世界通用智能體。https://z0ngqing.github.io/

報告摘要：過去幾年強化學習研究取得了突破性成果，然而強化學習仍然面臨諸多挑戰，比如樣本效率低、難解決長程稀疏獎勵任務、策略缺乏泛化性等問題，使得強化學習難以廣泛應用。最近大模型的成功為解決強化學習的這些問題提供了新的思路。這次報告將介紹利用視頻與文本幫助智能體策略學習的一些探索以及如何在“我的世界(Minecraft)”中訓練可以完成復雜多樣任務的通用智能體的方法。強化學習與大模型的結合有可能實現 Daniel Kahneman 所描述的 System1/2 人類決策模型。

邀請人：羅勇

日日干日日摸-日日干天天操-日日干天天草-日日干天天插-精品一区二区三区在线观看-精品一区二区三区在线观看l

學術交流

學術報告：從視頻、文本到智能體策略學習

發布時間：2023-06-14 瀏覽量：次

快速通道 / Expressway

聯系我們 / Contact us