報(bào)告簡介:深度學(xué)習(xí)是當(dāng)代人工智能領(lǐng)域的重大飛躍。從ACM圖靈獎到諾貝爾獎,它展現(xiàn)出推動現(xiàn)代尖端技術(shù)發(fā)展的非凡潛力。依托海量數(shù)據(jù)集與龐大參數(shù)規(guī)模,大語言模型通過交互式聊天機(jī)器人展現(xiàn)出精妙的理解能力。與之相應(yīng),大視覺模型正被用于解決復(fù)雜視覺難題。本次講座將介紹我們?nèi)绾芜\(yùn)用大語言模型與大視覺模型來增強(qiáng)機(jī)器人視覺、運(yùn)動控制及導(dǎo)航能力,同時重點(diǎn)探討消除機(jī)器人幻覺現(xiàn)象與規(guī)避倫理風(fēng)險(xiǎn)的關(guān)鍵挑戰(zhàn)。我們的研究涵蓋多類智能機(jī)器人,包括人形機(jī)器人、四足機(jī)器人與機(jī)械臂機(jī)器人,主要應(yīng)用于拾取放置任務(wù)場景。
簡介:Dr.Wei Qi Yan現(xiàn)任奧克蘭理工大學(xué)計(jì)算機(jī)與信息科學(xué)系教授,其學(xué)術(shù)專長涵蓋深度學(xué)習(xí)、計(jì)算機(jī)視覺、機(jī)器人學(xué)及多媒體計(jì)算等當(dāng)代人工智能核心領(lǐng)域。現(xiàn)任IEEE Transactions on Circuits and Systems for Video Technology(影響因子11.1)副主編、ACM Transactions on Multimedia Computing, Communications and Applications副主編、 IEEE Signal Processing Letters高級區(qū)域編輯、Springer Journal Discover Artificial Intelligence期刊欄目編輯。曾作為皇家科學(xué)院Te Apārangi(RSNZ)與中國科學(xué)院(CAS)交流計(jì)劃特聘計(jì)算機(jī)科學(xué)家開展合作研究。Dr.Yan入選斯坦福大學(xué)發(fā)布的“全球前2%頂尖科學(xué)家”榜單,現(xiàn)任新西蘭ACM多媒體專業(yè)委員會主席、新西蘭人工智能研究協(xié)會正式理事,同時榮膺新西蘭工程學(xué)會Te Ao Rangahau會士(FEngNZ)稱號。

時間:2025年11月5號(周三)上午10:00-12:00
地點(diǎn):N5樓410會議室