報告題目:人工智能:強(qiáng)化學(xué)習(xí)的基本理論及其應(yīng)用
主要內(nèi)容:講述及探討強(qiáng)化學(xué)習(xí)的基本理論及其應(yīng)用。強(qiáng)化學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種范式,它通過與環(huán)境的交互來學(xué)習(xí)如何實現(xiàn)特定的目標(biāo)。其核心是智能體(Agent)通過與環(huán)境(Environment)的交互學(xué)習(xí)最優(yōu)策略,以最大化長期累積獎勵(Cumulative Reward),這通常涉及到策略的學(xué)習(xí),即在給定狀態(tài)下選擇最佳動作的規(guī)則。學(xué)習(xí)目標(biāo)為熟悉強(qiáng)化學(xué)習(xí)的主要思路使得學(xué)生在學(xué)習(xí)高級強(qiáng)化學(xué)習(xí)算法的時候有良好的理論基礎(chǔ)。
報告人:方輝
報告人所在單位:英國拉夫堡大學(xué)
報告人職稱/職務(wù)及學(xué)術(shù)頭銜:博士
時間:2025年4月22日14:00-16:00
地點:云塘校區(qū)文科樓D505
報告人簡介:2006年畢業(yè)于布拉德福德大學(xué)主攻多媒體基于內(nèi)容的智能檢索,致力于開發(fā)圖像壓縮域快速檢索與管理系統(tǒng),曾應(yīng)用于歐盟 FP6 框架下倫敦奧運點播查詢系統(tǒng),2006-2015年于牛津大學(xué)等多所英國知名高校從事博士后研究員工作,曾領(lǐng)導(dǎo)開發(fā)國際地震中心可視化地震數(shù)據(jù)分析平臺,入選牛津大學(xué)社會影響力案例,2015年到2018年期間就職于知山大學(xué)和利物浦約翰莫爾斯大學(xué),2019年1月入職拉夫堡大學(xué)。近年來主持國家級科研項目多項,包括:創(chuàng)新英國 KTP項目(KTP PROJECT £197,792),創(chuàng)新英國SMART GRANT,英國科學(xué)工程理事會工業(yè)合作基金,英國科學(xué)工程理事會項目等,其中大型項目成果:與倫敦奇點智能公司的開發(fā)產(chǎn)品已被聯(lián)合利華及荷蘭卡夫享氏公司采用;與利茲教學(xué)醫(yī)院開發(fā)的視覺體液健康系統(tǒng)也在原型測試階段;已在頂級會議和頂級期刊 (CVPR, AAAI, ECCV,IEEE TRANSACTIONS ON VISUALIZATION AND COMPUTER GRAPHICS, PATTERN RECOGNITION等)發(fā)表論文150余篇。同時,擔(dān)任多個國際著名期刊和會議編輯,包括 EUROVIS., INTERNATIONAL CONFERENCE ON COMPUTATIONAL VISUAL MEDIA (CVM), COMPUTER GRAPHICS AND VISUAL COMPUTING (CGVC), INTERNATIONAL CONFERENCE ON EMERGING UBIQUITOUS SYSTEMS AND PERVASIVE NETWORKS (ICEUSPN), GUEST EDITOR OF SPECIAL ISSUE IN MDPI ENTROPY, AI Communications 副主編。
承辦單位:國際工學(xué)院 通識教育中心