11月29日上午,伍伦贡联合研究院举办了主题为“状态转换模型:从搜索树到强化学习”的线上讲座。讲座由来自伍伦贡大学的王鹏(Peng Wang)博士主讲,伍伦贡联合研究院教师孙超老师主持。
人工智能领域中状态转换模型的关键点为:模拟世界的状态及由动作触发的状态之间的转换。状态可以视为图中的节点,而转换看作边。这种简化是有用的,因为我们对图模型的理解比较多,并且有很多有效算法来对图进行处理。
王博士概述了树搜索问题、马尔科夫决策过程、强化学习和对抗性游戏是如何相互联系、它们之间的区别和可能的应用场景。王博士还通过实例分析让大家更快地理解其中的知识与原理。
线上讲座圆满成功,同学们针对自己的疑问提出问题,王博士也进行了充分的解答,通过这次活动,同学们对状态模型、强化学习等有了更深的理解和认识。
2017年,王鹏(Peng Wang)博士从昆士兰大学信息技术与电气工程学院毕业,获博士学位。目前是伍伦贡大学计算机与信息技术学院的讲师。他曾担任澳大利亚机器学习研究所的研究员,其研究兴趣包括计算机视觉,深度学习。他在TPAMI、CVPR、ECCV等国际顶级期刊和会议上发表了多篇论文。为ACM MM 2021的研讨会主席和ACCV 2022的指导主席,为TPAMI、CVPR、ICCV和ECCV的审稿人,被ECCV 2020评为优秀审稿人。
记录:温嘉钰
撰稿:张晟睿
排版:耿欣悦