新闻

溥渊教师获2023认知计算与系统国际会议最佳论文奖

发布时间:2023-11-17

近日,在新疆乌鲁木齐举办的第二届认知计算与系统国际会议上(ICCCS 2023),溥渊未来技术学院助理教授张颂安老师一作撰写的论文Quickly Adaptive Automated Vehicle's Highway Merging Policy Synthesized by Meta Reinforcement Learning with Latent Context Imagination获得本次会议唯一的最佳论文奖。智能网联电动汽车创新中心庄瀚洋老师也参与了相关工作。



在不同地区和驾驶条件下,自动驾驶车辆以适当的驾驶风格执行高速公路并道是至关重要的——安全、高效地行驶,而不会惹恼或危害其他道路使用者。尽管已有许多工作对于快速适应不同环境并将其应用于自动驾驶政策的元强化学习(Meta Reinforcement Learning)进行过探讨,但大多数最先进的算法要求对任务分布进行密集覆盖,并为每个元训练任务提供大量数据,这对汽车行业来说成本非常高。

论文提出了IAMRL,一种基于上下文的元强化学习(context-based Meta RL)算法,其中元想象减少了现实世界的训练任务和数据需求。论文通过对学到的潜在上下文空间进行插值进行元想象。在变道决策实验中,该方法能够仅依赖少量目标域场景的数据,便可以完成策略的迁移,相比目前的前沿方法,所需数据量可以减少数十倍以上。


IAMRL算法框架


教师简介:


张颂安,溥渊未来技术学院长聘教轨助理教授,智能网联电动汽车创新中心成员,主要从事自动驾驶汽车决策系统算法设计方面的研究。张颂安老师2013年和2016年于清华大学车辆工程系分别获得本科和硕士学位,2021年于美国密歇根大学机械工程系获得博士学位,导师为Mcity Director彭晖教授。毕业后,张颂安老师加入美国福特汽车公司机器人研究所做研究员,并担任福特-大学联合项目机器人方向提案评审组Committee Chair。2023年加入溥渊未来技术学院。


庄瀚洋密西根学院助理研究员,智能网联电动汽车创新中心成员,主要从事无人车辆和车路协同的系统研究和开发工作,包括车端与路端的环境感知、调度和规划等。庄瀚洋于2011年和2018年于上海交通大学密西根学院分别获得本科和博士学位。2020年以博士后身份加入上海交通大学密西根学院,2022年留在密院任职助理研究员。主持自然科学基金青年项目和多个产学研合作项目。


会议简介:

认知计算与系统国际会议由中国自动化学会认知计算与系统专业委员会发起,旨在集来自不同专业领域的专家,讨论认知系统和智能信息处理的最新技术,并提出新的研究成果和未来发展前景。以促进认知计算及系统相关领域的研究与开发为契机,为从事认知计算及系统相关领域的学者、工程师、教师和学生提供面对面的交流平台,促进人工智能技术在工业中的应用,以智能产业带动地方经济发展。