人工智能学院研究生参与ICT&UCAS&PCL联合团队在常识推理评测世界大赛中获优异成绩取得单模型性能突破

人工智能学院
日期：2023-01-19
8407

1月16日，由中国科学院大学、中国科学院计算技术研究所、鹏城实验室组成的联合团队（ICT&UCAS&PCL）提出的模型以80.44%的成绩荣登常识推理挑战赛CommonsenseQA榜单，刷新单模型（single model）世界纪录，超越由英国艾伦图灵人工智能研究院提出的单模型UnifiedQA（79.1%），成为单模型第一名。该技术由人工智能学院裴正奇同学（系人工智能学院2022级电子信息专业研究生）在中科院计算所王树徽研究员的指导下完成。

CommonsenseQA（CSQA）评测任务由以色列特拉维夫大学创办，数据集包含1.2万个常识推理问题，每道题包含一个正确答案和四个干扰项，需要算法模型从五个选项中选出正确的答案。CSQA自2018年启动以来，累积吸引了微软、Facebook AI、斯坦福、阿里达摩院、艾伦AI研究院、CMU等国际知名机构参与。自从CSQA大赛官方禁用ConceptNet以来，榜单已有一年未更新，此前的单模型（single model）第一名是艾伦AI研究院提出的UnifiedQA，多模型（ensemble model）第一名是华为提出Albert+SFR。近日由我校团队以动力学类脑架构作为切入点，提出的单模型在官方盲评测试集的准确率比UnifiedQA高1.34%，且其参数规模仅为UnifiedQA的2.12%。

常识推理是难度最高的自然语言处理（NLP）任务之一，需要机器算法充分理解自然语言中错综复杂的知识，并且具备一定的因果推理能力，是实现通用人工智能的必经之路。

裴正奇

中国科学院大学 人工智能学院

人工智能学院研究生参与ICT&UCAS&PCL联合团队在常识推理评测世界大赛中获优异成绩 取得单模型性能突破

中国科学院大学人工智能学院

人工智能学院研究生参与ICT&UCAS&PCL联合团队在常识推理评测世界大赛中获优异成绩取得单模型性能突破