7月21日至23日,第八届英语教学与测评学术研讨会在贵州贵阳召开。江苏大学教育测评循证研究中心主任黄金雁教授联合上海电机学院、南昌交通学院、北京印刷学院师生组成的跨校际科研团队,开展了主题为“人工智能辅助外语教学评估:中国课堂环境下的比较评估研究”的专题研讨。

报告一“ChatGPT与人类评估者在英语作为外语口语评估中的比较分析及其对评估的启示”,由上海电机学院外国语学院李俊飞副教授和江苏大学教师教育学院研究生邓亚楠共同汇报。报告指出AI在整体评分和分步评分方面具有优势,而人类教师在语境理解、情感识别和个性化指导方面仍不可替代,两者结合将构建更加科学高效的评估体系。

报告二“当AI走进口语课堂:关于GPT-4o与Qwen-2.5-Omni在口语评估任务中表现差异的综合分析报告”,由江苏大学教师教育学院研究生王玥涵和黄超共同汇报。研究采用混合研究方法比较了GPT-4o和Qwen-2.5-Omni 两个大语言模型在评估逻辑有效性、分析深度与广度、评分与反馈一致性、改进建议价值四个维度上的本质区别。

报告三“AI遇上EFL写作:ChatGPT赋能写作课堂评估”,由南昌交通学院文法学院洪娃老师和江苏大学教师教育学院研究生阮盈盈共同汇报。报告指出AI在提供即时反馈、语法纠错和结构分析方面具有优势,而人类教师在逻辑深度把握、文化语境融入和创造性思维引导方面仍不可替代,两者结合将构建更加精准有效的写作评估体系。

报告四“AI遇上EFL写作: DeepSeek赋能写作课堂评估”,由北京印刷学院基础教育学院吴文彦老师和江苏大学教师教育学院研究生田英平共同汇报。研究包括量化评分和质性反馈两个层面,揭示了人工与AI评分者在作文评估中的差异。

近年来,江苏大学教育测评循证研究中心聚焦“人工智能技术在英语教学中的评估与应用”开展了系列研究。在本次研讨会上,团队成员基于测评视角,系统探讨了多个主流AI模型在英语口语和写作评估中的表现差异及其教学启示,为外语教育数字化转型提供了重要的实证支撑。