“目前,包括北京、上海、成都等城市在内,正在加快探索基础教育和高中教育阶段生成式人工智能大模型的开发和运用,华青教育集团在这方面的一系列动作,已经跻身国内第一梯队。”北京师范大学数字学习与教育公共服务教育部工程研究中心主任武法提教授如是说。
从2024年4月份酝酿立项,到12月与北师大签约,再到本周公布训练数据,在不到一年时间内,华青教育集团生成式人工智能教育大模型的开发与运用项目取得重大突破,校本数据大模型以及虚拟助手形象“华小青”终于揭开神秘面纱。
DeepSeek的爆火掀起了新一轮AI浪潮,每个行业与领域,甚至每个人都在寻求与人工智能的融合。事实上,华青教育集团所属新世纪小学以及青大附中初、高中,早已开始了人工智能辅助教育教学的实践与探索,在积累大量经验的同时也有着自己的思考——如何让人工智能更有华青教育特色、更好用?如何让青大附中、新世纪的优质教育教学资源形成有效共享,以推动教育更高质量发展?经过多轮研究、探讨、沟通,2024年12月24日,华青教育集团与北京师范大学正式签约,启动生成式人工智能教育大模型的开发与应用。
武法提,北京师范大学教授,国内知名教育技术专家,同时也是“华青校本教育大模型(HuaQing-EduLLM)”的建设开发总指挥。基于华青教育集团教育信息化发展特点和需求目标,双方确定大模型的基本架构,即课堂教学、教师教研和教学评价3个方面,以赋能课堂教学的高效与个性化,赋能学生的核心素养发展及思维能力提升。

据了解,“华青校本教育大模型”采用教育基座“双星”系统,既包括高性能开源模型、高质量通用模型,还有教育领域数据以及华青教育私有数据。其中,华青教育私有数据即华青教育集团旗下3所新世纪小学以及青大附中初中、高中、崂山学校的优秀教育教学成果。目前,来自6所学校的大量优秀教案、试卷等资源作为大模型的数据基座,已经用于对大模型的“投喂”。
“我们要抛开传统应用的诟病,要变革教育模式。”北京师范大学教育学部教育技术学院博士李坦介绍说,通过与Qwen-math和DeepSeek的双向赋能,华青校本教育大模型的科学性将极大提高,在数学、英语作文及思维训练等方面,也将给学生更个性化的体验。比如,大模型可以对知识易错点、难点进行解析,针对每个学生的情况提出学习改进建议,并推荐符合目前状态的例题和范文;包含闯关游戏、双语对话等在内的思维发展模块,可以让学生在趣味性、启发性中进行学习,“培养学生的高阶思维,比如创新思维、批判思维、沟通协作能力等等。”
“华青教育集团属于国内较早进行教育垂类大模型训练的集团。”武法提教授表示,教育大模型主要聚焦更好地进行精准教学、支持个性化学习,但是,真正进行垂类校本大模型开发的学校还非常少,一方面是意识,另外也受限于技术支撑。
据介绍,华青校本教育大模型与其他大模型的区别,主要体现在3个“更”——“更华青”,大量收录集团内大量名师的教育智慧、学校多年积累的教育教学资源,符合华青学生的认知特点、起点水平、学习风格;“更素养”,以新课程标准为导向,指向学生高阶思维的发展,智能时代学校在传递知识的同时,更重要的是发展学生的批判性思维、创新性思维以及协作沟通能力;“更安全”,通过本地化交互,保证学校的管理数据、教师的教学数据、学生的隐私数据等安全性。


