教育大模型时代彻底来临了?
近日,新东方发布新东方在线App鸿蒙原生版,同时上线加载大模型技术的考研智能学习系统“慧学系统”。至此,国内市值超百亿的教育公司已悉数发布大模型产品。市值最大、目前已超800亿元的新东方是最后发布的公司。
比新东方姗姗来迟更值得关注的是,其首发的大模型产品来自考研业务,而非行业应用更普遍的K12业务。新东方考研业务为何成为大模型应用的试水者?
对于行业来说,新东方的加入让技术应用趋势更加明显。虽然教育大模型时代已然来临,但仍处于起步阶段,接下来如何发展还要迈过几道坎。
上线自动批改和命题功能
新东方并不被认为是一家技术引领型公司,如今拥抱大模型技术,其实已经落后于行业。
早在2023年7月,网易有道就发布了国内首个教育大模型“子曰”。此后,作业帮、好未来、希沃、猿辅导都发布了自研大模型,有的还研发了不止一套模型。国内市值超百亿的教育公司中,中公教育、豆神教育、华图教育都发布了大模型产品。高途、粉笔、学大教育、松鼠Ai等市值不足百亿的头部公司都已应用了大模型。
新东方其实也已在业务中应用了大模型技术。在今年4月的阿里云AI智领者峰会上,新东方大学事业部P端产品负责人张辰介绍,新东方应用大模型技术分析学员与老师的沟通内容,进而提出沟通改进建议,提升学员满意度;应用大模型技术分析课程和学习资料,进而拆解、分析知识结构,提升学员上课效率。
总体上,这一阶段的探索是将大模型技术用于公司内部生产流程,以提高效率。现在,慧学系统则提供了面向学员的新功能。
首先是自动批改。据介绍,慧学系统的AI批改功能支持考研全部科目的客观题以及英语的主观题,特别是作文批改。
写作是学生提升成绩的重要单项,批改作文也就成了考生在备考时的集中需求。老师批改作文的速度与质量直接影响学生的满意度。
新东方大学生学习与发展中心在线国内事业部总经理洪喆介绍,过去,老师批改完一张模考试卷大约需要10分钟,现在人机协作仅需约2分钟就能完成。
其次是自动命题。考研的真题数量较少,但考生又需要大量练习和模拟考试。大模型技术可以根据学科核心知识点和考察难度自动生成模拟题。
以题库较少的西医综合必考科目为例,新东方第一批次就直接生成4000道题,匹配到整个科目6000个核心知识点。
这项技术的挑战在于如何平衡自动命题的准确性和适用性,即不能为了追求题目的准确性而生成大量的“水题”。
洪喆表示,这要求教师在系统中提前录入经过标注和分层的知识点,从而让系统在自动命题时能够动态匹配不同方面、不同难度的知识点。
为何首先落地考研业务
新东方为何在考研业务中率先落地大模型产品?
首先,这与新东方的内部业务结构有关。新东方主要教育业务中,非学科类培训业务学员人数众多,截至今年8月31日的最新财季报名人数约48.4万人。但非学科类培训业务还处在发展早期,品类较多且差异较大,对于AI技术的规模化应用有一定障碍。出国考试准备业务也是一项重要业务,但托福、雅思等考试的练习、测试等资源已经较为成熟和丰富。
考研业务同样体量庞大,新东方大学生学习与发展中心考研项目总监李琳介绍,今年新东方考研业务学员人数超40万人次,这几乎接近2025年全国考研报名人数的十分之一。如此庞大的用户规模,给大模型技术提供了应用场景。
其次,这与新东方考研用户需求有关。李琳介绍,近年来新东方考研用户多样化特征明显,除了应届高校毕业生之外,往届毕业生、在职人群显著增加。“在职人群已占新东方考研业务用户的20%。”李琳告诉21世纪经济报道记者。用户画像能继续细分,比如在职人群中还可以细分出“宝妈”群体、多次考研群体等。
复杂的用户群体带来了复杂的用户需求,学员的学业基础、学习习惯、日程安排差异很大,势必需要借助AI技术提供定制化、个性化服务。
第三,这与考研培训行业的外部竞争有关。近年来,考研培训市场格局发生激烈变动。李琳认为,以前的考研培训市场呈倒三角形,全国性的大型机构所占市场份额较大,现在则呈现梯形,腰部机构增长势头良好。
所谓“腰部机构”,是指在考研细分领域表现出色的中小型机构。比如,有的机构聚焦于艺术类、MBA考研培训,用户人数不多,但年收入可达上亿元。甚至有小型培训机构专门针对报考某一所高校研究生的考生开展培训。
这类机构在品牌影响力、抗风险能力等方面难以与大机构匹敌,但主打垂直领域的差异化优势。大机构在垂直领域服务方面,也需要借助AI技术提供定制化、个性化服务。
新东方选择从考研这个细分业务开始应用大模型技术,其实是行业趋势。可资比较的是公考培训行业,粉笔、华图教育、中公教育三大巨头都发布了大模型产品,但应用场景各不相同。粉笔侧重于题目答疑和辅导、华图教育专注于面试环节辅导、中公教育则将大模型与数字人技术结合用于教学辅助。
一位教育行业人士告诉21世纪经济报道记者,“对于大模型的教育应用,越垂直可能越专业,效率就越高。”
“模型即应用”是必然方向
对于教育行业来说,随着头部公司悉数落地大模型产品,教育大模型的发展路线愈益清晰。
近日,在2024人工智能大模型产业大会上,中国企业评价协会与中关村数智人工智能产业联盟联合发布了《2024中国大模型企业TOP50发展报告》。其中,希沃大模型和学而思九章大模型两个教育大模型进入TOP50。
该报告指出,大模型的技术水平正从千亿参数向万亿参数迈进。目前,参数规模超过1000亿的企业数量达到25家,超过万亿参数的企业有7家。
教育大模型的参数水平难以与已迈上万亿级别的通用大模型相比,这意味着“模型即应用”是教育大模型的必然方向。
“大多数教育公司不需要去开发基座模型,就好像教育公司没必要去自研云服务一样,这种标准化的基座服务未来只需要向少数科技巨头购买即可,教育公司要做的是在基座之上调适、应用自己的数据。”上述教育行业人士说。
对于教育公司来说,未来“模型即应用”的发展仍要迈过几道坎。
首先是选择生态。“英伟达在人工智能芯片市场的市场份额高达80%,重要原因在于英伟达开发了基于GPU的通用并行计算平台和编程模型CUDA,从而构建起英伟达软件生态的基座。”上述教育行业人士说。
值得注意的是,新东方考研大模型产品首先在鸿蒙系统中落地。原因是多方面的,包括新东方很早就开始在鸿蒙生态中投入研发,新东方旗下的智慧教育业务还基于开源鸿蒙开发了产品线,以及越来越多的新东方考研学员反馈已将手机迁移至鸿蒙系统等。
但目前,鸿蒙生态仍处于发展早期。新东方要想面向更大规模的用户推广大模型产品,还需要将产品覆盖到体量更大的安卓等生态。
至于更直接相关的大模型生态,未来谁能胜出,成为应用最广泛的基座模型,还远未见分晓。
其次是降低成本。“模型即应用”的商业模式已经在教育领域跑通,比如开展会员制订阅服务等,但投入产出之间的平衡仍需摸索。
以考研为例,这是一个每年只有约300亿元规模的小市场。第三方调研显示,愿意承担5000元以上客单价消费的用户不足20%。叠加消费能力下降、考研报名人数减少等因素,教育公司在大模型产品研发、上线时,需要慎重考虑成本与收益。
上述教育行业人士认为,这在今后的发展中会形成越来越强的张力。一方面,出于成本和实际应用效果考虑,低成本、应用成熟技术路线的大模型产品能够实现降本增效,辅助教学;但另一方面,大模型技术被认为能带来颠覆现行教育模式的重要变革,在这个过程中,可能要不断用新技术取代现行技术,这不仅需要超前投入,还有可能产生浪费,但却是发展过程中必经的阶段。