作为“人工智能第一城”,北京累计备案上线大模型183款,数量全国第一。豆包、智谱等标杆模型性能稳居全球第一梯队。自2023年以来,国内大模型企业竞相突破,上演了“百模大战”。
“初期很多人投入做大模型很正常,中间可能会有些内耗,但慢慢会分化出来,通过市场竞争、政策引导,大家更清楚自己合适的位置。”北京智谱华章科技股份有限公司董事长刘德兵对记者说。他以该公司从事的基础模型领域为例:基础模型投入太大,要求也更高,很多企业已转去做其他更擅长的行业应用方向。
2025人工智能+大会现场展示的机器人。北京日报记者 王海欣 摄 今年,智谱发布的模型GLM-4.6编程能力取得关键突破,在全球百万用户盲测的大模型竞技场Code Arena上,该模型与GPT-5等并列全球第一。
无论是行业人士,还是普通人,都期待大模型能出现一个“杀手级”的应用,何时才能看到?
“现在对话层面的模型很普遍,但大家更期待大模型智力水平再提升。”刘德兵说,这需要大模型达到L4级,实现自学习自成长,在使用中不断迭代变得更聪明。但实现跃升还有不少技术难点,比如模型的长期记忆机制——这不是一次对话中大模型短暂记住某些事情,而是一旦收到反馈就形成长期记忆,后续模型自己就能判断。
当前,国际主流AI公司都朝着L4级大模型的方向努力,也包括北京企业。“北京有机会有优势率先诞生这种‘杀手级’的应用。”他认为,北京有很多优秀人才,能很快接收到大模型发展的信号并快速跟进,提出自己的一些思路。再加上创业土壤、政策支持,“杀手级”应用在北京诞生值得期待。