“中国正在以更快的速度赶上。”前OpenAI研究员、现AI企业家安德鲁·卡尔(Andrew Carr)称。他表示,深度求索的研究人员尝试复制OpenAI的推理模型,“在几个月内就弄明白了。坦白说,我的许多同事对此感到惊讶”。
月之暗面创始人杨植麟表示,公司专注于强化学习,也就是模仿人类的试错过程。这种方法或许能够在提升模型性能的同时不需要那么多的算力。

月之暗面创始人杨植麟
自去年年底以来,AI开发人员越来越多地使用一种名为“混合专家”(MoE,Mixture of Experts)的模型技术。该技术的核心是通过组合多个“专家”模型来协同完成任务。每个“专家”都是一个独立的神经网络,它们各自负责处理不同的数据分布和任务类型。这些“专家”之间通过一种称为“路由”的机制进行交互,路由机制根据任务的特点和需求,将输入数据分配给最适合的“专家”进行处理。