正在加载数据...
当前位置:北方企业新闻网> 产业经济>> 人工智能>正文内容
  • 打造人人可用的通用智能助手
  • 2026年06月23日 来源:科技日报

提要:在杨植麟看来,一个模型最终如何使用不应当仅仅由单一的科技公司来定义,因为每个个体、每个企业都有其独特的应用偏好与场景需求。“每个人都应该有个性化定制的机会。”未来,月之暗面将持续寻找将计算能源转化为高质量通用智能的最优解,致力于实现“把代码变成人人可用的工具”的愿景。同时,在产品侧,企业将更强调“与用户共创智能”的理念。

6月12日,北京月之暗面科技有限公司(以下简称“月之暗面”)发布并开源Kimi K2.7 Code编程模型,参数量达1.1万亿,提供256K上下文窗口。这一模型重点提升了长上下文编程场景的指令遵循能力、长程编程任务的性能表现,并且大幅改善了在长程任务中的过度思考倾向,平均token消耗减少30%。

月之暗面公布的基准测试结果显示,K2.7 Code在多项编程和智能体(Agent)基准测试中较K2.6实现大幅度提升,提升比例从10%到31.5%不等。

Kimi K2.7 Code的发布,是这家创新企业在通用人工智能(AGI)赛道上的又一次技术迭代。创立3年多来,月之暗面已经发布多款通用人工智能模型及版本,推动人工智能向深度实用化演进。目前,月之暗面已成为北京数智产业极具代表性的企业,也是我国最受关注的通用人工智能企业之一。

专注基础模型优化

Kimi K2.7 Code编程模型的基础版,是2025年上线的万亿参数基础模型Kimi K2。值得注意的是,Kimi K2模型参数总规模虽达万亿级别,但通过工程架构优化,其激活参数仅为320亿。这种设计意味着模型能够在较低的算力成本下,开展更加复杂的计算与推理工作。

低成本与高效率这对看似矛盾的目标是如何同时达成的?月之暗面的答案是“从底层技术找突破点”。

月之暗面总部位于北京市海淀区知春路。2023年4月,在生成式人工智能技术引发全球科技变革的背景下,拥有10年自然语言处理(NLP)研发经验的杨植麟与团队成员一同创办了这家企业。

“公司目前拥有约300人的科研与工程团队,其中‘90后’员工占据了一大半。”月之暗面人力资源部门负责人告诉记者。

在这个精干的集体中,算法和基础设施领域研发人员的专业方向涵盖了自然语言处理、计算机视觉、强化学习、高性能计算等多个交叉学科。团队成员不仅参与过国际主流深度学习框架的开发,更在超大规模计算集群的运维和性能优化方面积累了丰富的工程经验。

这群年轻的科研人员普遍奉行“用时间换空间,用积累换突破”的研发哲学。在大模型行业初期热衷于拼参数规模、急于抢发过渡性案例的风潮中,团队选择保持战略定力,将主要精力倾注于基础模型的底层架构优化。

这种对底层技术创新的执着,体现在对“无损长文本”技术的攻坚上。2023年10月,Kimi智能助手首发上线,“长文本处理”成为其核心标签。

月之暗面Kimi研究员杜羽伦将长文本能力形象地比作计算机的“内存”:“内存越大,大模型能同时处理和理解的信息就越多,能做的事情自然就越复杂。”在当时的技术路径中,团队拒绝了众多业内常见的“技术捷径”,坚持对底层数据进行严格的无损压缩。

市场的客观数据验证了这种底层创新的价值。在公司创办一年后的2024年,Kimi的用户量便实现了百倍的增长,从最初的几十万跃升至几千万。用户群体的迅猛发展,为企业后续推出Kimi开放平台、浏览器助手以及深度研究模型提供了充足的空间。

技术谱系加速迭代

注重底层技术,既是月之暗面的初心,也是企业在发展历程中做出的动态选择。回顾Kimi核心基座模型的研发历程,2025年是企业关键的战略调整期。

2025年,面对大模型行业激烈的流量竞争以及用户增长放缓的压力,杨植麟作出决策——缩减大规模市场投流,回归通用基座模型的研发。

这一决策在研发团队内部引发了共鸣。“我们并没有急于将强化学习进行到底,而是选择回到第一性原理,先把基座模型做好。”杜羽伦介绍,团队保持定力,拒绝了抢发过渡性模型的诱惑,重点攻克超大规模智算集群的运维与架构优化。

2025年7月,这一布局结出硕果——月之暗面正式开源发布了全新基座模型Kimi K2。该模型采用混合专家(MoE)架构,在工程上实现了能效平衡。Kimi K2发布后,迅速引发了国际开源社区的关注。

此后,K2技术谱系的迭代速度明显加快。今年1月初,团队推出并开源了K2.5模型,主打代码及视觉理解;4月发布的K2.6版本,扩容Agent集群能力,该模型登顶开源模型第一;6月发布的K2.7新版本,强化长代码工程与多工具Agent能力。

杨植麟表示,团队将在做好风险控制的前提下持续突破,希望能在未来十年、二十年内,持续推出有竞争力的模型。“如进展顺利,K3系列模型可能在今年暑期就会上线。”杨植麟透露。

杨植麟曾将AI研发比作攀登一座“无限的山”。正是这种对底层技术研发的坚持,为多模态演进和长程任务执行积累了核心技术储备。

营造共享开源生态

与众多企业致力于针对特定垂直行业开发定制化软件、培养“超级员工”的思路不同,月之暗面自创立之初,其研发重心就锚定通用泛化能力。

“通用技术更复杂,有更多瓶颈,是一条更难走的路。”杨植麟坦言。

在团队的构想中,未来的大模型应当具备跨领域的自适应学习能力,即模型在某一特定场景中学会新技能后,能够将沉淀下来的逻辑与知识自主反哺到其他核心能力上,从而走向真正的全能与通用。

与采取封闭策略的部分技术路线不同,月之暗面选择将研发成果开源。团队研发人员表示,此举旨在降低广大开发者和中小企业调用高质量AI能力的门槛,让开源生态中的每一个独立个体都能享受技术红利,共同推进应用层面的创新。

这一共享举措的背后,源自企业对通用人工智能长远发展图景的思考。

在杨植麟看来,一个模型最终如何使用不应当仅仅由单一的科技公司来定义,因为每个个体、每个企业都有其独特的应用偏好与场景需求。“每个人都应该有个性化定制的机会。”

未来,月之暗面将持续寻找将计算能源转化为高质量通用智能的最优解,致力于实现“把代码变成人人可用的工具”的愿景。同时,在产品侧,企业将更强调“与用户共创智能”的理念。

让尖端技术褪去神秘面纱,打破“千人一面”的智能化技术壁垒,让每一位普通人都能拥有专属、全能且普惠的通用智能助手。这既是这家诞生于中关村的年轻企业攻坚AI前沿的初心,也是鼓舞其在探索人工智能极限的征途中持续前行的信念。




责任编辑:周峰菊
相关新闻
    没有关键字相关信息!
新闻排行