近日,小米正式发布MiMo-V2.5-Pro 系列模型,天数智芯第一时间完成对MiMo-V2.5-Pro的 Day-0 适配,成为首批实现该模型稳定推理部署的通用GPU厂商,为开发者与企业用户提供开箱即用的大模型运行方案。
MiMo-V2.5-Pro作为小米旗舰基座模型,可支撑1T的超大参数量,以及1M超长上下文的模型推理。
MiMo-V2.5-Pro围绕 Agent 场景深度打磨,在工具调用、代码生成、Skills 执行等关键能力全面优化,综合表现对标行业顶尖水平,可支撑复杂任务编排、多轮交互与长上下文理解,在企业服务、智能交互、内容生产等场景具备广泛落地价值。

MiMo-V2.5和MiMo-V2.5-Pro 主要benchmark一览
此次适配中,天数智芯依托自研通用GPU 架构与成熟软件栈,完成深度算子优化、显存调度调优与推理加速,实现MiMo-V2.5-Pro在天数智芯通用 GPU 平台上稳定运行。针对模型大参数量、长上下文特性,天数智芯通过显存高效利用、多卡并行加速与访存瓶颈优化,在标准配置下可流畅支撑高强度推理负载,满足商业化部署要求。
硬件层面,天数智芯通用GPU 产品可高效支撑大模型推理与多并发请求,在端边云协同场景下同样具备灵活扩展能力。软件层面,天数智芯全栈软件栈兼容 PyTorch、vLLM、SGLang 等主流 AI 框架,降低模型迁移成本,缩短上线周期,为开发者提供友好易用的部署环境。
依托持续完善的AI 生态建设,天数智芯已完成多款行业主流基座大模型的适配与性能优化,覆盖通用对话、代码、多模态、智能体等多元场景,形成“模型-芯片-软件-部署”一体化落地能力。此次与小米MiMo-V2.5-Pro的 Day-0 适配,进一步完善公司大模型算力资源支持矩阵,强化在 Agent 时代的算力资源供给能力。
未来,天数智芯将持续深化与小米及更多生态伙伴的技术协同,围绕模型性能优化、场景化落地、开发者生态建设持续投入,以高效、可靠、易用的GPU 算力资源,助力大模型更快走进产业实际应用,推动 AI 技术普惠与生态开放繁荣。
开发者可访问以下链接体验:
MiMo 开放平台: platform.xiaomimimo.com