智谱与华为开源多模态SOTA模型 基于国产芯片训练

  • 智谱与华为开源多模态SOTA模型 基于国产芯片训练已关闭评论
  • A+
所属分类:智趣科技

【CNMO科技消息】1月14日,国内人工智能企业智谱与华为联合宣布,开源新一代图像生成模型GLM-Image。这一模型基于华为昇腾Atlas 800T A2设备和昇思MindSpore AI框架,完成了从数据到训练的全流程,成为首个在国产芯片上完成全程训练的SOTA多模态模型。

智谱与华为开源多模态SOTA模型 基于国产芯片训练

据CNMO了解,GLM-Image模型的核心技术创新在于其实现了图像生成与语言模型的深度联合。这一融合使模型能够更好地理解文本指令与视觉内容之间的复杂关联,生成更符合语义描述的图像内容。在架构设计上,GLM-Image采用自主创新的 “自回归+扩散解码器”混合架构,面向新一代“认知型生成”技术范式进行了重要探索。这一架构选择既保持了图像生成的多样性和创造性,又确保了与语言模型协同工作时的效率和稳定性。

GLM-Image最重要的突破体现在其对国产算力生态的全面适配。模型训练全程基于华为昇腾Atlas 800T A2设备,运行在昇思MindSpore AI框架上,标志着中国AI产业在自主可控技术路径上迈出了坚实一步。通过与华为的深度合作,智谱成功验证了国产芯片和框架在大规模AI模型训练中的可行性,为整个行业提供了宝贵的实践经验和技术参考。

智谱与华为开源多模态SOTA模型 基于国产芯片训练

在商业化应用方面,GLM-Image展现出明显的成本优势。API调用模式下,生成一张图片的成本仅为0.1元,极大降低了企业和开发者使用先进图像生成技术的门槛。智谱官方表示,速度优化版本即将更新,进一步改善用户体验。这一价格策略与智谱在多模态模型领域一贯的商业化思路一脉相承。

值得注意的是,智谱在多模态模型定价上一直采取积极策略。早在2025年8月推出的GLM-4.5V,其API价格已低至输入2元/百万tokens,输出6元/百万tokens。而在2025年12月开源的GLM-4.6V系列,API价格更是较上一代降低了50%,输入低至1元/百万tokens。