商汤(00020.HK)大装置事业群研发总监张行程出席华为全联接大会2024时表示,多年来商汤大模型基于升腾原生开发进行实践,共同推进基础模型、行业大模型应用与创新,通过高效并行、通信优化及网络架构感知和任务调度等技术改善,构建大规模并行训练加速系统。
其中102B模型的训练性能已达到业界的120%以上,同时单一任务集群规模扩展至3倍,算力效率损失仅为3%,线性加速比可高达97%以上。他又指,基于升腾计算生态,商汤已建设长序列并行训练加速机制,与业界相比,4K序列性能提升1倍以上,32K序列性能持平,更可处理128K长序列训练。
他表示,通过与升腾团队合作,商汤已将全栈大模型生产能力产品化,构建从基础层、模型层、串联层到应用层的高效、完备、易用的大模型生产工具链。