国产TPU加速产业化落地专用算力成AI自主可控新突破口-新华网

新华网上海6月14日电（史依灵）随着人工智能大模型加速落地应用，全球算力架构正迎来新一轮调整。面向深度学习场景定制优化的TPU（张量处理单元），凭借高能效、低成本的优势，正成为我国高端算力实现自主可控的重要突破口之一。

我国本土企业中昊芯英深耕TPU全栈自研领域，历经七年技术攻关，完成芯片量产与生态全面适配，在专用算力赛道走出一条差异化发展之路。近日，中昊芯英创始人、董事长杨龚轶凡接受新华网专访表示，国产TPU凭借差异化技术优势正迎来规模化发展的黄金机遇期。

杨龚轶凡说，传统GPU（图形处理器）架构设计偏向通用计算，在大模型高并发训练、推理场景中，芯片资源利用率难以充分释放。针对这一行业痛点，面向大模型定制的DSA（领域专用架构）成为发展方向，TPU便是当前业界公认的主流选择之一。

据介绍，中昊芯英坚持从“0”到“1”自主研发，已完成自主指令集、核心数字IP、芯片架构、编译器等全链条设计，先后完成架构仿真验证、芯片设计、后端测试与流片量产。目前企业已推出第一代面向大模型应用的TPU产品。

软件生态适配一直是国产算力芯片发展的难点，中昊芯英依托TPU架构特性大幅降低了适配门槛。GPU生态需要支撑上万种算子，而聚焦大模型场景的TPU仅需适配三百余个核心算子，研发工作量和技术难度显著下降。经过两年多攻坚，中昊芯英自研软件栈已实现对DeepSeek、智谱、通义千问等国内主流大模型的全面适配，同时兼容PyTorch、飞桨等主流深度学习框架，完成了芯片从“可用”到“好用”的转变。

放眼全球，谷歌、亚马逊、特斯拉等全球科技企业纷纷布局TPU及同类专用算力产品，释放出人工智能产业全面进入规模化落地期的明确信号。行业发展重心也随之转变，企业不再单纯关注芯片基础性能，而是更加看重算力方案的综合投入产出效率。业内普遍认为，专用化、定制化算力芯片将逐步成为市场主流，若未能及时布局该领域，我国未来或将面临新的技术壁垒。

“未来三年至五年，将是我国构建自主可控算力体系的黄金时期。”在杨龚轶凡看来，未来随着芯片持续迭代、生态不断完善与应用场景持续拓展，国内芯片设计层面的自主可控体系将逐步成型。

杨龚轶凡透露，现阶段中昊芯英正推行“新模联动”发展策略，与大模型、算法企业深度协同，打造端到端一体化优化方案。中昊芯英计划在1年至2年内，将当前大模型应用算力使用成本降至原有水平的十分之一以内，进一步降低AI技术落地门槛。

业内人士表示，大模型时代的算力竞争，是架构、生态、成本与供应链安全的综合比拼。以TPU为代表的国产专用算力路线，能够与通用GPU形成互补，丰富我国算力供给结构。（完）

【纠错】【责任编辑:许超】

国产TPU加速产业化落地 专用算力成AI自主可控新突破口

国产TPU加速产业化落地 专用算力成AI自主可控新突破口

国产TPU加速产业化落地专用算力成AI自主可控新突破口

国产TPU加速产业化落地专用算力成AI自主可控新突破口