新华网上海6月14日电(史依灵)随着人工智能大模型加速落地应用,全球算力架构正迎来新一轮调整。面向深度学习场景定制优化的TPU(张量处理单元),凭借高能效、低成本的优势,正成为我国高端算力实现自主可控的重要突破口之一。
我国本土企业中昊芯英深耕TPU全栈自研领域,历经七年技术攻关,完成芯片量产与生态全面适配,在专用算力赛道走出一条差异化发展之路。近日,中昊芯英创始人、董事长杨龚轶凡接受新华网专访表示,国产TPU凭借差异化技术优势正迎来规模化发展的黄金机遇期。
杨龚轶凡说,传统GPU(图形处理器)架构设计偏向通用计算,在大模型高并发训练、推理场景中,芯片资源利用率难以充分释放。针对这一行业痛点,面向大模型定制的DSA(领域专用架构)成为发展方向,TPU便是当前业界公认的主流选择之一。
据介绍,中昊芯英坚持从“0”到“1”自主研发,已完成自主指令集、核心数字IP、芯片架构、编译器等全链条设计,先后完成架构仿真验证、芯片设计、后端测试与流片量产。目前企业已推出第一代面向大模型应用的TPU产品。
软件生态适配一直是国产算力芯片发展的难点,中昊芯英依托TPU架构特性大幅降低了适配门槛。GPU生态需要支撑上万种算子,而聚焦大模型场景的TPU仅需适配三百余个核心算子,研发工作量和技术难度显著下降。经过两年多攻坚,中昊芯英自研软件栈已实现对DeepSeek、智谱、通义千问等国内主流大模型的全面适配,同时兼容PyTorch、飞桨等主流深度学习框架,完成了芯片从“可用”到“好用”的转变。
放眼全球,谷歌、亚马逊、特斯拉等全球科技企业纷纷布局TPU及同类专用算力产品,释放出人工智能产业全面进入规模化落地期的明确信号。行业发展重心也随之转变,企业不再单纯关注芯片基础性能,而是更加看重算力方案的综合投入产出效率。业内普遍认为,专用化、定制化算力芯片将逐步成为市场主流,若未能及时布局该领域,我国未来或将面临新的技术壁垒。
“未来三年至五年,将是我国构建自主可控算力体系的黄金时期。”在杨龚轶凡看来,未来随着芯片持续迭代、生态不断完善与应用场景持续拓展,国内芯片设计层面的自主可控体系将逐步成型。
杨龚轶凡透露,现阶段中昊芯英正推行“新模联动”发展策略,与大模型、算法企业深度协同,打造端到端一体化优化方案。中昊芯英计划在1年至2年内,将当前大模型应用算力使用成本降至原有水平的十分之一以内,进一步降低AI技术落地门槛。
业内人士表示,大模型时代的算力竞争,是架构、生态、成本与供应链安全的综合比拼。以TPU为代表的国产专用算力路线,能够与通用GPU形成互补,丰富我国算力供给结构。(完)

