北京青年报

清华大学在芯片领域获重大突破发布中国AI光芯片“太极”

北京青年报客户端 2024-04-12 19:35

清华大学电子工程系方璐副教授课题组、自动化系戴琼海院士课题组摒弃传统电子深度计算范式，另辟蹊径，首创分布式广度智能光计算架构，研制全球首款大规模干涉衍射异构集成芯片太极（Taichi），实现160 TOPS/W的通用智能计算。该研究成果于北京时间4月12日以《大规模光芯片“太极”赋能160 TOPS/W通用人工智能》为题发表在最新一期的《科学》（Science）上。

光电智能技术交叉创新团队部分成员合影，左三为戴琼海院士、右二为方璐副教授

随着各类大模型和深度神经网络涌现，如何制造出满足人工智能发展、兼具大算力和高能效的下一代AI芯片，已成为国际前沿热点，而算力是训练AI模型、推理任务的关键。光计算，顾名思义是将计算载体从电变为光，利用光在芯片中的传播进行计算，以其超高的并行度和速度，被认为是未来颠覆性计算架构的最有力竞争方案之一。光芯片具备高速高并行计算优势，被寄予希望用来支撑大模型等先进人工智能应用。智能光计算作为新兴计算模态，在后摩尔时代展现出有望超越硅基电子计算的潜力。然而其计算任务局限于简单的字符分类、基本的图像处理等。其痛点是光的计算优势被困在了不适合的电架构中，计算规模受限，无法支撑亟需高算力与高能效的复杂大模型智能计算。帮助光计算“挣脱”算力瓶颈，另辟蹊径，“从0到1”重新设计适合光计算的新架构，是这个清华团队迈出的关键一步。

相异于电子神经网络依赖网络深度以实现复杂的计算与功能，“太极”光芯片架构源自光计算独特的“全连接”与“高并行”属性，化深度计算为分布式广度计算，为实现规模易扩展、计算高并行、系统强鲁棒的通用智能光计算探索了新路径。据论文第一作者、电子系博士生徐智昊介绍，在“太极”架构中，自顶向下的编码拆分-解码重构机制，将复杂智能任务化繁为简，拆分为多通道高并行的子任务，构建的分布式‘大感受野’浅层光网络对子任务分而治之，突破物理模拟器件多层深度级联的固有计算误差。

团队以周易典籍“易有太极，是生两仪”为启发，建立干涉-衍射联合传播模型，融合衍射光计算大规模并行优势与干涉光计算灵活重构特性，将衍射编解码与干涉特征计算进行部分/整体重构复用，以时序复用突破通量瓶颈，自底向上支撑分布式广度光计算架构，为片上大规模通用智能光计算探索了新路径。

据论文报道，“太极”光芯片具备879 T MACS/mm²的面积效率与160 TOPS/W的能量效率，首次赋能光计算实现自然场景千类对象识别、跨模态内容生成等人工智能复杂任务，有望为大模型训练推理、通用人工智能、自主智能无人系统提供算力支撑。“之所以将光芯片命名为‘太极’，也是希望可以在如今大模型通用人工智能蓬勃发展的时代，以光子之道，为高性能计算探索新灵感、新架构、新路径。”方璐副教授说。

文/北京青年报记者雷嘉
编辑/谭卫平