Sections
Left Column
Right Column
Text Area
AC-Transformer: 高能效的AI加速器芯片
Text Area
核心优势
- 基于算法-硬件协同设计理念,以及中心自研的AI芯片设计自动化工具打造高能效的AI加速器芯片。
- 原生支持Transformer与CNN双架构,实现多模态AI计算能力,以及从单芯片到多芯片集群的弹性扩展能力
- 通过突破性创新成果显著提升大模型推理能效比,成功在ISSCC2025上发表论文
Text Area
芯片亮点
- 独创注意力机制稀疏运算以及无缝兼容卷积运算的稀疏性,实现计算效率300%提升
- 非线性算子硬件融合架构,完美支持Softmax、LayerNorm、GeLU等18类复杂运算
- 智能内存调度策略,通过层融合+算子切分降低60%存储压力
Text Area
芯片参数
| Process node | TSMC 28nm HPC+ |
| Metal stack | 1p9m_6X1Z1U |
| Voltage | I/O: 1.8V Core: 0.65v ~ 1.0v |
| Data Precision | INT8 |
| Process clock | 200 - 625MHz |
| Peak performance | 2.56TOPS/s |
| Logic gates | 6M |
| SRAM Size | 3.28MByte |
| Hard IP | PLL |
| Soft IP | ARM M0 |
| PAD # | 384 |
| Clock domain | 4 |
| Power (with full NN payload) | MIN: 0.16W @0.65v, 200MHz TYP: 0.75W @0.9v, 500MHz |
| Die size | 3.87mm x 3.60mm |
| Packaging | WB-BGA (11mm x 11mm) |
