Sections
Left Column
Right Column
Text Area
AC-Transformer: 高能效的AI加速器晶片
Text Area
核心優勢
- 基於算法-硬件協同設計理念,以及中心自研的AI晶片設計自動化工具,打造高能效的AI加速器晶片
- 原生支援Transformer與CNN雙架構,實現多模態AI運算能力,以及從單晶片到多晶片叢集的彈性擴展能力
- 透過突破性創新成果,顯著提升大模型推理能效比,並成功在ISSCC2025上發表
Text Area
晶片亮點
- 獨創注意力機制稀疏運算,以及無縫兼容卷積運算的稀疏性,實現運算效率提升300%
- 非線性算子硬件融合架構,完美支援Softmax、LayerNorm、GeLU等18類複雜運算
- 智慧記憶體調度策略,透過層融合與算子切分,降低60%儲存壓力
Text Area
晶片參數
| Process node | TSMC 28nm HPC+ |
| Metal stack | 1p9m_6X1Z1U |
| Voltage | I/O: 1.8V Core: 0.65v ~ 1.0v |
| Data Precision | INT8 |
| Process clock | 200 - 625MHz |
| Peak performance | 2.56TOPS/s |
| Logic gates | 6M |
| SRAM Size | 3.28MByte |
| Hard IP | PLL |
| Soft IP | ARM M0 |
| PAD # | 384 |
| Clock domain | 4 |
| Power (with full NN payload) | MIN: 0.16W @0.65v, 200MHz TYP: 0.75W @0.9v, 500MHz |
| Die size | 3.87mm x 3.60mm |
| Packaging | WB-BGA (11mm x 11mm) |
