Sections
研究計劃
Image Slideshow
Left Column
Right Column
Text Area

研究計劃1 - AI大模型的存內計算架構設計

解決運算、記憶體及記憶體頻寬的擴展問題,尤其專注於推進基於存內計算(CIM)的晶片架構,以實現AI大模型的超高能效及可擴展部署。

 

Text Area

研究項目1-1:
面向大語言模型應用的ReRAM-SRAM混合架構存內計算的人工智能處理器

Hybrid CIM AI processor

研究項目1-1旨在設計一款混合式存內計算(CIM)人工智能處理器,結合ReRAM與SRAM兩種技術的優勢。ReRAM具備非易失和小體積等優點,但面對轉換成本高昂與電阻變異等挑戰;SRAM技術成熟且可靠,但佔用面積較大且需大量數據傳輸。透過將ReRAM與SRAM整合至單一計算記憶體單元,本項目致力開發高性能、高效率的處理器,以支持AI大模型推理。此混合設計將包含電晶體級電路設計、分層分段式陣列結構,以及整體晶片記憶體系統,在確保MAC的可靠性和準確性的同時,顯著改善延遲與降低能耗。

Text Area

研究項目1-2:
基於存內計算技術的個人化大語言模型設備研究

On-device learning of large-scale models with algorithm-CIM hardware co-design

研究項目1-2透過採用存內計算(CIM)技術,實現具個人化功能的設備,以解決中心式雲端大語言模型(LLM)與多模態大語言模型(LVLM)涉及的私隱與信任問題。研究團隊將這些模型部署於邊緣設備,既能提供個人化回應,同時確保相關數據保留於裝置內。項目將探索模型壓縮、量化及數據篩選等技術,使大模型能適應邊緣設備計算環境。此外,研究將重點優化模型加速技術,以減少延遲與訓練成本。透過開發數據精煉方法與自主學習框架,旨在提升邊緣模型的個人化效能,為未來發展制定技術指南。

Text Area

研究項目1-3:
基於3D非易失記憶體技術的可重構存內計算架構

Reconfigurable CIM based on 3D NVM

研究項目1-3旨在利用鐵電記憶體(Ferroelectric Memory)等3D非易失記憶體(NVM)技術,開發可重構存內計算(CIM)架構,以突破現有CIM 晶片的技術瓶頸。此類技術具備更高記憶體頻寬、更低電壓、更快寫入速度及更為耐用,能顯著提升CIM效能與效率。項目將透過NVM核心單元的重構與動態互聯技術,構建可支持並行搜索、矩陣乘法等多種數據計算的可重構CIM架構。此方案預計能加速各類人工智能計算任務,徹底發揮CIM技術的應用潛能。

 

Text Area

研究項目1-4:
面向AI大模型的以記憶體為中心的異構處理器

Memory-centric heterogeneous architecture with DRAM-based PnM and PuM

研究項目1-4針對限制當代計算系統效能與效率的數據傳輸瓶頸,設計由「以處理器為中心」轉向「以數據為中心」,將處理單元貼近數據存儲位置,探索近數據處理(NDP)與存内計算(PIM)架構。該架構將結合近存計算(PnM)與用存計算(PuM)技術最大限度地提高效益,目標是顯著加速AI大模型及其他數據密集型工作負載,提升系統效能、能耗效率與擴展性,並使各種程式編寫員與系統設計師能輕鬆應用此技術。