黑芝麻智能近日震撼發布了其專為前沿AI模型量身定制的高性能芯片平臺——華山A2000系列,標志著自動駕駛技術邁入了一個全新的發展階段。
華山A2000系列涵蓋A2000 Lite、A2000以及A2000 Pro三款力作,每一款產品都精準定位了不同層次的自動駕駛需求。A2000 Lite以其卓越的城市智能駕駛能力脫穎而出;A2000則全面支持各種場景下的智能駕駛,展現了廣泛適用性;而A2000 Pro更是專為高階、全場景的智能駕駛而設計,樹立了技術新標桿。
這一系列芯片內部集成了CPU、DSP、GPU、NPU、MCU、ISP以及CV等多種功能模塊,實現了前所未有的高度集成化和單芯片多任務處理能力。尤為其新一代ISP技術憑借4幀曝光和150dB HDR的卓越性能,在隧道、夜間等復雜環境下展現出更為出色的圖像處理能力。
華山A2000系列在數據處理方面同樣表現出色,其單芯片數據閉環設計能夠在智能駕駛功能正常運行的同時,高效完成全車數據的脫敏、壓縮、編碼和存儲,進一步提升了數據處理的效率和安全性。
在算力方面,華山A2000系列更是達到了當前主流旗艦芯片的4倍,原生支持Transformer模型,靈活擴展性使得多芯片算力可以輕松擴展,滿足從NOA到Robotaxi等不同級別的自動駕駛需求。
華山A2000系列芯片的應用領域遠不止智能汽車。它們同樣能夠支持機器人和通用計算等多個領域,特別是在機器人產業中,A2000芯片能夠滿足機器人的“大小腦”需求,為機器人從原型開發到大規模量產提供了強有力的支持。
黑芝麻智能此次還推出了自研的NPU新架構——九韶。作為AI芯片的計算核心,九韶架構專為滿足自動駕駛技術需求而設計,支持新一代通用AI工具鏈BaRT和新一代雙芯?;ヂ摷夹gBLink。
九韶NPU采用大核架構,支持智能駕駛大模型的實時推理,混合精度包括INT8/FP8/FP16,并集成了針對高精度精細量化和Transformer的硬加速,極大地簡化了開發者在量化和部署過程中的工作。
同時,九韶NPU還具備低延時和高吞吐的三層內存架構,包括大容量高帶寬的NPU專用緩存、核心模塊片內共享緩存,以及對稱的雙數據通路和專用DMA引擎。這些設計不僅提升了性能和有效帶寬,還降低了對外部存儲帶寬的依賴。
為了充分發揮九韶NPU的潛力,黑芝麻智能還研發了新一代通用AI工具鏈BaRT。BaRT支持多種流行框架和模型的轉換,原生兼容PyTorch的推理API,并支持Python編程部署,使得開發者能夠更加便捷地利用九韶架構進行AI模型的開發和部署。
BaRT還支持業界主流的Triton自定義算子編程,允許開發者使用Python語言編寫Triton自定義算子,這些算子可以被自動化編譯成硬件加速代碼,從而進一步加速AI模型的部署。
新一代雙芯?;ヂ摷夹gBLink則通過支持Cache一致性互聯的高效C2C技術,擴展支持更大規模模型的算力需求,為算法長期演進奠定了堅實基礎。通過BLink技術,華山A2000系列芯片能夠實現軟件單OS跨片部署,支持高帶寬C2C一致性連接,滿足NUMA跨芯片訪存要求,顯著簡化了軟件開發和部署的難度。