UntetherのAt Memory Compute
Untether Unveils 2-PFLOPS AI Chip, Edge Roadmap (EETIMES)より。
UntetherはHot Chips 34で、第二世代のAI推論チップアーキテクチャBoqueriaを発表した。BoqueriaはSRAM ArrayとPEを組み合わせたAt Memory Compute アーキテクチャを採用し、自然言語処理など大規模ニューラルネットワークの推論を担う。2PFLOPS@FP8 (66W)で、BERT性能は750 クエリ/W/secとなり最新GPUの15倍高速と謳っている。RISC-Vコアを1,400以上搭載、TSMC 7nm, 35mm x 35mm。SpeedAI240は、2023年前半に早期カスタマ向け出荷予定。