內容 |
AI人工智能是近年來的熱點。CPU和GPU都在提升AI性能。原本都是競爭關系的英特爾、英偉達、ARM也首次聯手推出FP8格式。這種新的AI格式可以提升計算性能,目前最強的加速卡H100的性能提升了4.5倍。
三位專家對通用AI格式的介紹與目前的混亂有一定關系。很多人都知道,以前經常用FP32單精度和FP64雙精度格式來衡量GPU性能。但在AI時代,并不需要這么高的精度,廠商往往會定制自己的計算格式,所以近幾年也出現了INT8、BF16、TF32等AI標準。
,顯然不利于AI技術的發展。于是Intel、NVIDIA、ARM這三大CPU/GPU巨頭聯合推出了AI標準格式FP8,發布了深度學習白皮書FP8 Formats,并將標準提交給IEEE協會,不出意外的話將成為AI領域的通用標準。
據他們介紹,FP8標準將有兩種編碼變體,E5M2和E4M3,可以最大限度地減少與當前IEEE754標準的偏差,不僅為AI計算帶來更高的靈活性,還可以在軟件和硬件之間取得平衡,提高開發者的效率。
從NVIDIA公布的結果來看,FP8在廣泛使用的訓練模型中,效果與16位浮點相似,性能更好。NVIDIA的H100加速卡采用了新的FP8格式,在BERT模式下實現了4.5倍的性能提升。
值得注意的是,三大廠商聯合定義了FP8標準,卻沒有看到AMD。我不知道AMD是什么態度,但AMD最終應該會接受FP8標準,和三家公司統一。
Intel、NVIDIA、ARM 推 FP8 標準 AI:最強顯卡 4.5 倍性能提升 春光千辛萬云消霧散苦明媚11. 這密雨的初夏,因一室的貝殼而憂愁了,那些多色的軀殼,似乎只宜于回響一首古老的歌,一段被人遺忘的詩。但人聲嘈雜,人潮洶涌,有誰回顧那曾經蠕動的生命,有誰憐惜那永不能回到海中的旅魂。29. In 2008, you will see Beijing as beautiful as a garden, with cleaner water and clearer sky.《老子》60.禍兮,福之所倚;福兮,禍之所伏。 東風夜放花千樹,更吹落,星如雨。寶馬雕車香滿路,鳳簫聲動,玉壺光轉,一夜魚龍舞。功蓋三分國,名成八陣圖。ai,nvidia,gpu,amd,intelIn America, there are no such expressions such as in china where “the fat pig gets slaughtered,” or in Japan, where “the nail that sticks out gets hammered down.” |