【】Yan模型采用非Transformer架構

為非Attention機製的岩芯通用自然語言大模型。Yan模型采用非Transformer架構 ,数智該大模型有相較於同等參數Transformer的发布7倍訓練效率、5倍推理吞吐和3倍記憶能力 。自研據了解 ,大模岩芯數智正式發布自研大模型“Yan模型”。岩芯1月24日 ,数智发布(文章來源:界麵新聞)
娛樂
上一篇:共話中國經濟新機遇丨從深圳到不來梅——中德汽車業開放合作再上新台階
下一篇:預付款驟增34億 交易方身份不明 洪九果品審計師審不下去