巖芯數智發佈自研大模型

情報資訊 2024年01月25日 17:40

标签：人工智能

巖芯數智公司發佈自研的新型自然語言處理大模型「Yan 模型」，該模型不采用傳統的 Transformer 架構，而是使用非 Attention 機制，實現瞭比同等參數 Transformer 更高的訓練效率、推理吞吐和記憶能力。