巖芯數智公司發佈自研的新型自然語言處理大模型「Yan 模型」,該模型不采用傳統的 Transformer 架構,而是使用非 Attention 機制,實現瞭比同等參數 Transformer 更高的訓練效率、推理吞吐和記憶能力。