港人灣區生活

Hi, 请登录

李開復旗下零一萬物開源大模型被指抄襲 Meta

” 零一萬物 ” 是一傢由李開復創辦的 AI 大模型創業公司,上周推出瞭兩個開源大模型 Yi-34B 和 Yi-6B。該公司聲稱 Yi 系列大模型擁有全球大模型中最長的上下文窗口,其中 Yi-34B 在 Hugging Face 英文測試榜單中位列第一,在 C-Eval 中文能力排行榜中超越所有開源模型。然而在 Yi-34B 的 Hugging Face 開源主頁上,開發者 ehartford 質疑稱該模型使用瞭 Meta LLaMA 的架構,隻對兩個張量(Tensor)名稱進行瞭修改,分別為 input_layernorm 和 post_attention_layernorm。ehartford 表示開源社區肯定會重新發佈 Yi 大模型,並重命名張量以符合 LLaMA 架構。他希望該公司在模型獲得大量采用之前考慮將這一更改應用到官方模型中,下方則引來瞭多方議論。

相关推荐

评论

  • 昵称 (必填)
  • 邮箱
  • 网址