在多個通用能力評測如 CMMLU、GAOKAO 和 AGI-Eval 中,Baichuan 3 在中文任務上超越瞭 GPT-4 ... Baichuan 3 的醫療數據集 Token 數超千億,在 MCMLE、MedExam、CMExam 等中文醫療任務的評測成績超過 GPT-4,USMLE、MedMCQA 等英文醫療任務的評測成績也逼近瞭 GPT-4 的水準。