据「量子位」报道,李开复领导的零一万物团队开发的Yi-34B-Chat模型在Alpaca经认证的模型类别中表现出色,以94.08%的胜率超越了LLaMA2 Chat 70B、Claude 2和ChatGPT。
此外,Yi-34B-Chat在加州大学伯克利分校主导的LMSYS ORG排行榜中以1102的Elo评分跻身最新开源SOTA开源模型之列,其性能表现与GPT-3.5相当。
在SuperCLUE中文大模型基准评测报告2023中,Yi-34B-Chat在多项基准评测中的「SuperCLUE大模型对战胜率」这项关键指标上取得了31.82%的胜率,仅次于GPT4-Turbo。
这些结果表明,Yi-34B-Chat在自然语言处理领域已经达到了很高的水平,并有望在未来的发展中继续取得更好的成绩。