vivo 大模型云端方案现身 C-Eval,部分指标接近 GPT-4

时间:2023-08-15 23:12:24       来源:搜狐号-IT之家


(资料图片)

IT之家 8 月 15 日消息,继华为小艺、小米小爱同学、OPPO 小布助手升级 AI 大模型能力之后,vivo 也准备在大模型领域发力。

目前,华为、小米、OPPO 相关大模型以及全新智能助手已经开始或即将开始测试,而现在,vivo 自研大模型云端方案也已经出现在 C-Eval 排行榜上,可能会在 OriginOS 4 中为 Jovi 助手带来不一样的东西。

IT之家注:C-Eval 是一个全面的中文基础模型评估套件。它包含了 13948 个多项选择题,涵盖了人文、社科、理工以及其他专业四个大方向,包括 52 个不同的学科和四个难度级别。

从 C-Eval 给出的信息来看,vivo_Agent_LM_7B 是由 vivo AI 全球研究院自主研发的大规模预训练语言模型,从命名不难看出它有着 70 亿参数。

只看最终结果的话,vivo_Agent_LM_7B 最终得分为 64.4 分,位列 C-Eval 第五名,与第二名的 GPT-4 十分接近,甚至在人文领域更强,而且在社会科学领域也有不错的表现。

关键词: