伪娘露出国产大模子竞技场首超GPT-4o！零一万物GLM共同置身Top10

发布日期：2024-10-17 09:42 点击次数：107

国产大模子初度在公开榜单上跳跃 GPT-4o！伪娘露出就在刚刚，"大模子六小强"之一的零一万物幽静对外发布新旗舰模子——Yi-Lightning（闪电）。在大模子竞技场（Chatbot Arena）上，Yi-Lightning 性能直冲总榜单并排第6，数学分榜并排第 3，代码等其它分榜也名列三甲。总得益险些与马斯克最新 xAI 大模子 Grok-2-08-13 合手平，卓著 GPT-4o-2024-05-13、GPT-4o-mini-2024-07-18、Claude 3.5 Sonn

国产大模子初度在公开榜单上跳跃 GPT-4o！伪娘露出

就在刚刚，"大模子六小强"之一的零一万物幽静对外发布新旗舰模子——Yi-Lightning（闪电）。

在大模子竞技场（Chatbot Arena）上，Yi-Lightning 性能直冲总榜单并排第6，数学分榜并排第 3，代码等其它分榜也名列三甲。

总得益险些与马斯克最新 xAI 大模子 Grok-2-08-13 合手平，卓著 GPT-4o-2024-05-13、GPT-4o-mini-2024-07-18、Claude 3.5 Sonnet 等顶流。

同期，国内清华系大模子公司智谱 AI 的GLM-4-Plus也杀进了总榜，位居第 9位。

该榜单收尾来自豪众累积超千万次的东谈主类用户盲测投票。

前段时刻大模子竞技场还刚刚更新了规章，新榜单对 AI 回话的长度和作风等特征作念了降权处理，分数更能反馈模子真确处分问题的才智。

此次 Yi-Lightning 杀出重围，Lmsys 团队有益发帖子，称这是竞技场上的大新闻：

大模子竞技场总榜第六、国产第一

细看大模子竞技场分类榜上的"赛况"，Yi-Lightning 各项才智齐排在前头。

在汉文才智上，Yi-Lightning 和 GLM-4-Plus 两个国产大模子齐名列前位。

Yi-Lightning 跃居并排第二，和 o1-mini 收支无几。

数学才智，Yi-Lightning 和 Gemini-1.5-Pro-002 并排第 3，仅次于 o1-preview、o1-mini。

代码才智 Yi-Lightning 名次并排第 4。

另外皮Hard Prompts和Longer Query分榜，Yi-Lightning 也齐排在第 4 位。

临了通常值得关怀的是，竞技场新功能作风范围过滤，确保分数反馈模子真确处分问题的才智，而不是用漂亮的格式、加多回话长度。

在对长度和作风等特征作念了降权处理后，通盘模子分数均有下落，Yi-Lightning 名次变化不大伪娘露出，全体还与 GPT-4o、Grok-2 吞并梯队。

发布会上，零一万物创举东谈主兼 CEO 李开复博士展示了 Yi-Lightning 在不同场景上的才智。

Yi-Lightning 主打一个"推理速率更快，生成质料更好"。

比较上半年 Yi-Large，Yi-Lightning 首包速率提高 1 倍，推理速率也提高了 4 成。

像是翻译底下这种文体作品，Yi-Lightning 不仅速率更快：

何况用词更精确，更具文体颜色：

那么 Yi-Lightning 是奈何作念到的？

好用还得极速

Yi-Lightning 摄取MoE羼杂行家模子架构。

底层时间上，Yi-Lightning 在以下方面进行了提高。

最初是优化羼杂慎重力机制（Hybrid Attention），只在模子的部分档次中将传统的全慎重力（Full Attention）替换为滑动窗口慎重力（Sliding Window Attention）。

由此以来，模子在保证处理长序列数据高性能线路的同期，还能大大斥责推理本钱。

国产巨乳

Yi-Lightning 还引入了跨层慎重力（Cross-Layer Attention， CLA），允许模子在不同的档次之间分享键（Key）和值（Value）头，减少对存储需求。

这使得 Yi-Lightning 能在不同档次之间更灵验地分享信息。

总的来说，KV cache 收缩了 2-4 倍，同期将筹备的复杂度从 O ( L ² ) 降至 O ( L ) 。

其次，Yi-Lightning 还摄取了动态 Top-P 路由机制。

也等于说，Yi-Lightning 不错字据任务的难度动态自动选定最稳健的行家聚集组合——

熟谙经过中会激活通盘行家聚集，使模子能学习到通盘行家常识；而推理阶段，字据任务的难度，模子会选定性激活更匹配的行家聚集。

另外，之前有一些传言称国内大模子"六小强"，有一些仍是不作念预熟谙了，李开复博士此次在发布会上平直"辟谣"：

零一万物毫不撤销预熟谙。

何况在模子预熟谙阶段，团队还积蓄了丰富的多阶段熟谙智商，将通盘熟谙分为两块，一块作念好以后就把它固定起来，然后在这个固定的模子上再作念后段熟谙。

熟谙前期，更贯注数据各类性，使得 Yi-Lightning 尽可能学习不同的常识；熟谙后期更重践诺更丰富、常识性更强的数据。

同期团队还在不同阶段摄取不同的 batch size 和 LR schedule 保证熟谙速率和自若性。

李开复博士还示意，零一万物成立模子谨慎"模基共建"，也等于共建模子和基础架构。

模子的熟谙、业绩、推理遐想，与底层的 AIInfra 架构和模子结构必须高度适配。

这么作念的主义，不仅是让模子更好，何况让它在推理的时候好像更低廉。

再加上以上各类抬升"性价比"的时间加合手，是以 Yi-Lightning 此次亦然打到了白菜价——

0.99 元每 1M token

在汉文等方面，Yi-Lightning 比肩 OpenAI 的 o1-mini，o1-mini 的订价是每百万输入 3 好意思元，每百万输出 12 好意思元。

Yi-Lightning 每百万 token 只需 0.99RMB 亦然打到了骨折。

但李开复博士示意，即便这么也：不亏钱。

除了发布新模子，零一万物此次还首发了AI2.0 数字东谈主决策。

现在该数字东谈主已接入 Yi-Lightning，及时互动后果比较以往更强更当然了，belike：

临了谈起和海外头部大模子的差距，李开复博士示意此次 Yi-Lightning 的名次解说了国产大模子跟硅谷最顶尖模子的差距收缩到了五个月。

去跟追上好意思国最顶尖的模子，裁减这个时刻差额外宝贵，要付出很大的发愤和有独到的顶住。在国内不少公司齐在发愤，"模基共建"则是零一万物我方摸索的独到旅途。

参考流畅：

[ 1 ] https://x.com/lmarena_ai/status/1846245604890116457

[ 2 ] https://x.com/01AI_Yi/status/1845776529185476613伪娘露出

<< 上一篇：成人综合网站【逐日壁纸】视觉系列：极简风（261弹）。 🤔不知说念巨匠发现莫得？ | 下一篇：色妈妈淮安市政府相聚清科集团诞生3亿东说念主民币创业投资基金 >>

栏目分类

vpswindows在线播放

国产大模子初度在公开榜单上跳跃 GPT-4o！伪娘露出就在刚刚，"大模子六小强"之一的零一万物幽静对外发布新旗舰模子——Yi-Lightning（闪电）。在大模子竞技场（Chatbot Arena）上，Yi-Lightning 性能直冲总榜单并排第6，数学分榜并排第 3，代码等其它分榜也名列三甲。总得益险些与马斯克最新 xAI 大模子 Grok-2-08-13 合手平，卓著 GPT-4o-2024-05-13、GPT-4o-mini-2024-07-18、Claude 3.5 Sonn

友情链接：

Powered by vpswindows在线播放 @2013-2022 RSS地图 HTML地图

伪娘 露出 国产大模子竞技场首超GPT-4o！零一万物GLM共同置身Top10

栏目分类

热点资讯

相关资讯

vpswindows在线播放

伪娘露出国产大模子竞技场首超GPT-4o！零一万物GLM共同置身Top10