伪娘 露出 国产大模子竞技场首超GPT-4o!零一万物GLM共同置身Top10
发布日期:2024-10-17 09:42 点击次数:107国产大模子初度在公开榜单上跳跃 GPT-4o!伪娘 露出
就在刚刚,"大模子六小强"之一的零一万物幽静对外发布新旗舰模子——Yi-Lightning(闪电)。
在大模子竞技场(Chatbot Arena)上,Yi-Lightning 性能直冲总榜单并排第6,数学分榜并排第 3,代码等其它分榜也名列三甲。
总得益险些与马斯克最新 xAI 大模子 Grok-2-08-13 合手平,卓著 GPT-4o-2024-05-13、GPT-4o-mini-2024-07-18、Claude 3.5 Sonnet 等顶流。
同期,国内清华系大模子公司智谱 AI 的GLM-4-Plus也杀进了总榜,位居第 9位。
该榜单收尾来自豪众累积超千万次的东谈主类用户盲测投票。
前段时刻大模子竞技场还刚刚更新了规章,新榜单对 AI 回话的长度和作风等特征作念了降权处理,分数更能反馈模子真确处分问题的才智。
此次 Yi-Lightning 杀出重围,Lmsys 团队有益发帖子,称这是竞技场上的大新闻:
大模子竞技场总榜第六、国产第一
细看大模子竞技场分类榜上的"赛况",Yi-Lightning 各项才智齐排在前头。
在汉文才智上,Yi-Lightning 和 GLM-4-Plus 两个国产大模子齐名列前位。
Yi-Lightning 跃居并排第二,和 o1-mini 收支无几。
数学才智,Yi-Lightning 和 Gemini-1.5-Pro-002 并排第 3,仅次于 o1-preview、o1-mini。
代码才智 Yi-Lightning 名次并排第 4。
另外皮Hard Prompts和Longer Query分榜,Yi-Lightning 也齐排在第 4 位。
临了通常值得关怀的是,竞技场新功能作风范围过滤,确保分数反馈模子真确处分问题的才智,而不是用漂亮的格式、加多回话长度。
在对长度和作风等特征作念了降权处理后,通盘模子分数均有下落,Yi-Lightning 名次变化不大伪娘 露出,全体还与 GPT-4o、Grok-2 吞并梯队。
发布会上,零一万物创举东谈主兼 CEO 李开复博士展示了 Yi-Lightning 在不同场景上的才智。
Yi-Lightning 主打一个"推理速率更快,生成质料更好"。
比较上半年 Yi-Large,Yi-Lightning 首包速率提高 1 倍,推理速率也提高了 4 成。
像是翻译底下这种文体作品,Yi-Lightning 不仅速率更快:
何况用词更精确,更具文体颜色:
那么 Yi-Lightning 是奈何作念到的?
好用还得极速
Yi-Lightning 摄取MoE羼杂行家模子架构。
底层时间上,Yi-Lightning 在以下方面进行了提高。
最初是优化羼杂慎重力机制(Hybrid Attention),只在模子的部分档次中将传统的全慎重力(Full Attention)替换为滑动窗口慎重力(Sliding Window Attention)。
由此以来,模子在保证处理长序列数据高性能线路的同期,还能大大斥责推理本钱。
国产巨乳Yi-Lightning 还引入了跨层慎重力(Cross-Layer Attention, CLA),允许模子在不同的档次之间分享键(Key)和值(Value)头,减少对存储需求。
这使得 Yi-Lightning 能在不同档次之间更灵验地分享信息。
总的来说,KV cache 收缩了 2-4 倍,同期将筹备的复杂度从 O ( L ² ) 降至 O ( L ) 。
其次,Yi-Lightning 还摄取了动态 Top-P 路由机制。
也等于说,Yi-Lightning 不错字据任务的难度动态自动选定最稳健的行家聚集组合——
熟谙经过中会激活通盘行家聚集,使模子能学习到通盘行家常识;而推理阶段,字据任务的难度,模子会选定性激活更匹配的行家聚集。
另外,之前有一些传言称国内大模子"六小强",有一些仍是不作念预熟谙了,李开复博士此次在发布会上平直"辟谣":
零一万物毫不撤销预熟谙。
何况在模子预熟谙阶段,团队还积蓄了丰富的多阶段熟谙智商,将通盘熟谙分为两块,一块作念好以后就把它固定起来,然后在这个固定的模子上再作念后段熟谙。
熟谙前期,更贯注数据各类性,使得 Yi-Lightning 尽可能学习不同的常识;熟谙后期更重践诺更丰富、常识性更强的数据。
同期团队还在不同阶段摄取不同的 batch size 和 LR schedule 保证熟谙速率和自若性。
李开复博士还示意,零一万物成立模子谨慎"模基共建",也等于共建模子和基础架构。
模子的熟谙、业绩、推理遐想,与底层的 AIInfra 架构和模子结构必须高度适配。
这么作念的主义,不仅是让模子更好,何况让它在推理的时候好像更低廉。
再加上以上各类抬升"性价比"的时间加合手,是以 Yi-Lightning 此次亦然打到了白菜价——
0.99 元每 1M token
在汉文等方面,Yi-Lightning 比肩 OpenAI 的 o1-mini,o1-mini 的订价是每百万输入 3 好意思元,每百万输出 12 好意思元。
Yi-Lightning 每百万 token 只需 0.99RMB 亦然打到了骨折。
但李开复博士示意,即便这么也:不亏钱。
除了发布新模子,零一万物此次还首发了AI2.0 数字东谈主决策。
现在该数字东谈主已接入 Yi-Lightning,及时互动后果比较以往更强更当然了,belike:
临了谈起和海外头部大模子的差距,李开复博士示意此次 Yi-Lightning 的名次解说了国产大模子跟硅谷最顶尖模子的差距收缩到了五个月。
去跟追上好意思国最顶尖的模子,裁减这个时刻差额外宝贵,要付出很大的发愤和有独到的顶住。在国内不少公司齐在发愤,"模基共建"则是零一万物我方摸索的独到旅途。
参考流畅:
[ 1 ] https://x.com/lmarena_ai/status/1846245604890116457
[ 2 ] https://x.com/01AI_Yi/status/1845776529185476613伪娘 露出
栏目分类