美团发布 LongCat-Flash-Chat 大语言模型

美团发布_LongCat-Flash-Chat_大语言模型 图1
美团发布 LongCat-Flash-Chat 大语言模型

美团 LongCat 团队正式发布 LongCat-Flash-Chat 大语言模型,该模型拥有 5600 亿总参数,采用创新的专家混合(MoE)架构。模型具备动态计算机制,可根据上下文需求激活 186 亿至 313 亿参数(平均约 270 亿),在 20 万亿 token 上训练,推理速度超过每秒 100 token。

该模型在多项基准测试中表现优异,特别在智能体任务方面表现突出,支持工具调用和多轮对话,现已在 Hugging Face 开源并提供在线体验。

附件内容
© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容