百度文心开源 8B 文生图模型 ERNIE-Image:文字渲染达 SOTA,支持消费级显卡运行

百度文心开源_8B_文生图模型_ERNIE-Image:文字渲染达_SOTA,支持消费级显卡运行 图1
百度文心开源 8B 文生图模型 ERNIE-Image:文字渲染达 SOTA,支持消费级显卡运行

百度开源文生图模型 ERNIE-Image。该模型基于单流 Diffusion Transformer(DiT)架构,参数规模为 8B,仅需 24 GB 显存的消费级显卡即可实现高精度图像生成。在 GenEval、LongText-Bench 等国际基准测试中,其指令遵循与文字渲染能力均达到开源模型领先水平(SOTA),尤其在处理中英日韩多语言排版、复杂多主体关系和结构化布局方面表现突出。

附件内容
© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容