AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


(AI启动器)Hunyuan-DiT:三年磨一剑,腾讯万亿混元大模型,开源!(附整合包)
发布日期:2024-05-25 11:49:40 浏览次数: 2018 来源:Ai秦始皇


Hunyuan-DiT是腾讯出品的,支持中英双语提示词、具有细粒度中文理解的高性能多分辨率 Diffusion Transformer 模型。

中文提示词

首个中文提示词比英文提示词强的开源AI绘图模型!

您可以使用类似于自然语言文本的简单提示

画一只穿着西装的猪

画一头穿西装的猪

生成一幅画,赛博朋克风,跑车

生成一幅画,赛博朋克风格,跑车

或多回合语言交互以创建图片。

画一个木制的鸟

画一只木鸟

变成玻璃的

变成玻璃

(无需翻译,直接输入中文提示词即可)

多轮对话 Text2Image 生成

理解自然语言指令并与用户进行多轮交互非常重要 文本到图像系统。它可以帮助构建一个动态和迭代的创建过程,将用户的想法变为现实 一步一步。

多次对话,理解需求生成和改进图片:

作为国产大模型,古诗词、俚语、传统建筑、中华美食等中国元素的生成上表现出色:

Hunyuan-DiT简介

一种非常先进的技术,就像一个会画画的翻译器,它能够理解你说的话,然后用画来表达出来,而且画得还特别棒。

? 比较

为了全面比较浑源DiT等模型的生成能力,腾讯构建了一个4维测试集,包括文本-图像一致性、排除AI伪影、主体清晰度、美学。超过50名专业评估员进行评估。

? 可视化

  • 中国元素

  • 长文本输入

? 版本和显卡要求

此处腾讯放出了2个版本:

DialogGen(提示增强模型)和 Hunyuan-DiT(文本到图像模型)。

由于“提示增强模型需要32G的显存,大部分非专业级用户显卡无法达标,所以AI启动器暂时只提供非增强版本。专业级显卡用户可联系作者获取增强版本。

部分专业卡打游戏有点垃,但是跑AI很强,4090目前打游戏跑AI都很强,但是显存不足。有粉丝吐槽部分专业卡都能买辆小车后续时机成熟,者将出一期显卡荐文章

一键运行

AI启动器,简介

上百个开源项目,一键运行!零基础上手Ai


找到Hunyuan-DiT项目,下载完成后点击启动:

(运行界面)

小结

腾讯混元决定全面开源他们的文生图模型,有助于更多的开发者和创作者参与进来,一起探索、共创基于 DiT 架构的视觉生成生态,更好地去验证、挖掘这个技术架构的潜力。


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询