微信扫码
与创始人交个朋友
我要投稿
Hunyuan-DiT是腾讯出品的,支持中英双语提示词、具有细粒度中文理解的高性能多分辨率 Diffusion Transformer 模型。
首个中文提示词比英文提示词强的开源AI绘图模型!
您可以使用类似于自然语言文本的简单提示
画一只穿着西装的猪
画一头穿西装的猪
生成一幅画,赛博朋克风,跑车
生成一幅画,赛博朋克风格,跑车
或多回合语言交互以创建图片。
画一个木制的鸟
画一只木鸟
变成玻璃的
变成玻璃
(无需翻译,直接输入中文提示词即可)
理解自然语言指令并与用户进行多轮交互非常重要 文本到图像系统。它可以帮助构建一个动态和迭代的创建过程,将用户的想法变为现实 一步一步。
多次对话,理解需求生成和改进图片:
作为国产大模型,古诗词、俚语、传统建筑、中华美食等中国元素的生成上表现出色:
一种非常先进的技术,就像一个会画画的翻译器,它能够理解你说的话,然后用画来表达出来,而且画得还特别棒。
为了全面比较浑源DiT等模型的生成能力,腾讯构建了一个4维测试集,包括文本-图像一致性、排除AI伪影、主体清晰度、美学。超过50名专业评估员进行评估。
中国元素
长文本输入
此处腾讯放出了2个版本:
DialogGen(提示增强模型)和 Hunyuan-DiT(文本到图像模型)。
由于“提示增强模型”需要32G的显存,大部分非专业级用户显卡无法达标,所以AI启动器暂时只提供非增强版本。专业级显卡用户可联系作者获取增强版本。
部分专业卡打游戏有点垃,但是跑AI很强,4090目前打游戏跑AI都很强,但是显存不足。有粉丝吐槽部分专业卡都能买辆小车了,后续时机成熟,作者将出一期显卡推荐文章。
AI启动器,简介:
找到Hunyuan-DiT项目,下载完成后点击启动:
(运行界面)
腾讯混元决定全面开源他们的文生图模型,有助于更多的开发者和创作者参与进来,一起探索、共创基于 DiT 架构的视觉生成生态,更好地去验证、挖掘这个技术架构的潜力。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-03-30
2024-04-26
2024-05-10
2024-04-12
2024-05-28
2024-04-25
2024-05-14
2024-07-18
2024-04-26
2024-08-13
2024-12-24
2024-12-22
2024-12-21
2024-12-21
2024-12-21
2024-12-21
2024-12-20
2024-12-20