AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


Ideogram 发布 2.0,效果优于 Midjourney 和 DALL-E
发布日期:2024-08-22 12:14:49 浏览次数: 1792


Idogram AI 于周三推出了其文本到图像模型的下一代——Idogram 2.0,目标是挑战在生成性 AI 领域中已经确立地位的公司。

这一发布紧随 Flux.1 成为 Grok on X(即 Twitter)的主要图像生成器之后,这一变化巩固了 Flux.1 在后 Stable Diffusion XL(SDXL)时代作为强大且多功能的竞争者的地位。其他争夺领导地位的开放模型包括 Auraflow、KwaiKolors、Hunyuan、Lumina 和 Kandinsky 3。

Idogram 在其官方声明中表示:“Ideogram 2.0 在图像-文本对齐、整体主观偏好和文本渲染准确性等多项质量指标上,明显超越了其他文本到图像模型。”

除了新模型,Idogram 还推出了一系列新功能,以增强其产品套件的竞争力,包括一个 iOS 应用程序和一个供开发者使用的 API。

由前 Google 员工创立的 Ideogram,因其在图像模型中整合文本生成能力的开创性工作而闻名。它是首个实现这一点的模型,与 Stability AI 的 Deep Floyd IF 实验齐名。

使用 Ideogram 2.0 生成的图像展示了公司在提高模型输出质量方面的成果,新模型更快、更强大、更多样化,提供了五种不同的预设选项:现实主义、绘画、3D、动漫和通用。

更新还引入了调色板功能,让用户在美学和构图上有更多的控制权。

在 Ideogram 2.0 中,“现实主义”风格允许用户创建看起来像真实照片的图像,公司表示:“纹理显著增强,人物皮肤和头发看起来非常逼真。”而“设计”预设则专注于精确和艺术性的文本生成,使设计师能够为贺卡、按需打印、海报、插图以及市场营销和社交媒体内容创建高级图形设计。

除了这两种风格,还有“3D”预设,专注于生成类似计算机渲染的图像;“动漫”预设则与 MidJourney 的 Niji 风格竞争,适用于日本漫画风格的创作;而“通用”预设是一个多功能设置,能够根据提示自动调整输出。

社交媒体用户的初步反馈普遍积极,许多人分享了他们使用 Ideogram 生成的作品,这些作品展示了模型在现实主义和名人形象渲染方面的卓越能力。我们的初次测试结果令人满意,尤其是使用“现实主义”预设时,其性能似乎与 Flux.1 相媲美。

然而,对于想要免费试用的高级用户来说,Ideogram 2.0 的免费版本每天限制为 20 张图像,付费计划从每月 8 美元起,无限慢速生成计划为每月 20 美元。尽管如此,它在价格上仍然具有竞争力,尤其是与 MidJourney 的最低层级 10 美元和每月 30 美元的无限慢速生成计划相比。

Idogram 的产品被定位为 MidJourney 的一个更易接近的替代品,其模型的自然语言处理能力为用户提供了更直观、更流畅的提示体验,类似于 ChatGPT 与 Dall-E 3 的结合,与 MidJourney 依赖于传统的“SDXL”提示风格形成对比。

如果预算充足,用户可能会根据功能而非单纯的输出质量来选择,因为两种模型在竞争力上都相当。MidJourney 提供了一个强大的个性化功能,允许用户创造自己的风格,并且拥有一个功能强大的图像编辑器,可以让用户以高控制水平调整生成的图像。

与此相反,Ideogram 2.0 为用户提供了大量控制生成结果的选项,而无需依赖于提示工程或 Style Transfer、LoRAs 或 IPAdapter 等附加工具。调色板选项和预设可能是获取个性化结果的好方法,尤其对于新用户来说。


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询