AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


昨天,Google 发布了两个重磅的 AI 生成模型
发布日期:2024-12-21 12:18:03 浏览次数: 1530 来源:硅基生命阿尔法


昨天,Google 新发布了两个重要的 AI 生成模型产品更新:Veo 2 视频生成模型和 Imagen 3 图像生成模型

说实话,Google 的绘画和视频大模型虽然来的晚,我昨天测试了一下,感觉及格,虽然尤其是在绘画大模型当中,我感觉虽然可能不及 Midjourney ,但是,跟其他绘画大模型基本上不相上下。

至于视频大模型,目前,在内测,需要排队申请,没有名额,不知道具体效果,但是,我感觉至少可能比 Sora 强,Sora 虽然公开发布了,但是,效果真的不进人如意,跟 10 个月前画饼的效果相差太多了,都比不过咱们得国产视频大模型。

现在具体介绍一下,Google 昨天发布的两个重要生成模型。

Veo 2 是一款先进的视频生成模型,它最大的特色在于对真实世界物理规律和人类动作表情有着深入的理解。它能够理解电影摄影的专业语言,可以根据用户的要求生成特定镜头角度、景深效果等专业视频效果。比如用户可以要求低角度跟踪镜头,或者特写镜头等。Veo 2 支持高达 4K 分辨率的视频输出,时长可达数分钟。相比其他模型,Veo 2 的一个重要优势是较少出现 "幻觉" 问题(如多出的手指或意外物体),这让生成的视频更加真实可信。

Imagen 3 则是图像生成模型的升级版本。这个版本生成的图像更加明亮,构图更好。它的一大特色是能够准确渲染多种艺术风格,从写实主义到印象派,从抽象到动漫都能精确表现。此外,Imagen 3 对提示词的理解更准确,能够渲染更丰富的细节和纹理。在人工评分的对比测试中,Imagen 3 在主流图像生成模型中取得了最好的成绩。

在实际应用场景方面,Veo 2 主要通过 VideoFX、YouTube 和 Vertex AI 等平台提供服务,特别适合 YouTube 创作者制作短视频背景,企业用户优化创意工作流程等场景。

而 Imagen 3 则通过 ImageFX 向全球 100 多个国家提供服务,适合需要高质量图像生成的各类场景。

接下来,我生成了 10 个不同风格的图片,测试了一下 Imagen 3 的效果。如下:

1、提示词:Coca-Cola 标志和可乐瓶在纸上,以大胆海报风格、Minolta Hi-Matic 7SII 相机风格、线性插画风格呈现。

2、提示词:超逼真的图片展示了一块非凡的橙子果肉,被精心雕刻成精致的猫头鹰形状。这块突出的果肉应成为中心焦点,其猫头鹰般的轮廓和特征应得到精致的界定。果肉的纹理应该非常细腻,展现出橙子果肉天然的纤维质感,颜色应该是鲜艳逼真的橙色,是新鲜柑橘的象征。猫头鹰形状的果肉必须生动而明显,背景应柔和而不突兀,以增强其引人注目的形状。图像应将自然水果的纹理与猫头鹰的雄伟外形完美融合,同时保持栩栩如生的外观。

3、提示词:倒置视角,三分法构图,夜景,湖边流动形态的建筑,未来太空船设计风格,浅红色和浅靛蓝色,V-ray 渲染,马岩松,雾气,背景是蘑菇森林。

4、提示词:在重庆火锅餐厅,一只熊猫正在吃蒸汽腾腾的辣火锅,以纪实风格,秋山亮二的风格,富士胶片镜头 32K 高清

5、提示词:一只熊猫,全副武装,就像是钢铁侠一样,骑着摩托,在城市的街道,高清,电影级,迪士尼风格

6、提示词:以Nick Veasey风格呈现的,一个线框全息图,X光下的反射露水在郁金香上,全息图中以发光的金色线条形成复杂图案围绕其标志性结构,背景为孤立的暗色背景,内部结构可见。

7、提示词:一个中国女性站在田野中,留着短发波波头,穿着白色连衣裙,形象清新,正面看向镜头,远景拍摄,电影感。

8、提示词:一个可爱的小女孩和她的巨型白猫,快乐的样子,涂鸦插画风格,混合图案和文字,简单的色彩,简单的细节,黄色背景,极简主义

9、提示词:水彩插画,森系风格,水彩透叠,在绿草上用拖车和车辆做广告,商品在车里,可爱风格的小卖部,梦幻般的视觉效果,大胆的形状,阳光明媚,明亮的色彩,大胆配色,超高质量,营造出一种宁静的氛围,金黄色柔和的背景,植物,花朵,温馨,淡雅

10、提示词:一个古风中国传统美女,在竹林中,穿着半透明的薄纱衣服,在空中翩翩起舞。高清,电影级,特写镜头

大家感觉效果怎么样?其实,如果和其他大模型相比,差不多,但是,比 Midjourney 确实差不少。

image-fx 可以直接用了,地址:https://labs.google/fx/tools/image-fx

video-fx 要申请 waitlist,地址:https://labs.google/fx/zh/tools/video-fx

—  —

我是硅基生命阿尔法,一个专注于 AI 工具分享、AI 副业拆解、AI 应用场景和玩法的普通程序员和探索者,关注我一起学习 AI,一起 AI 副业。

欢迎大家加入我的「AIGC・掘金成长研习社」,里面有很多 AI 的玩法和落地应用场景,包括有 ChatGPT 的教程。

长按扫码加入「AIGC・掘金成长研习社」一起掘金,一起暴富,一起用 AI 赋能


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询