我要投稿

开源人像视频编辑工具，3D高斯的完美应用，功能效果值得落地一个AI视频编辑软件。

发布日期：2024-11-11 20:08:37 浏览次数： 1845 来源：开源AI项目落地

看到一个优质的开源项目，真的会让我感到兴奋。

好久没看到比较惊艳的3D开源项目了，图片风格化已经很成熟了，像是视频风格化的总是有朋友问，今天终于发现一个，中国科学技术大学开源的PortraitGen。

可以这么说，PortraitGen这一个开源项目的功能，已经足够落地一个爆火的APP。

效果实在是太惊艳了！！！看完DEMO，我感觉新软件的开发又有思路了。好玩，好用，那就是个好软件。

绝不允许这么好的开源，你们还不知道。

项目简介

PortraitGen是中国科学技术大学开发的一个新型肖像视频风格化编辑工具，解决了传统肖像视频编辑方法在3D和时间一致性上的困难。通过使用统一的动态3D高斯场模型，该项目确保视频帧间的结构和时间上的连贯性，同时通过创新的神经高斯纹理机制实现复杂风格的高质量编辑和渲染速度超过100FPS的高效渲染。PortraitGen支持文本驱动编辑、图像驱动编辑和照明调整等多模式输入，在视频编辑领域有广泛适用性和优越性。

DEMO

这部分主要是功能效果的演示，不讲太多的技术问题。

1、文本驱动编辑

跟图片转视频的使用方式感觉差不多，直接输入提示词就好了，只不过这是个描述动态画面的提示词。

2、图像驱动编辑

这部分主要是有两个功能，一个是对图像的全局参考，比如把梵高的《星空》体现在整个人像的纹理中；另一个是把图像内的对象放到特定的位置，比如让视频内的人物换一件衣服。

3、Relighting

通过一个文本描述，对整个视频的光影进行改变。用的也是IC-Light，之前是改变图片光影效果，现在是对视频进行改变。

4、跟一些市面现有的先进方法进行比较

技术原理

1、统一动态3D高斯场模型

PortraitGen通过建立一个统一的动态3D高斯场，使视频帧之间在结构和时间上保持一致性。每一帧的肖像通过3D高斯分布来表示，其中高斯分布的中心、方差和旋转等参数都是可学习的，这使得模型可以精确地控制视频中人物的三维形态变化。

3D高斯分布：通过这种方式，肖像的每一个细节都被建模为一个高斯分布，可以灵活地调整形状和大小，从而更好地适应人物表情和动作的变化。
动态调整：随着视频的进行，这些高斯分布的参数会根据视频内容动态调整，确保视频编辑过程中人物的外观和表情保持自然流畅。

2、神经高斯纹理机制

这一机制是PortraitGen的核心创新之一，它通过在3D高斯场上叠加一层神经纹理来增强编辑的表达力和风格多样性。

高斯纹理特征：不同于传统的简单颜色或亮度表示，神经高斯纹理在每个高斯分布上附加了复杂的特征向量，这些特征向量由深度神经网络学习得到，能够捕捉到更丰富的细节和风格特征。
特征转换：通过一个专门设计的2D神经渲染器，将这些3D纹理特征映射到2D图像上，实现从3D模型到最终视频帧的转换，保证了风格的一致性和高质量的视觉效果。

3.、多模态输入的融合

项目支持多种输入模式，如文本指令、图像样本和照明条件等，这些输入通过不同的网络模块处理后，融入到高斯纹理特征中，从而实现基于多种指令的视频编辑。

文本驱动编辑：用户可以通过输入简单的文本指令，如“将人物转换为卡通风格”，系统通过解析文本并将其转化为编辑指令，调整高斯纹理特征以符合文本描述的风格。
图像驱动编辑：还可以提供一张参考图像，系统将分析图像的风格并将这些风格特征应用到视频编辑中，实现风格迁移或特定特征的复制。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

太强了！10大开源大模型！

2024-05-06

万字详解DeepSeek-R1，引爆AI圈的又一力作，大模型爆发势不可挡！

2025-01-21

开源项目Composio：突破 AI 智能体开发的边界

2024-08-13

Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API调用和WebUI对话机器人

2024-06-12

QWEN2.5开源上新，14B/32B回归实测：这就是最强单卡本地模型！

2024-09-20

如何免费使用 Claude AI？Claude使用指南！

2024-07-11

全民进入GPT-4时代：OpenAI强势推出GPT-4o mini！彻底取代GPT-3.5！

2024-07-20

DeepSeek-V3 正式发布

2024-12-26

大家都在问

DeepSeek v3为何爆火？如何用其集成Milvus搭建RAG？

2025-01-22

构建企业私有RAG大模型: (可商用)DeepSeek-V3开源部署，真的强吗？

2025-01-16

大模型的泡沫什么时候破灭？

2024-12-24

微软开源的 Markitdown 可将任意文件转换为 Markdown 格式，PDF 解析咋样？

2024-12-20

开源！轻量！AI 代码助手插件 Continue 使用体验如何？

2024-12-19

不可思议！AirLLM 如何让 70B 大模型在 4GB GPU 上顺利推理？

2024-11-22

从浏览器自动化到个人助手，Skyvern又悄悄占据了AI市场的一席之地？

2024-11-19

这家小公司的700 亿参数模型竟然比Open o1还强？

2024-11-13

开箱即用的企业大模型应用平台

工作+AI

业务+AI

AIx业务

大模型咨询

大模型定制

场景解决方案

【智能问答】解决方案

【应用智改】解决方案

【智能工单】解决方案

相关资讯

160+中大型企业正在使用53AI

把握AI发展的机遇，共同探索、共同进步

如何打造基于GenAI的员工服务机器人

热点资讯

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

Ollama 本地运行大模型(LLM)完全指南

太强了！10大开源大模型！

万字详解DeepSeek-R1，引爆AI圈的又一力作，大模型爆发势不可挡！

开源项目Composio：突破 AI 智能体开发的边界

Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API调用和WebUI对话机器人

QWEN2.5开源上新，14B/32B回归实测：这就是最强单卡本地模型！

如何免费使用 Claude AI？Claude使用指南！

全民进入GPT-4时代：OpenAI强势推出GPT-4o mini！彻底取代GPT-3.5！

DeepSeek-V3 正式发布

大家都在问

DeepSeek v3为何爆火？如何用其集成Milvus搭建RAG？

构建企业私有RAG大模型: (可商用)DeepSeek-V3开源部署，真的强吗？

大模型的泡沫什么时候破灭？

微软开源的 Markitdown 可将任意文件转换为 Markdown 格式，PDF 解析咋样？

开源！轻量！AI 代码助手插件 Continue 使用体验如何？

不可思议！AirLLM 如何让 70B 大模型在 4GB GPU 上顺利推理？

从浏览器自动化到个人助手，Skyvern又悄悄占据了AI市场的一席之地？

这家小公司的700 亿参数模型竟然比Open o1还强？

热门标签

开箱即用的企业大模型应用平台

工作+AI

业务+AI

AIx业务

大模型咨询

大模型定制

场景解决方案

【智能问答】解决方案

【应用智改】解决方案

【智能工单】解决方案

相关资讯

160+中大型企业正在使用53AI

把握AI发展的机遇，共同探索、共同进步

如何打造基于GenAI的员工服务机器人

热点资讯

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

Ollama 本地运行大模型(LLM)完全指南

太强了！10​大开源大模型！

万字详解DeepSeek-R1，引爆AI圈的又一力作，大模型爆发势不可挡！

开源项目Composio：突破 AI 智能体开发的边界

Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API调用和WebUI对话机器人

QWEN2.5开源上新，14B/32B回归实测：这就是最强单卡本地模型！

如何免费使用 Claude AI？Claude使用指南！

全民进入GPT-4时代：OpenAI强势推出GPT-4o mini！彻底取代GPT-3.5！

DeepSeek-V3 正式发布

大家都在问

DeepSeek v3为何爆火？如何用其集成Milvus搭建RAG？

构建企业私有RAG大模型: (可商用)DeepSeek-V3开源部署，真的强吗？

大模型的泡沫什么时候破灭？

微软开源的 Markitdown 可将任意文件转换为 Markdown 格式，PDF 解析咋样？

开源！轻量！AI 代码助手插件 Continue 使用体验如何？

不可思议！AirLLM 如何让 70B 大模型在 4GB GPU 上顺利推理？

从浏览器自动化到个人助手，Skyvern又悄悄占据了AI市场的一席之地？

这家小公司的700 亿参数模型竟然比Open o1还强？

热门标签

太强了！10大开源大模型！