微信扫码
与创始人交个朋友
我要投稿
腾讯的PhotoMaker是一款开源工具,利用堆叠ID技术生成逼真的定制人物照片。它可以根据描述生成符合要求的人物形象,并混合多张人物特征,创造全新人物。PhotoMaker还能改变照片中人物的性别和年龄,生成多种风格的照片,效果自然且快速。Github和Huggingface在文章底部
现有的个性化生成方法难以同时实现高效率、身份保真度和灵活文本控制。PhotoMaker通过将多个输入ID图像编码为堆栈式ID嵌入,保留身份信息,全面封装同一ID的特征,并整合不同ID特征,提供更大灵活性。
此外,PhotoMaker提出了一种面向ID的数据构建管道来组装训练数据,展示了优于测试时微调方法的ID保真能力,同时提供显著的速度改进、高质量生成结果、强大泛化能力和广泛应用。
https://github.com/TencentARC/PhotoMakerhttps://huggingface.co/spaces/TencentARC/PhotoMaker-V2
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-11-21
22.4K+ Star!Chatbox:你的终极AI桌面助手
2024-11-21
Magentic-One:微软开源多智能体系统,让 AI 自己动手解决问题
2024-11-21
阿里发布Qwen2.5-Turbo,支持100万Tokens上下文!
2024-11-20
MNN在大模型端侧部署上的探索
2024-11-19
从浏览器自动化到个人助手,Skyvern又悄悄占据了AI市场的一席之地?
2024-11-19
超GPT-4o,1240亿参数!最强开源多模态模型 Pixtral Large!
2024-11-16
OpenHands + Ollama:你的AI编程助手使用指南
2024-11-15
如何用 Multi Agent 优化你的多智能体系统?详解开发与应用!
2024-05-06
2024-07-25
2024-08-13
2024-06-12
2024-07-11
2024-06-16
2024-07-20
2024-06-15
2024-07-25
2024-07-25
2024-11-19
2024-11-13
2024-11-13
2024-10-07
2024-09-22
2024-09-20
2024-09-14
2024-09-14