微信扫码
与创始人交个朋友
我要投稿
腾讯的PhotoMaker是一款开源工具,利用堆叠ID技术生成逼真的定制人物照片。它可以根据描述生成符合要求的人物形象,并混合多张人物特征,创造全新人物。PhotoMaker还能改变照片中人物的性别和年龄,生成多种风格的照片,效果自然且快速。Github和Huggingface在文章底部
现有的个性化生成方法难以同时实现高效率、身份保真度和灵活文本控制。PhotoMaker通过将多个输入ID图像编码为堆栈式ID嵌入,保留身份信息,全面封装同一ID的特征,并整合不同ID特征,提供更大灵活性。
此外,PhotoMaker提出了一种面向ID的数据构建管道来组装训练数据,展示了优于测试时微调方法的ID保真能力,同时提供显著的速度改进、高质量生成结果、强大泛化能力和广泛应用。
https://github.com/TencentARC/PhotoMakerhttps://huggingface.co/spaces/TencentARC/PhotoMaker-V2
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-09-19
一文彻底搞懂大模型 - Dify(Agent + RAG)
2024-09-19
Qwen2.5横空出世:从3B到72B,全面碾压同级对手
2024-09-19
突发!GPT-4o 级语音 Moshi 开源!
2024-09-19
Qwen2.5 全链路模型体验、下载、推理、微调、部署实战!
2024-09-19
通义千问Qwen2.5开源,媲美Llama3.1-405B
2024-09-19
Qwen 2.5 开源,API 打一折
2024-09-18
OpenAI o1的开源平替版self-replay RL来了!
2024-09-18
Y Combinator 投资的开源 Cursor 替代品来了!
2024-08-13
2024-05-06
2024-06-12
2023-07-01
2024-07-25
2024-07-08
2024-07-11
2024-07-18
2024-07-25
2024-06-16