Datawhale干货
AI写真:InstantID,开源:小红书
马斯克与郭德纲,一位是相声界的顶流,一位是科技界的大咖。
想象一下,他们的形象融合,会是什么样?
小红书最新推出的开源项目 —— InstantID 让这种“跨界融合”成为可能。

它能让自由地将两张面孔进行合成,利用 ID 插值创造出全新的形象。

惊艳的是,它可以在不需要任何训练的情况下,根据一张人脸照片和一段文本提示,生成具有个性化风格和高保真度的 AI 写真。

写真效果非常逼真,能保持人脸特征的统一,风格融合得很好。
https://github.com/InstantID/InstantID

深度学习三巨头之一 Yann LeCun 也点赞该项目。

不来体验试试,都说不过去了,用户教程先奉上!
一张自拍 + 一张参考姿势图(可选)+ Prompt(可选) + 风格选择 = 你想要生成的 AI 写真

如何快速上手呢?Demo 演示一波:
1. 上传带有人脸的图片。对于多人图像,InstantID 只会检测最大的脸部。请确保脸部不要太小,并且没有明显遮挡或模糊。
2. (可选)上传另一张图像作为参考姿势。如果没有上传,InstantID 将使用第一张图像来提取姿势。如果在步骤 1 中使用了裁剪后的脸部,建议上传它以提取新的姿势。
3. (可选)可以选择多个 ControlNet 模型来控制生成过程。默认设置是仅使用 IdentityNet。ControlNet 模型包括姿势骨架、精巧和深度。方便您可以调整每个 ControlNet 模型的强度以控制生成过程。
4. (可选)输入文本 Prompt提示词。就像所有文生图应用中所做的那样。
5. 点击 Submit 按钮开始定制写真。
6. 与朋友分享定制写真,尽情享受吧!
除了线上体验,InstantID 可以作为一个可适配的插件,能够与流行的预训练文本到图像扩散模型(如 SD 1.5 和 SDXL)无缝集成,兼容性佳。
如图所述, InstantID 方法主要包含三个关键组成部分:
实验结果表明,InstantID 不仅超越目前基于单张图片特征进行嵌入的方法(IP-Adapter-FaceID),还与 ROOP、LoRAs 等方法在特定场景下不分伯仲,成本还低。
InstantID 提供了丰富的创意玩法,如 ID 插值、多风格融合、定制夸张表情、动漫主题写真等,这些都极大地拓宽了用户的创作空间,让图像生成变得更加灵活和个性化。


开源项目,”点赞”在看↓
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢