维度网讯,谷歌正在向更多付费Gemini订阅用户扩展Gemini Avatar功能,允许用户创建人工智能数字版自身形象,用于在Gemini内生成视频和其他内容。该功能由谷歌Gemini Omni模型驱动,Omni是谷歌首个视频生成模型,可在单个提示中结合多模态输入。该功能首次在3月的APK拆解中被发现,旨在复制用户的外貌和声音。

用户可通过Gemini应用程序导航到“设置 > Avatar”访问该功能。启用后,用户可创建模仿其面部特征、声音和举止的个性化AI化身,并在Gemini对话中使用特定命令召唤它。设置过程相对简单:第一阶段需完成基于摄像头的训练环节,用户将手机保持在视线水平,按屏幕提示从多个角度捕捉面部,使Gemini能生成面部结构的详细模型。第二阶段为语音训练,Gemini要求用户大声朗读一系列随机短语和数字,以分析其语音模式、语调、口音和节奏。设置完成后,Avatar将链接至用户的Google帐户,并在Gemini体验中可用。
为确保面部和声音扫描被接受,谷歌建议用户保持手机视线水平,避免环境过暗或过亮,确保眼睛、鼻子和嘴巴可见。系统允许眼镜作为Avatar的一部分,但禁止帽子、太阳镜和口罩,且用户背景中不应出现任何人物或其他面部图像。
针对逼真AI Avatar的潜在风险,谷歌宣布了多项安全保障措施。用户必须年满18岁才能创建Avatar,且注册过程中帐户所有者必须亲自在场。此外,所有使用Gemini Avatar生成的视频均嵌入谷歌的SynthID水印,这种隐形水印直接嵌入生成内容中,可通过谷歌工具检测,帮助观看者识别AI生成视频并降低滥用风险。目前,谷歌尚未宣布该功能是否也会向免费Gemini用户开放。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









