微软推出 VASA-1 AI 框架,可即时生成逼真对口型*
摘要:
多名博主爆料称暴雪国服将于月日上午宣布回归网易集团向国内媒体确认了此消息并表示暴雪国服回归的宣布将由网易雷火事业群负责保密度极高这一消息备受期待微之家月日消息据微软*稿微软今天公布...
多名博主爆料,称暴雪国服将于4月10日上午宣布回归。网易集团向国内媒体确认了此消息,并表示暴雪国服回归的宣布将由网易雷火事业群负责,保密度极高。这一消息备受期待,微
IT之家 4 月 21 日消息,据微软* 稿,微软今天公布了一项图生*的 VASA-1 框架,该 AI 框架只需使用一张真人肖像照片和一段个人语音音频,就能够生成精确逼真的对口型*(生成念稿子的*),据称在表情和头部动作方面特别自然。
IT之家获悉,目前业界相关许多研究都集中在对口型上,而面部动态行为及头部运动情况通常被忽视,因此生成的面部也会显得僵硬、缺乏说服力且存在恐怖谷现象。
而微软的 VASA-1 框架克服了以往面部生成技术的限制,研究人员利用了扩散 Transformer 模型,在整体面部动态和头部运动方面进行训练,该模型将所有可能的面部动态,包括嘴唇动作、表情、眼睛注视和眨眼等行为均视为单一潜在变量(即一次生成整个具有高度细节的人脸),号称能够即时生成 512×512 分辨率 40 FPS 的*。
IT之家同时注意到,微软还利用了 3D 技术辅助标记人脸面部特征,并额外设计了损失函数,号称能够让 VASA-1 不仅能够生成高品质的面部*,还能够有效地捕捉和重现面部 3D 结构。