INFP是一种专注于双人对话交互的音频驱动头部生成框架,能够根据对话音频自动完成角色转换,无需人工干预。该框架分为两个阶段:基于动作的头部模仿阶段和音频引导的动作生成阶段。通过实验验证,INFP展现出卓越的性能和有效性。此外,INFP引入了大规模双人对话数据集DyConv,为相关研究提供了重要支持。
INFP是一种专注于双人对话交互的音频驱动头部生成框架,能够根据对话音频自动完成角色转换,无需人工干预。该框架分为两个阶段:基于动作的头部模仿阶段和音频引导的动作生成阶段。通过实验验证,INFP展现出卓越的性能和有效性。此外,INFP引入了大规模双人对话数据集DyConv,为相关研究提供了重要支持。
发表评论 取消回复