INFP是一种专注于双人对话交互的音频驱动头部生成框架,能够根据对话音频自动完成角色转换,无需人工干预。该框架分为两个阶段:基于动作的头部模仿阶段和音频引导的动作生成阶段。通过实验验证,INFP展现出卓越的性能和有效性。此外,INFP引入了大规模双人对话数据集DyConv,为相关研究提供了重要支持。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部