CAT4D CAT4D是一种由Google DeepMind、哥伦比亚大学及加州大学圣地亚哥分校共同开发的工具,它利用多视图视频扩散模型,从单目视频中生成动态3D(4D)场景表示。该工具可以合成新视图、重建动态3D模型,并支持独立控制相机视点和场景动态,适用于电影制作、游戏开发、虚拟现实等多种领域。 AI项目与工具 2025年06月12日 72 点赞 0 评论 461 浏览
ID ID-Animator是一款由腾讯光子工作室、中科大和中科院合肥物质科学研究院联合开发的零样本人类视频生成技术。它能够根据单张参考面部图像生成个性化视频,并根据文本提示调整视频内容。ID-Animator通过结合预训练的文本到视频扩散模型和轻量级面部适配器,实现高效的身份保真视频生成。其主要功能包括视频角色修改、年龄和性别调整、身份混合以及与ControlNet等现有条件模块的兼容性。 AI项目与工具 2024年01月01日 67 点赞 0 评论 461 浏览
Sunoify Sunoify是一款利用人工智能技术实现文字、图片、表情符号甚至产品链接向音乐转化的在线平台。它提供多种创作模式,包括文字转音乐、图片音乐化等,并支持个性化风格定制。Sunoify适合视频制作者、品牌营销团队以及音乐爱好者,帮助他们快速生成高质量的原创音乐,满足不同场景需求。 AI项目与工具 2025年06月12日 57 点赞 0 评论 460 浏览
豆包AI视频模型 豆包AI视频模型包括PixelDance和Seaweed两款工具,分别基于DiT和Transformer架构。PixelDance擅长处理复杂指令和多主体互动,适合制作情节丰富的短片;Seaweed支持多分辨率输出,生成高质量、高逼真的视频,适用于商业领域。两者均提供多样化的风格选择和输出格式,满足不同场景需求。 --- AI项目与工具 2025年06月12日 45 点赞 0 评论 460 浏览
WonderPlay WonderPlay 是斯坦福大学与犹他大学联合开发的新型框架,能够从单张图片和用户定义的动作生成动态3D场景。它结合物理模拟与视频生成技术,支持多种物理材质和动作类型,实现逼真的动态效果。用户可通过简单操作与场景互动,生成丰富的物理响应。该工具具备交互式查看器,适用于AR/VR、影视特效、教育、游戏开发等多个领域。 AI项目与工具 2025年06月11日 35 点赞 0 评论 459 浏览
录咖 录咖,一站式音视频处理平台,提供AI视频对话、AI字幕、AI语音转文字,录屏、剪辑、转GIF/音频等服务,同时支持云存储和分享。 直播录屏 2025年06月05日 92 点赞 0 评论 459 浏览
Pixfun AI 一款可以将脚本转化为高质量的视频动画的工具,Pixfun AI可以简化并降低了制作动画的成本并提高视频制作效率,适用于笑话、小说推文、故事等内容创作。 Ai视频生成 2025年06月05日 100 点赞 0 评论 458 浏览
LanDiff LanDiff是一种结合自回归语言模型和扩散模型的文本到视频生成框架,采用粗到细的生成策略,有效提升语义理解与视觉质量。其核心功能包括高效语义压缩、高质量视频生成、语义一致性保障及灵活控制能力。支持长视频生成,降低计算成本,适用于视频制作、VR/AR、教育及社交媒体等多个领域。 AI项目与工具 2025年06月12日 92 点赞 0 评论 457 浏览