文本驱动 - 智狐AI导航

VideoGrain

VideoGrain是由悉尼科技大学与浙江大学联合研发的零样本多粒度视频编辑框架，支持类别级、实例级和部件级的精细化视频修改。它通过调节时空交叉注意力和自注意力机制，提升文本提示对目标区域的控制能力，确保时间一致性与特征分离，显著优于现有T2I和T2V方法。该工具无需额外参数调整，具备高效计算性能，适用于影视制作、广告营销、内容创作等多个领域。

AI项目与工具 2025年06月12日 99 点赞 0 评论 639 浏览

MoMask

MoMask是一款基于生成式掩码建模的3D人体动作生成工具，支持文本驱动的动作创建与编辑。采用分层量化与Transformer架构，实现高精度、连贯的3D动作序列生成，在HumanML3D数据集上的FID值仅为0.045。支持动作时序控制、多平台部署及动作评估功能，适用于游戏开发、动画制作、VR及体育分析等多个领域。

AI项目与工具 2025年06月12日 19 点赞 0 评论 580 浏览

InfiniteYou

InfiniteYou 是由字节跳动推出的基于扩散变换器的身份保持图像生成框架，通过 InfuseNet 注入身份特征，确保生成图像与输入图像的高度相似。结合多阶段训练策略，提升文本与图像对齐、图像质量和美学效果。支持插件化设计，兼容多种工具，适用于社交媒体、影视制作、广告营销等多个领域。

AI项目与工具 2025年06月12日 79 点赞 0 评论 566 浏览

NeuralSVG

NeuralSVG是一种基于文本驱动的矢量图形生成工具，利用多层感知器网络将文本提示转化为结构清晰、可编辑的矢量图形。它支持动态调整图形属性，具备隐式神经表示和分数蒸馏采样优化技术，确保图形语义明确、层次分明，适用于艺术创作、设计及学术研究等领域。

AI项目与工具 2025年06月12日 84 点赞 0 评论 562 浏览

Mobius

Mobius 是一款基于人工智能的视频生成工具，能根据文本描述自动生成无缝循环的视频内容。其核心技术包括潜在循环技术和时间一致性优化，确保视频流畅自然。支持多场景应用，如社交媒体、广告、艺术创作和教育领域，简化视频制作流程，提升创作效率与质量。

AI项目与工具 2025年06月12日 90 点赞 0 评论 531 浏览

SeedEdit

SeedEdit是一款基于自然语言指令的通用图像编辑工具，能够实现修图、换装、风格转换等多种编辑功能。它在图像重建与生成之间找到最佳平衡，支持零样本学习和多轮编辑操作，确保高质量输出。SeedEdit适用于社交媒体、广告、电商、艺术创作等多个领域，提供从简单调整到复杂创意的全面解决方案。

AI项目与工具 2025年06月12日 27 点赞 0 评论 520 浏览

Lyria 2

Lyria 2 是谷歌 DeepMind 推出的第三代 AI 音乐生成模型，支持高保真音频输出与多种音乐风格生成，具备实时创作、文本驱动创作及音频编辑功能。结合扩散模型与 GAN 技术，实现风格解耦与动态调整，适用于音乐制作、影视配乐、广告音乐等场景。集成于 Music AI Sandbox，提供模块化工具链，降低创作门槛，并嵌入数字水印技术以确保内容可识别性。

AI项目与工具 2025年06月11日 91 点赞 0 评论 479 浏览

Vozo

Vozo作为一个创新的AI视频编辑工具，通过其强大的脚本重写、声音编辑和口型同步功能，为用户提供了一个简单、高效的视频内容更新和本地化解决方案。

Ai视频生成 2026年06月27日 0 点赞 0 评论 441 浏览

UniEdit

UniEdit 是一个强大的视频编辑工具，它通过利用预训练的文本到视频生成器，在无需调优的情况下，提供了一种简单而有效的方法来编辑视频的运动和外观。

Ai平台模型 2026年06月27日 0 点赞 0 评论 356 浏览

I2VGen

一个强大的图像到视频的生成模型，它通过创新的方法解决了AI视频合成过程中的语义准确性、清晰度和时空连续性的挑战。用户可以轻松地将静态图像转换为高质量的动态视频，生成的视...

Ai平台模型 2026年06月27日 0 点赞 0 评论 346 浏览

文本驱动

首页

文本驱动

列表

默认

浏览次数

发布日期