生成 - 智狐AI导航

DiTCtrl

DiTCtrl是一种基于多模态扩散变换器架构的视频生成工具，能够利用多个文本提示生成连贯且高质量的视频内容，无需额外训练即可实现零样本多提示视频生成。它通过KV共享和潜在混合策略优化不同提示间的平滑过渡，同时在MPVBench基准上表现出色，适用于电影、游戏、广告及新闻等多个领域。

AI项目与工具 2025年06月12日 18 点赞 0 评论 657 浏览

phenaki

phenaki一种从文本生成视频的模型，提示可以随时间变化，视频可以长达数分钟。

Ai视频生成 1970年01月01日 0 点赞 0 评论 657 浏览

Framedrop

Framedrop是一款基于AI技术的在线工具，专注于从长视频中提取精彩片段并转化为短视频。它支持多平台视频导入，具备自动高光检测、智能剪辑、多语言字幕生成等功能，适合游戏直播、播客、教育等多种内容类型，帮助创作者提高效率并增强社交媒体传播力。

AI项目与工具 2025年06月12日 22 点赞 0 评论 656 浏览

Hi3DGen

Hi3DGen是由多所高校与企业联合开发的高保真3D几何生成框架，可从2D图像生成具有丰富细节的3D模型。其核心技术包括图像到法线估计、法线到几何学习及3D数据合成，采用两阶段生成流程并结合3D高斯散射与SDF重建技术，提升模型精度与细节表现。适用于游戏开发、影视制作、3D可视化等多个领域。

AI项目与工具 2025年06月12日 53 点赞 0 评论 656 浏览

Freestyler

Freestyler是一款由多机构合作开发的AI工具，专注于说唱音乐的自动化生成。它通过结合语言模型、条件流匹配技术和神经声码器，实现了从歌词和伴奏到高质量说唱音频的全流程转化。Freestyler还推出了RapBank数据集，并支持零样本音色控制，广泛应用于音乐创作、现场表演、游戏音效及教育等领域。

AI项目与工具 2025年06月12日 17 点赞 0 评论 656 浏览