视频 - 智狐AI导航

VSI

VSI-Bench是一种用于评估多模态大型语言模型（MLLMs）视觉空间智能的基准测试工具，包含超过5000个问题-答案对，覆盖多种真实室内场景视频。其任务类型包括配置型任务、测量估计和时空任务，可全面评估模型的空间认知、理解和记忆能力，并提供标准化的测试集用于模型性能对比。 ---

AI项目与工具 2025年06月12日 10 点赞 0 评论 720 浏览

Mochi 1

Mochi 1 是一款基于开源架构的 AI 视频生成工具，具有高保真度和强大的提示遵循能力。它采用 Genmo 自研的非对称扩散变压器（AsymmDiT）架构，结合实时视频生成技术和流式架构，能够高效生成高质量的视频内容。Mochi 1 支持多种应用场景，包括视频内容创作、教育、娱乐、广告和社交媒体等，适用于个人和企业用户。

AI项目与工具 2025年06月12日 27 点赞 0 评论 720 浏览

OmniHuman

OmniHuman是字节跳动推出的多模态人类视频生成框架，基于单张图像和运动信号生成高逼真视频。支持音频、姿势及组合驱动，适用于多种图像比例和风格。采用混合训练策略和扩散变换器架构，提升生成效果与稳定性，广泛应用于影视、游戏、教育、广告等领域。

AI项目与工具 2025年06月12日 43 点赞 0 评论 720 浏览

neural frames

Neural Frames 是一款基于人工智能的文本转视频工具，能够将文本描述转换为动态视频内容，支持多种神经网络模型的选择与自定义训练。它具备音频反应动画、帧级编辑控制和高分辨率输出等功能，适用于音乐视频制作、数字艺术创作、广告设计、教育视频开发等多个领域，为创意工作者提供高效且灵活的解决方案。

AI项目与工具 2025年06月12日 33 点赞 0 评论 720 浏览

绘蛙AI视频

绘蛙新推出的AI图生视频工具，支持模特图一键变成视频。

Ai视频生成 2025年06月05日 17 点赞 0 评论 719 浏览

BibiGPT是一款利用人工智能技术自动分析和提炼音视频内容的工具。它能够一键总结来自多个平台的音视频内容，并提供多样化的总结形式，包括摘要、思维导图、字幕列表和文章视图。此外，用户可以自由提问，以获取相关问题的答案。BibiGPT支持多客户端使用，包括iOS快捷指令、微信服务号、书签版、PWA客户端、Chromium内核的浏览器插件及电脑桌面端。它还提供了多种导出和保存选项，并支持与音视频内容进

AI项目与工具 2023年01月01日 82 点赞 0 评论 719 浏览

ConceptMaster

ConceptMaster是一款基于扩散Transformer模型的多概念视频生成框架，可在无需测试调优的情况下生成高质量、概念一致的视频。通过解耦多概念嵌入并独立注入模型，有效解决身份解耦问题，尤其擅长处理高度相似的视觉概念。该工具支持多概念视频定制、高质量数据收集和全面的基准测试，适用于视频创作、动画制作、游戏开发及产品展示等领域。

AI项目与工具 2025年06月12日 99 点赞 0 评论 718 浏览

Vidu Q1

Vidu Q1是清华大学朱军教授团队研发的高可控视频生成模型，支持1080p高清视频生成，具备精准音效控制、多主体一致性调节、局部超分重建等功能。在多项国际评测中表现优异，包括VBench和SuperCLUE榜单均获第一。模型基于扩散模型与U-ViT架构，融合文本、图像和视频信息，适用于影视制作、广告宣传及动画创作等领域。

AI项目与工具 2025年06月12日 96 点赞 0 评论 718 浏览

Veo

Veo是Google DeepMind开发的一款视频生成模型，用户可以通过文本、图像或视频提示来指导其生成所需的视频内容。Veo具备深入的自然语言理解能力，能够准确解析用户的文本提示，生成高质量、高分辨率的视频。其主要功能包括高分辨率视频输出、自然语言处理、风格适应性、创意控制与定制、遮罩编辑功能、参考图像与风格应用、视频片段的剪辑与扩展以及视觉连贯性。Veo技术目前仍处于实验阶段，但已在电影制作

AI项目与工具 2024年01月01日 34 点赞 0 评论 718 浏览

Chaos® Vantage高阶应用

用实时光线追踪探索您的最复杂的3D场景。使用 Chaos® Vantage，再也无需等待。只需要拖动完整的 V-Ray 场景到 Vantage 便可开始浏览。还可以与 3ds Max，SketchUp，Rhino，Revit ...

创作工具 2026年07月29日 0 点赞 0 评论 718 浏览

视频

首页

视频

列表

默认

浏览次数

发布日期

VSI