视频 - 智狐AI导航

GAS

GAS是一种从单张图像生成高质量、视角一致且时间连贯虚拟形象的AI工具，结合3D人体重建与扩散模型技术，支持多视角合成与动态姿态动画。其统一框架提升模型泛化能力，适用于游戏、影视、体育及时尚等领域，具备高保真度与真实感。

AI项目与工具 2025年06月12日 36 点赞 0 评论 771 浏览

Sa2VA

Sa2VA是由字节跳动联合多所高校开发的多模态大语言模型，结合SAM2与LLaVA技术，实现对图像和视频的密集、细粒度理解。它支持指代分割、视觉对话、视觉提示理解等多种任务，具备零样本推理能力和复杂场景下的高精度分割效果。适用于视频编辑、智能监控、机器人交互、内容创作及自动驾驶等多个领域。

AI项目与工具 2025年06月12日 66 点赞 0 评论 749 浏览

AnyCharV

AnyCharV是一款由多所高校联合研发的角色可控视频生成框架，能够将任意角色图像与目标场景结合，生成高质量视频。它采用两阶段训练策略，确保角色细节的高保真保留，并支持复杂的人-物交互和背景融合。该工具兼容多种文本生成模型，具备良好的泛化能力，适用于影视制作、艺术创作、虚拟现实等多个领域。

AI项目与工具 2025年06月12日 73 点赞 0 评论 563 浏览

Long

Long-VITA是一款由腾讯优图实验室、南京大学和厦门大学联合开发的多模态AI模型，支持处理超长文本（超过100万tokens）及多模态输入（图像、视频、文本）。通过分阶段训练提升上下文理解能力，结合动态分块编码器与并行推理技术，实现高效处理长文本和高分辨率图像。模型基于开源数据训练，适用于视频分析、图像识别、长文本生成等场景，性能在多个基准测试中表现突出。

AI项目与工具 2025年06月12日 65 点赞 0 评论 914 浏览

CustomVideoX

CustomVideoX是一种基于视频扩散变换器的个性化视频生成框架，能够根据参考图像和文本描述生成高质量视频。其核心技术包括3D参考注意力机制、时间感知注意力偏差（TAB）和实体区域感知增强（ERAE），有效提升视频的时间连贯性和语义一致性。支持多种应用场景，如艺术设计、广告营销、影视制作等，具备高效、精准和可扩展的特点。

AI项目与工具 2025年06月12日 98 点赞 0 评论 660 浏览

DragAnything

DragAnything 是一款由快手与高校联合研发的视频生成工具，通过实体表示和轨迹输入实现对视频中物体的精确运动控制。它支持多实体独立操作、相机运动调整，并采用扩散模型生成高质量视频内容。具备用户友好的交互方式，适用于视频编辑、游戏开发、教育及广告等多个场景。

AI项目与工具 2025年06月12日 74 点赞 0 评论 796 浏览

青梧字幕

青梧字幕是一款基于AI语音识别技术的字幕提取工具，能够从视频中精准提取语音内容并生成时间轴字幕。支持多语言识别、多格式导出及多语种翻译，适用于视频创作者、外语学习者及字幕团队。所有数据处理在本地完成，保障隐私安全，兼容Windows和MacOS系统，提升字幕制作效率。

AI项目与工具 2025年06月12日 90 点赞 0 评论 788 浏览

Light

Light-A-Video 是一种无需训练的视频重照明技术，由多所高校和研究机构联合开发。它通过 CLA 和 PLF 模块实现高质量、时间一致的光照调整，支持前景与背景分离处理，并具备零样本生成能力。适用于影视、游戏、视频创作等多种场景，兼容多种视频生成模型，提升视频表现力与创作效率。

AI项目与工具 2025年06月12日 91 点赞 0 评论 807 浏览

Qihoo

Qihoo-T2X是由360 AI研究院与中山大学联合研发的高效多模态生成模型，基于代理标记化扩散 Transformer（PT-DiT）架构。该模型通过稀疏代理标记注意力机制显著降低计算复杂度，支持文本到图像、视频及多视图生成。具备高效生成能力和多任务适应性，适用于创意设计、视频制作、教育、游戏开发及广告等多个领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 628 浏览

灵境AI

灵境AI是一款集文创数字化与AI内容生成于一体的智能平台，具备文案创作、小说辅助、AI图片与视频生成等多种功能，适用于广告、文学、艺术设计等多个领域。用户可通过输入关键词或素材，快速生成高质量内容，并支持风格调整与优化。平台还提供IP孵化、数字人创建等创新功能，助力创作者提升效率与创意表达。

AI项目与工具 2025年06月12日 38 点赞 0 评论 838 浏览

视频

首页

视频

列表

默认

浏览次数

发布日期

GAS