视频 - 智狐AI导航

STIV

STIV是一款由苹果公司开发的视频生成大模型，具有8.7亿参数，擅长文本到视频（T2V）及文本图像到视频（TI2V）任务。它通过联合图像-文本分类器自由引导（JIT-CFG）技术提升生成质量，并结合时空注意力机制、旋转位置编码（RoPE）及流匹配训练目标优化性能。STIV支持多种应用场景，包括视频预测、帧插值、长视频生成等，适用于娱乐、教育、广告及自动驾驶等多个领域。

AI项目与工具 2025年06月12日 57 点赞 0 评论 553 浏览

可灵AI

快手大模型团队自研打造的视频生成大模型，可灵AI具备强大的视频生成能力，让用户可以轻松高效地完成艺术视频创作。

Ai视频生成 2025年06月05日 36 点赞 0 评论 554 浏览

Pika Art

Pika Art是一个使用AI技术生成和编辑视频的平台，旨在使视频制作变得简单和无障碍。该平台由北京海科互联科技有限公司开发，其背后的团队由AI研究人员、电影制作人、程序员甚至时...

Ai视频生成 2026年07月28日 0 点赞 0 评论 554 浏览

Keyframes Studio

一款在线视频编辑器，用于为所有社交媒体平台创建、编辑和重新利用精美的视频，可帮助您创建产品、网页或其他任何您想要展示的内容的 TikTok 视频。

视频剪辑 2025年06月05日 93 点赞 0 评论 554 浏览

Viggle AI

一款由JST-1驱动的图片生成动画的AI视频生成器，JST-1是第一个具有实际物理理解能力的视频-3D基础模型。它允许用户根据自己的需求使任何角色移动。

Ai视频生成 2025年06月05日 54 点赞 0 评论 554 浏览

FishAudio

一个在线AI文本转语音合成配音声音克隆平台，以其自然、富有表现力的语音生成技术，为用户带来了前所未有的音频体验。

Ai语音工具 2025年06月05日 76 点赞 0 评论 555 浏览

BAGEL是字节跳动开源的多模态基础模型，拥有140亿参数，采用混合变换器专家架构（MoT），通过两个独立编码器捕捉图像的像素级和语义级特征。它能够进行图像与文本融合理解、视频内容理解、文本到图像生成、图像编辑与修改、视频帧预测、三维场景理解与操作、世界导航以及跨模态检索等任务。BAGEL在多模态理解基准测试中表现优异，生成质量接近SD3，并适用于内容创作、三维场景生成、可视化学习和创意广告生成等

AI项目与工具 2025年06月11日 92 点赞 0 评论 556 浏览

文本到视频生成：CogVideoX (2024) 和 CogVideo (ICLR 2023)

视频生成 2025年06月26日 0 点赞 0 评论 556 浏览

Faster Whisper

Faster Whisper 是一款基于 OpenAI Whisper 模型的高效语音识别工具，利用 CTranslate2 引擎显著提升转写速度并降低内存消耗。它支持多语言处理，可应用于实时语音转写、视频字幕生成、客户服务、医疗记录等领域。其核心技术包括 8 位量化、语音活动检测（VAD）及模型优化，同时提供灵活的 API 接口供开发者集成。

AI项目与工具 2025年06月12日 30 点赞 0 评论 558 浏览

万相营造

阿里妈妈旗下的一款AI电商营销工具，原名万相实验室。万相营造基于生成式AI智能技术，能够快速生成商品图、视频和文案。

电商运营 2025年06月05日 59 点赞 0 评论 559 浏览

视频

首页

视频

列表

默认

浏览次数

发布日期