视频

拓世AI数字人平台

拓世AI数字人平台通过其高效的AIGC技术和用户友好的操作界面,为用户提供了一个创新的数字人视频制作和IP打造解决方案。

Google Veo

强大的视频生成模型。它可以生成超过一分钟的高质量 1080p 分辨率视频,具有多种电影和视觉风格。

Transmonkey AI

一款由AI驱动的翻译软件,支持超过 130 种语言,包括英语、中文、日语、阿拉伯语、法语、德语、希伯来语、印尼语等,并能处理文档、视频、图片和音频等各种文件格式。

TheoremExplainAgent

TheoremExplainAgent(TEA)是一款基于多模态技术的AI工具,可生成超过5分钟的数学与科学定理解释视频,涵盖多个STEM领域。它结合文本、动画和语音,提升抽象概念的理解效果,并具备自动错误诊断功能。通过TheoremExplainBench基准评估,TEA在准确性、逻辑性和视觉表现上均表现优异,适用于在线教育、课堂教学和学术研究等多种场景。

VITRON

VITRON是一款由多家顶尖机构联合研发的像素级视觉大型语言模型,具备强大的图像与视频处理能力,涵盖理解、生成、分割及编辑等功能。它融合了编码器-LLM-解码器架构、视觉-语言编码和视觉专家系统,支持多种视觉任务,广泛应用于图像编辑、视频创作、教育辅助、电商营销和新闻报道等领域。

WaveSpeedAI

WaveSpeedAI 是一款集图像与视频生成于一体的 AI 平台,提供多个高性能模型,支持高质量图像生成、个性化风格定制及视频内容创作。平台具备超快速生成能力,适用于创意设计、广告制作和视频内容生产等领域,提供易用接口和企业级部署选项。

夸克浏览器AI助手

一个功能强大的浏览器插件。支持多种浏览器,包括Chrome、Edge等,它不仅能通过AI搜索快速提供精准答案,还能辅助写作、生成PPT框架,甚至帮助学习,支持拍题讲解。

Tora

Tora是阿里推出的一个强大的视频生成工具,它通过集成多种条件来创造高质量的视频内容。其主要优势在于对运动轨迹的精确控制和对物理世界运动的真实模拟,这使得Tora在视频内容创...

ViewExtrapolator

ViewExtrapolator是一种基于稳定视频扩散(SVD)的新视角外推方法,能够生成超出训练视图范围的新视角图像,特别适用于提升3D渲染质量和视觉真实性。该工具通过优化SVD的去噪过程,减少了伪影问题,同时支持多视图一致性生成,无需额外微调即可实现高效的数据和计算性能,广泛适用于虚拟现实、3D内容创作及文物保护等多个领域。

CAT4D

CAT4D是一种由Google DeepMind、哥伦比亚大学及加州大学圣地亚哥分校共同开发的工具,它利用多视图视频扩散模型,从单目视频中生成动态3D(4D)场景表示。该工具可以合成新视图、重建动态3D模型,并支持独立控制相机视点和场景动态,适用于电影制作、游戏开发、虚拟现实等多种领域。