生成

Ingredients

Ingredients是一款基于多身份图像与视频扩散Transformer的视频生成框架,支持多身份特征的高效整合与动态分配。其核心模块包括面部提取器、多尺度投影器和ID路由器,能够保持身份一致性并生成高质量视频内容。无需额外训练即可实现个性化视频制作,适用于娱乐、广告、教育等多个领域。

LeviTor

LeviTor是一款由多所高校和企业联合研发的图像到视频合成工具,它利用深度信息和K-means聚类点来控制视频中3D物体的轨迹,无需显式3D轨迹跟踪。通过高质量视频对象分割数据集训练,该工具能精准捕捉物体运动与交互,支持用户通过简单的2D图像操作实现复杂的3D效果,大幅降低了技术门槛,广泛应用于电影特效、游戏动画、虚拟现实等领域。

琅琅配音

琅琅配音是一款卓越的智能文本转语音工具,提供语音合成服务。

讯飞星火

科大讯飞推出的新一代GPT人工智能模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。

Kimi 创作空间

Kimi创作空间是一款利用AI技术辅助视频制作的工具,支持12种预设风格模板以及自定义素材上传,用户可通过输入场景描述和选择音乐快速生成音乐视频。其功能涵盖模板选择、自定义创作、场景描述输入、音乐添加、视频生成、编辑预览及下载,适用于社交媒体、商业宣传、个人娱乐等多种应用场景。

PresentationGPT

PresentationGPT是一款基于AI的演示文稿生成工具,支持快速生成高质量的PowerPoint和Google幻灯片。用户可通过输入主题或上传文件实现自动化创作,并享受多格式导出、自定义设计等功能。产品提供免费与付费选项,适用于商业演示、教育培训、学术研究等多种场景,助力高效内容输出。

Wonderland

Wonderland是一项由多伦多大学、Snap和UCLA联合开发的技术,能够基于单张图像生成高质量的3D场景,并支持精确的摄像轨迹控制。它结合了视频扩散模型和大规模3D重建模型,解决了传统3D重建技术中的视角失真问题,实现了高效的三维场景生成。Wonderland在多个基准数据集上的3D场景重建质量均优于现有方法,广泛应用于建筑设计、虚拟现实、影视特效、游戏开发等领域。

Large Motion Model

Large Motion Model(LMM)是一款由新加坡南洋理工大学S-Lab和商汤科技合作研发的多模态运动生成框架。它支持从文本、音乐等多种模态生成逼真运动序列,具备高度精准的身体部位控制能力和强大的泛化能力。通过整合多样化的MotionVerse数据集以及创新性的ArtAttention机制和预训练策略,LMM在多个领域展现出高效的应用潜力,包括动画、虚拟现实、影视特效及运动分析等。

Kandinsky

Kandinsky-3是一款基于潜在扩散模型的文本到图像生成框架,支持文本到图像生成、图像修复、图像融合、文本-图像融合、图像变化生成及视频生成等多种功能。其核心优势在于简洁高效的架构设计,能够快速生成高质量图像并提升推理效率。

Hugo

一个使用 Go 语言开发的开源静态网站生成器,速度快,灵活性高。它通过模板系统和快速的资产处理管道,能够在数秒内渲染出完整的网站。