生成

Videotoword.ai

Videotoword.ai 是一款以AI驱动的在线服务,支持将音频和视频文件转化为文本,具有高精度(99.9%)和多语言支持(98种以上)。它能处理长达10小时的文件,具备自动转录、文本编辑导出及AI摘要生成功能,广泛应用于教育、媒体、法律和企业等领域。

T2I

T2I-R1是由香港中文大学与上海AI Lab联合开发的文本到图像生成模型,采用双层推理机制(语义级和 Token 级 CoT),实现高质量图像生成与复杂场景理解。其基于 BiCoT-GRPO 强化学习框架,结合多专家奖励模型,提升生成图像的多样性和稳定性。适用于创意设计、内容制作、教育辅助等多个领域,具有广泛的应用潜力。

MovieDreamer

MovieDreamer是一个由浙江大学与阿里巴巴联合开发的AI视频生成框架,专为长视频设计。该框架结合自回归模型和扩散渲染技术,生成复杂的长视频内容。它支持多层次叙事一致性、高质量视觉渲染和多模态脚本,适用于电影预告片、VR叙事、教育视频和游戏内剧情等多种场景。

SLEA.AI

SLEA.AI是一款利用人工智能技术的免费Logo生成工具,支持用户通过简单输入品牌信息快速生成多款定制化Logo。该工具具备友好的操作界面、强大的编辑功能以及高分辨率无水印下载选项,适用于初创企业、电商店铺、非营利组织及个人创作者等多个领域,帮助用户实现高效的品牌形象构建。

AnimateAI.Pro

AnimateAI.Pro是一款基于先进AI技术的动画视频生成平台,支持用户通过简单操作快速生成高质量的连贯角色视频内容。平台集成了角色生成、故事板设计、视频制作及多种AI工具,用户无需专业背景即可高效创作动画视频,适用于教育、娱乐、影视等多个领域。

FluxMusic

FluxMusic 是一个开源的音乐生成工具,能够将文本描述转化为音乐。它采用先进的扩散模型和Transformer架构,通过修正流技术提高音乐的自然度和质量。该工具支持多种规模的模型,具备文本到音乐生成、语义理解、多模态融合等功能,适用于音乐创作、影视配乐、游戏音乐生成等多种场景。

imgcook图像大厨

imgcook是阿里巴巴前端委员会智能化小组的服务化的内外落地产品,通过智能化技术一键生成可维护的前端代码

Memo.ac

Memo是一款将视频转换为翻译文本、字幕和笔记的工具,它支持多语言,可以在中文、英文、日文和90多种语言之间进行转录和翻译。

libcom

libcom是一款由上海交通大学BCMI实验室开发的图像合成工具箱,支持图像融合、和谐化、阴影生成、对象放置及生成式合成等功能,采用传统图像处理与深度学习技术相结合的方式,提供高质量的合成图像解决方案。适用于增强现实、艺术创作、电子商务、影视制作及游戏开发等多个领域。