生成

VMB

VMB是一个由多机构合作研发的多模态音乐生成框架,可从文本、图像和视频等多样化输入生成音乐。它通过文本桥接和音乐桥接优化跨模态对齐与可控性,显著提高了音乐生成的质量和定制化程度。VMB具有增强模态对齐、提升可控性、显式条件生成等特点,适用于电影、游戏、虚拟现实等多个领域。

Media2Face

一款革命性的语音面部动画生成工具,借助 Media2Face,现在可以从任何音频、图像或文本输入无缝生成逼真且富有表现力的面部动画。

爱作画

爱作画是一个专业的AI绘画图片创作平台,可以让用户通过Stable Diffusion、NovelAI、Midjourney生成各种风格的图片。

千颜

千颜是一款依托AI技术的照片和视频编辑工具,提供多样化的穿搭风格与视频模板,支持用户快速生成写真照片和视频。其主要功能包括AI一键换装、海量风格模板、视频换装以及图片动态化处理,满足个性化创意需求。应用场景广泛,包括个人娱乐、社交媒体内容创作、教育学习等。

CopyOwl.ai

CopyOwl.ai 是一款AI驱动的内容生成工具,支持学术写作、博客创作、市场报告及商业提案等多种场景。它能根据用户输入快速生成结构清晰、引用准确的内容,并支持风格定制。适用于学生、研究人员、企业用户等,提升内容创作效率与专业性。

Superflex

Superflex 是一款面向前端开发的 AI 工具,可将 Figma 设计、图片或文字描述快速转换为高质量代码,支持 React、Vue 等主流框架。具备代码风格匹配、智能补全、实时生成等功能,集成于 VSCode,提升开发效率。适用于原型开发、团队协作、竞品模仿及项目重构等多种场景。

AIMv2

AIMv2是苹果公司开发的开源多模态自回归预训练视觉模型,通过图像与文本的深度融合提升视觉理解能力。其采用图像块与子词标记拼接的方式进行自回归预训练,支持多种参数规模,适用于不同设备。具备视觉问答、指代表达理解、图像字幕生成、多媒体检索等功能,并可无缝集成到大型语言模型中。模型在多个视觉任务中表现优异,具备良好的可扩展性和零样本适应能力。

Kiln AI

Kiln AI 是一款开源 AI 开发工具,支持多平台使用,提供零代码微调、合成数据生成及团队协作功能。内置交互式工具,兼容多种模型和 AI 提供商,支持 Git 版本控制与自动部署,适用于智能客服、医疗、教育、金融等场景,注重数据隐私与安全性。

ProfilePicture.AI

Postcraft的免费PFP Maker是一个在线工具,允许用户为他们的社交媒体账户创建自定义头像。它允许用户上传照片,然后该工具将自动删除背景,并生成数百张独特的头像照片。