AI项目与工具

EliGen

EliGen是由浙江大学与阿里巴巴集团联合开发的实体级可控图像生成框架,采用区域注意力机制实现对图像中实体的精确控制,支持多实体修复、风格化生成及交互式编辑。基于50万高质量注释样本训练,具备强大泛化能力,适用于虚拟场景、角色设计、数据合成及产品展示等场景。

Agent Neo

Agent Neo是Flowith推出的创新AI Agent,具备无限步骤、无限上下文和无限工具的核心能力,可执行复杂任务、处理海量信息并调用多种大模型与工具。结合知识库功能,用户可快速构建数字分身或生成高质量内容。支持24/7云端执行、多步骤优化和智能重新规划,适用于自动化任务、内容创作、知识管理等场景。目前为邀请制,需激活码使用。

SketchVideo

SketchVideo是一款基于草图和文本提示的视频生成与编辑框架,由多所高校与企业联合研发。它利用DiT模型和草图控制网络,实现对视频内容的精细控制,支持动态调整与细节保留。该工具适用于多种场景,如影视制作、教育、游戏开发等,具备高效生成与高质量输出能力。

海豚AI配音

海豚AI配音是一款支持多语言、多音色的文本转语音工具,提供超过500种真人音色和1000多种二次元音色,适用于有声书、自媒体、教育、动漫及广告等领域。支持多人配音、声音克隆、变声等功能,操作简便,适合各类内容创作者提升作品质量。

妙刷

妙刷是一款由美团推出的AI创作工具,支持修图、文本生图、音频生图及视频生成等功能,可将日常素材转化为艺术作品,如拟人化宠物、魔幻风景等,同时定期更新玩法和特效以保持新鲜感。

PIXMAKER

PIXMAKER是一款基于AI技术的图像生成与编辑平台,主要服务于电商行业。其核心功能涵盖AI生成产品背景、虚拟试穿效果、多姿势模特照片生成、动态产品视频制作以及背景移除等。用户无需具备专业设计技能即可快速生成高质量的产品图片和视频,从而提升商品展示效果并促进销售转化。该工具广泛应用于电商、市场营销、时尚服装等多个领域,助力企业高效完成产品视觉内容创作。

TIGER

TIGER是由清华大学研发的轻量级语音分离模型,采用时频交叉建模策略与多尺度注意力机制,有效提升语音分离性能,同时显著降低计算和参数开销。模型通过频带切分优化资源利用,适应复杂声学环境,广泛应用于会议记录、视频剪辑、电影音频处理及智能语音助手等领域。

Pokecut

Pokecut是一款基于AI技术的在线照片编辑工具,主要功能包括智能背景移除、背景更换、画质增强及创意图像编辑。它支持多种应用场景,如电商、社交媒体、艺术设计和摄影后期,提供丰富背景模板与颜色选择,并可通过图层编辑器实现更精细的效果调整。Pokecut无需安装软件即可在线操作,支持多平台使用,适合不同需求的用户群体。 ---

Coloring Book Hero

Coloring Book Hero是一款利用AI技术打造的数字涂色应用,用户可通过文字指令生成个性化绘图模板并上色。它拥有丰富的模板库及多样化工具,支持精细操作,并具备社区分享功能,适用于教育、娱乐、减压及艺术治疗等场景。

IFAdapter

IFAdapter是一种由腾讯与新加坡国立大学联合开发的文本到图像生成模型,专为提高多实例图像生成时的空间定位与特征表达准确性而设计。它通过“外观标记”与“实例语义图”两大关键技术解决了传统方法中的定位与特征问题,并支持以即插即用的形式融入现有扩散模型,无需重新训练即可实现高效的空间控制。