AI项目与工具

HunyuanCustom

HunyuanCustom是腾讯混元团队开发的多模态视频生成框架，支持图像、音频、视频和文本等多种输入条件，生成高质量定制化视频。采用文本-图像融合与图像ID增强技术，提升身份一致性和视频真实性。适用于虚拟人广告、虚拟试穿、视频编辑等场景，具备音频驱动和视频驱动两种生成方式，展现强大可控性与灵活性。

AI项目与工具 2025年06月11日 73 点赞 0 评论 733 浏览

libcom

libcom是一款由上海交通大学BCMI实验室开发的图像合成工具箱，支持图像融合、和谐化、阴影生成、对象放置及生成式合成等功能，采用传统图像处理与深度学习技术相结合的方式，提供高质量的合成图像解决方案。适用于增强现实、艺术创作、电子商务、影视制作及游戏开发等多个领域。

AI项目与工具 2025年06月12日 29 点赞 0 评论 733 浏览

Perception

Perception-as-Control是由阿里巴巴通义实验室开发的图像动画框架，支持对相机和物体运动的细粒度控制。它基于3D感知运动表示，结合U-Net架构的扩散模型，实现多种运动相关的视频合成任务，如运动生成、运动克隆、转移和编辑。通过三阶段训练策略，提升运动控制精度和稳定性，适用于影视、游戏、VR/AR、广告及教育等多个领域。

AI项目与工具 2025年06月12日 20 点赞 0 评论 733 浏览

Wavy

Wavy是一款利用AI技术的照片编辑工具，可将普通照片转换为具有艺术风格的作品。它提供多种功能，包括AI艺术生成、图像放大、照片优化以及对象移除等，适用于个人摄影、社交媒体内容创作、艺术设计等多个场景，帮助用户实现创意表达与个性化展示。

AI项目与工具 2025年06月12日 73 点赞 0 评论 732 浏览

Paper2Code

Paper2Code是一款由韩国科学技术院与DeepAuto.ai合作开发的AI工具，基于多Agent大语言模型，能将机器学习论文自动转化为可运行的代码仓库。它通过规划、分析和代码生成三个阶段，确保代码结构清晰且忠实于原论文内容。该工具显著提升了科研复现效率，适用于研究、教学、工业等多个领域，具有高度实用性和准确性。

AI项目与工具 2025年06月11日 78 点赞 0 评论 732 浏览

VMB

VMB是一个由多机构合作研发的多模态音乐生成框架，可从文本、图像和视频等多样化输入生成音乐。它通过文本桥接和音乐桥接优化跨模态对齐与可控性，显著提高了音乐生成的质量和定制化程度。VMB具有增强模态对齐、提升可控性、显式条件生成等特点，适用于电影、游戏、虚拟现实等多个领域。

AI项目与工具 2025年06月12日 84 点赞 0 评论 732 浏览

Marco

Marco是一款由阿里国际研发的大规模商用翻译大模型，支持15种主流语种，具备基于语境的精准翻译能力。其核心功能包括多语种翻译支持、跨境电商优化、多样化风格翻译以及高并发处理能力。Marco采用深度学习技术，结合多语言数据筛选和参数扩展方法，确保翻译质量和效率。它广泛应用于商品信息本地化、多语言客户服务、跨境电商平台及个人文档翻译等领域，助力全球化沟通。

AI项目与工具 2025年06月12日 58 点赞 0 评论 732 浏览

AI Song Generator

AI Song Generator是一款基于人工智能技术的在线工具，能够生成高质量且原创的歌曲。用户可通过简单的描述或自定义歌词、标题和风格来创作音乐。该工具支持多种语言，适用于视频背景音乐、广告歌曲、游戏配乐等多种场景。其主要功能包括一键生成歌曲、自定义模式、多风格支持、多语言歌词以及高品质输出。

AI项目与工具 2025年06月12日 44 点赞 0 评论 732 浏览

AI材料星

AI材料星是一款基于AI技术的公文写作辅助平台，支持生成多种类型的高质量公文内容，具备AI纠错、原创度检测、PPT生成等功能。平台提供丰富的范文和金句资源，适用于政府、企业及学术研究场景，提升写作效率与规范性。

AI项目与工具 2025年06月11日 36 点赞 0 评论 732 浏览

Infinity

Infinity-MM是智源研究院发布的千万级多模态指令数据集，包含4300万条样本，涵盖视觉问答、文字识别、文档分析及数学推理等多领域任务。它通过严格的筛选和去重保证数据质量，并采用合成数据生成技术扩展数据集规模。基于此数据集，智源研究院训练出了20亿参数的Aquila-VL-2B模型，在多项基准测试中表现出色，推动了多模态AI领域的研究与发展。

AI项目与工具 2025年06月12日 87 点赞 0 评论 732 浏览

AI项目与工具 默认 浏览次数 发布时间

AI项目与工具

默认

浏览次数

发布时间