HunyuanCustom HunyuanCustom是腾讯混元团队开发的多模态视频生成框架,支持图像、音频、视频和文本等多种输入条件,生成高质量定制化视频。采用文本-图像融合与图像ID增强技术,提升身份一致性和视频真实性。适用于虚拟人广告、虚拟试穿、视频编辑等场景,具备音频驱动和视频驱动两种生成方式,展现强大可控性与灵活性。 AI项目与工具 2025年06月11日 73 点赞 0 评论 344 浏览
Perception Perception-as-Control是由阿里巴巴通义实验室开发的图像动画框架,支持对相机和物体运动的细粒度控制。它基于3D感知运动表示,结合U-Net架构的扩散模型,实现多种运动相关的视频合成任务,如运动生成、运动克隆、转移和编辑。通过三阶段训练策略,提升运动控制精度和稳定性,适用于影视、游戏、VR/AR、广告及教育等多个领域。 AI项目与工具 2025年06月12日 20 点赞 0 评论 344 浏览
MagicMirror MagicMirror是一款基于深度学习的开源AI工具,提供面部替换、发型调整和穿搭模拟功能。其特点包括易用性、硬件兼容性、隐私保护及轻量化设计,支持离线运行,适用于个人娱乐、创意设计及虚拟角色扮演等场景。 AI项目与工具 2025年06月12日 17 点赞 0 评论 343 浏览
STOCKIMG.AI STOCKIMG.AI 是一款以人工智能驱动的在线设计与内容生成平台,用户可通过文本提示生成高质量图像、标志、书籍封面、海报等内容。平台支持 4K 分辨率图像放大、多风格 AI 模型选择及快速生成,适用于设计师、营销人员及内容创作者,广泛应用于社交媒体营销、品牌设计、图书出版等领域。 AI项目与工具 2025年06月12日 49 点赞 0 评论 341 浏览
R1 R1-Onevision 是一款基于 Qwen2.5-VL 微调的开源多模态大语言模型,擅长处理图像与文本信息,具备强大的视觉推理能力。它在数学、科学、图像理解等领域表现优异,支持多模态融合与复杂逻辑推理。模型采用形式化语言和强化学习技术,提升推理准确性与可解释性,适用于科研、教育、医疗及自动驾驶等场景。 AI项目与工具 2025年06月12日 92 点赞 0 评论 341 浏览
freeflo FreeFlo 是一款面向创意工作者的 AI 工具,提供丰富的艺术风格提示词库,支持主流 AI 图像生成平台。其功能涵盖风格化提示词、SREF 参数代码及精选图片资源,适用于艺术创作、平面设计、游戏开发、影视制作及教育等多个领域,助力提升创意项目的效率与质量。 AI项目与工具 2025年06月12日 91 点赞 0 评论 340 浏览
VEED AI官网 VEED AI游戏生成器是一个多功能的AI工具,它通过文本到图像的转换技术,帮助游戏开发者快速获取游戏设计和营销的视觉素材。 Ai语音工具 1970年01月01日 0 点赞 0 评论 340 浏览