VideoAnydoor VideoAnydoor是一款由多所高校与研究机构联合开发的视频对象插入系统,基于文本到视频的扩散模型,支持高保真对象插入与精确运动控制。其核心模块包括ID提取器和像素变形器,能实现对象的自然融合与细节保留。该工具适用于影视特效、虚拟试穿、虚拟旅游、教育等多个领域,具备良好的通用性和扩展性。 AI项目与工具 2025年06月12日 61 点赞 0 评论 576 浏览
Yi Yi-Coder是一款由零一万物开发的开源AI编程助手,支持52种主流编程语言,能够处理长达128K tokens的上下文。它在多个代码生成基准测试中表现优异,尤其在LiveCodeBench平台上的表现尤为突出。Yi-Coder在代码编辑和补全方面也有卓越的表现,适用于各种开发项目,帮助开发者提高工作效率。 --- AI项目与工具 2025年06月12日 80 点赞 0 评论 576 浏览
3DFY.ai 3DFY.ai是一款利用生成式人工智能从文本中创建高质量3D模型的工具。它旨在满足未来的需求,允许用户在不影响质量的情况下大规模生成3D内容。该工具提供了多种服务,包括文本到3D w... 创作工具 1970年01月01日 0 点赞 0 评论 576 浏览
Pippit AI 一款由 CapCut 推出的专注于营销内容生产的AI创作工具。用户可通过输入产品链接或上传素材,快速生成视频、图片和数字人,适配社交媒体和电商平台。 Ai视频生成 2025年06月05日 81 点赞 0 评论 575 浏览
MultiBooth MultiBooth是一种由多所高校和研究机构联合开发的多概念图像生成工具,能够根据文本提示生成包含多个指定概念的高质量图像。其核心技术包括单概念学习和多概念整合,采用多模态编码器、自适应归一化和区域定制化模块,实现高效、精准的图像生成。支持插件式架构,具备良好的扩展性和灵活性,适用于创意设计、广告、教育、电商及科研等多个领域。 AI项目与工具 2025年06月12日 42 点赞 0 评论 575 浏览
Llasa TTS Llasa TTS是基于LLaMA架构的开源文本转语音模型,支持高质量语音合成、情感表达和音色克隆。采用单层VQ编解码器和Transformer结构,具备多语言支持及长文本处理能力,适用于智能助手、有声读物、游戏娱乐等场景。模型提供不同参数规模版本,支持零样本学习,提升语音自然度和表现力。 AI项目与工具 2025年06月12日 71 点赞 0 评论 575 浏览
Runway Gen Runway Gen-4 是一款由 Runway 公司推出的高保真 AI 视频生成模型,能够跨场景保持人物、物体和环境的一致性,无需额外训练。用户仅需提供一张参考图和文字指令,即可生成具有真实物理效果和高质量视觉风格的视频内容。支持多种应用场景,如影视制作、动画创作、音乐视频、游戏开发和广告营销,有效提升创作效率并降低成本。 AI项目与工具 2025年06月12日 61 点赞 0 评论 575 浏览
SpeechEasy SpeechEasy是一种合成语音解决方案,可以让用户从文本生成高质量、易于理解的音频。它适用于各种设备和平台,支持桌面和移动设备,有近12种高质量的合成声音可供选择。它使用简单... Ai语音工具 1970年01月01日 0 点赞 0 评论 575 浏览