生成 - 智狐AI导航

绘蛙·多图成片

绘蛙·多图成片是一款基于AI技术的视频生成工具，通过上传2-4张连贯图片并配合文字描述，快速生成高质量视频。支持多种视频尺寸，具备智能文案生成能力，适用于创意视频、广告、电商展示等多种场景，显著降低视频制作门槛和成本。

AI项目与工具 2025年06月12日 18 点赞 0 评论 452 浏览

GroundingBooth

GroundingBooth 是一种创新的文本到图像定制框架，通过结合文本-图像对齐模块和遮罩交叉注意力层，实现了前景主体与背景对象的空间精准对齐。其核心功能包括单主题与多主题定制、身份保留、文本-图像一致性保障及复杂场景下的高精度生成。该工具广泛应用于个性化商品定制、艺术创作、游戏设计、广告营销等多个领域，为视觉内容创作提供了强大的技术支持。

AI项目与工具 2025年06月12日 20 点赞 0 评论 452 浏览

SmartEraser

SmartEraser是中科大与微软亚洲研究院联合开发的图像编辑工具，采用“掩码区域引导”技术实现精准对象移除，同时保留周围上下文。基于Syn4Removal数据集训练，支持多种掩码输入，适用于复杂场景，广泛应用于照片编辑、设计、文物修复及科研等领域。

AI项目与工具 2025年06月12日 36 点赞 0 评论 452 浏览

PowerMode AI

PowerMode AI是一个为初创公司提供AI生成的ppt演讲平台。

PPT资源 2025年06月05日 90 点赞 0 评论 452 浏览

EzAudio

EzAudio是一款基于文本到音频（Text-to-Audio, T2A）生成模型，通过优化的扩散变换器架构和高效的数据训练策略，实现了快速生成高质量音频的功能。它支持多种应用场景，如音乐创作、影视后期制作、语音合成等，并具备高保真度和低资源消耗的特点。

AI项目与工具 2025年06月12日 73 点赞 0 评论 452 浏览

LongRAG

LongRAG是一个专为长文本问答设计的双视角鲁棒检索增强生成框架，包含混合检索器、LLM增强信息提取器、CoT引导过滤器和LLM增强生成器。它通过整合全局上下文与细节信息，解决长文本中的复杂问答挑战，并在多个数据集上展现优异性能。此外，其自动化微调数据构建能力增强了模型的指令遵循能力和领域适用性。

AI项目与工具 2025年06月12日 27 点赞 0 评论 452 浏览