生成 - 智狐AI导航

presti

Presti是一款基于生成式AI技术开发的家具行业产品摄影解决方案，能够将单一产品图像转化为逼真的生活场景照片，显著降低摄影成本并提高效率。它支持用户添加配饰、更换材质及背景生成，广泛应用于家具展示、虚拟摄影、室内设计和电子商务等领域。

AI项目与工具 2025年06月12日 11 点赞 0 评论 650 浏览

PoseTalk

PoseTalk 是一款基于文本和音频驱动的开源工具，专注于生成自然且逼真的头部动画视频。它通过 Pose Latent Diffusion (PLD) 模型和级联网络实现唇部同步与运动细化，广泛应用于虚拟助手、在线教育和娱乐等领域，提供多样化的动画生成能力和高度精准的唇形同步效果。

AI项目与工具 2025年06月12日 53 点赞 0 评论 649 浏览

Paper2Coder

Paper2Code是一款由韩国科学技术院与DeepAuto.ai联合开发的AI工具，基于多Agent大语言模型，能够将机器学习论文自动转换为可运行的代码仓库。其核心流程包括规划、分析和代码生成三个阶段，确保生成的代码结构清晰、逻辑严谨，并忠实于原始论文。该工具显著提升了研究复现效率，适用于学术研究、教学、工业应用等多个场景，是推动AI研究落地的重要工具。

AI项目与工具 2025年06月11日 91 点赞 0 评论 649 浏览

Notiv

Notiv是一款面向学生的AI学习工具，可自动分析笔记并生成复习题、抽认卡和重点总结，提升学习效率。它提供个性化学习建议，支持快速备考模式，并具备智能总结和互动式学习功能，适用于日常学习、在线课程及团队协作等场景。

AI项目与工具 2025年06月11日 20 点赞 0 评论 649 浏览

Peeps头像生成器

Peeps头像生成器由UI8团队制作的交互式在线3D头像生成器，用户可以在社交资料、社交媒体帖子、设计项目或任何需要友好面孔的地方使用3D头像生成器生成头像。

图片处理 2025年06月05日 18 点赞 0 评论 648 浏览

MMaDA（Multimodal Large Diffusion Language Models）是由普林斯顿大学、清华大学、北京大学和字节跳动联合开发的多模态扩散模型，支持跨文本推理、多模态理解和文本到图像生成等多种功能。其采用统一的扩散架构和模态不可知设计，结合混合长链推理微调策略与UniGRPO强化学习算法，提升跨模态任务性能。MMaDA在多项任务中表现优异，适用于内容创作、教育辅助、智能客

AI项目与工具 2025年06月11日 80 点赞 0 评论 648 浏览

Pollinations AI

Pollinations 是一个通过AI生成媒体内容的平台。平台可能提供多种类型的模板和工具，支持文本、图像、音频、视频等多媒体格式的创作。

3D&游戏 2025年06月05日 62 点赞 0 评论 648 浏览

MoCha

MoCha 是一款由 Meta 与滑铁卢大学联合开发的端到端对话角色视频生成模型，支持语音与文本驱动的角色动画生成，具备全身动作模拟与多角色对话交互能力。其核心技术包括扩散变压器架构和语音-视频窗口注意力机制，确保动画与语音精准同步。适用于虚拟主播、影视动画、教育内容及数字人客服等多个领域，提升了内容创作效率与表现力。

AI项目与工具 2025年06月12日 34 点赞 0 评论 648 浏览

Reve Image

Reve Image 是一款基于 AI 的图像生成工具，具备强大的视觉表现力与精准的提示理解能力。支持文生图和图生图模式，适用于广告设计、社交媒体内容创作、艺术创作及产品设计等多种场景。模型在色彩、光影和排版上优化显著，可生成高质量且富有设计感的图像。

AI项目与工具 2025年06月12日 44 点赞 0 评论 648 浏览

CogVideo

目前最大的通用领域文本生成视频预训练模型，含94亿参数。CogVideo将预训练文本到图像生成模型（CogView2）有效地利用到文本到视频生成模型，并使用了多帧率分层训练策略。

Ai平台模型 2025年06月05日 16 点赞 0 评论 648 浏览

生成

首页

生成

列表

默认

浏览次数

发布日期