生成 - 智狐AI导航

Yi

Yi-Coder是一款由零一万物开发的开源AI编程助手，支持52种主流编程语言，能够处理长达128K tokens的上下文。它在多个代码生成基准测试中表现优异，尤其在LiveCodeBench平台上的表现尤为突出。Yi-Coder在代码编辑和补全方面也有卓越的表现，适用于各种开发项目，帮助开发者提高工作效率。 ---

AI项目与工具 2025年06月12日 80 点赞 0 评论 642 浏览

SUPIR

SUPIR是一种创新的图像修复和画质增强方法，基于大规模生成模型StableDiffusion-XL（SDXL）和模型扩展技术。它通过深度学习和多模态方法实现低质量图像的高质量恢复，支持通过文本提示进行图像恢复的精细控制。SUPIR适用于多种应用场景，如老照片修复、模糊图像增强、噪点去除和色彩校正与增强。

AI项目与工具 2024年01月01日 88 点赞 0 评论 642 浏览

LCVD

LCVD是一种由四川大学开发的高保真肖像动画生成框架，支持光照可控的动态视频生成。它通过分离肖像的内在与外在特征，并结合多条件分类器自由引导机制，实现对光照和姿态的精细控制。LCVD在图像质量、视频一致性和光照真实感方面表现突出，适用于虚拟现实、视频会议、影视制作及内容创作等多个领域。

AI项目与工具 2025年06月12日 93 点赞 0 评论 642 浏览

Emu3

Emu3是一款由北京智源人工智能研究院开发的原生多模态世界模型，结合了多模态自回归技术和单一Transformer架构，能够在图像、视频和文本之间实现无缝转换。它不仅能够根据文本生成高质量图像，还能预测视频发展并理解图文内容，广泛应用于内容创作、广告营销、教育、娱乐等多个领域。

AI项目与工具 2025年06月12日 58 点赞 0 评论 642 浏览

BlockDance

BlockDance是由复旦大学与字节跳动联合开发的扩散模型加速技术，通过识别结构相似的时空特征（STSS）减少冗余计算，提升推理效率达25%-50%。结合强化学习的BlockDance-Ada模块实现动态资源分配，平衡速度与质量。适用于图像、视频生成及实时应用，支持多种模型，兼顾高效与高质，适用于资源受限环境。

AI项目与工具 2025年06月12日 38 点赞 0 评论 642 浏览

National Gallery Mixtape 是伦敦国家美术馆与 Google Arts & Culture 合作推出的 AI 音乐实验工具。用户可从 200 幅精选名画中选择最多 6 幅，AI 会分析画作的色彩、主题、情感和历史背景，生成匹配的音乐片段。用户可调整音量、顺序和叠加方式，并通过风格、乐器和心情标签定制音乐氛围。该工具基于谷歌 Gemini 模型，提供实时互动体验，适用于教育、艺

AI项目与工具 2025年06月11日 79 点赞 0 评论 642 浏览

Heck.Ai

一款基于GPT-4完全免费的多功能AI搜索工具，提供搜索与内容分析功能，包括翻译、文件分析和高质量总结等功能。

AI搜索问答 2025年06月05日 20 点赞 0 评论 642 浏览

MIDI

MIDI是一种基于多实例扩散模型的3D场景生成技术，能将单张2D图像快速转化为高保真度的360度3D场景。它通过智能分割、多实例同步扩散和注意力机制，实现高效的3D建模与细节优化。具有良好的泛化能力，适用于游戏开发、虚拟现实、室内设计及文物数字化等多个领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 641 浏览

MultiBooth

MultiBooth是一种由多所高校和研究机构联合开发的多概念图像生成工具，能够根据文本提示生成包含多个指定概念的高质量图像。其核心技术包括单概念学习和多概念整合，采用多模态编码器、自适应归一化和区域定制化模块，实现高效、精准的图像生成。支持插件式架构，具备良好的扩展性和灵活性，适用于创意设计、广告、教育、电商及科研等多个领域。

AI项目与工具 2025年06月12日 42 点赞 0 评论 641 浏览

OmniTalker

OmniTalker 是一款由阿里巴巴开发的实时多模态交互技术，支持文本、图像、音频和视频的同步处理，并能生成自然流畅的语音响应。其核心技术包括 Thinker-Talker 架构和 TMRoPE 时间对齐技术，实现音视频精准同步与高效流式处理。适用于智能语音助手、内容创作、教育、客服及工业质检等场景，具有高实时性与稳定性。

AI项目与工具 2025年06月12日 59 点赞 0 评论 641 浏览

生成

首页

生成

列表

默认

浏览次数

发布日期

Yi