架构 - 智狐AI导航

豆包AI视频模型

豆包AI视频模型包括PixelDance和Seaweed两款工具，分别基于DiT和Transformer架构。PixelDance擅长处理复杂指令和多主体互动，适合制作情节丰富的短片；Seaweed支持多分辨率输出，生成高质量、高逼真的视频，适用于商业领域。两者均提供多样化的风格选择和输出格式，满足不同场景需求。 ---

AI项目与工具 2025年06月12日 45 点赞 0 评论 666 浏览

Mochi 1

Mochi 1 是一款基于开源架构的 AI 视频生成工具，具有高保真度和强大的提示遵循能力。它采用 Genmo 自研的非对称扩散变压器（AsymmDiT）架构，结合实时视频生成技术和流式架构，能够高效生成高质量的视频内容。Mochi 1 支持多种应用场景，包括视频内容创作、教育、娱乐、广告和社交媒体等，适用于个人和企业用户。

AI项目与工具 2025年06月12日 27 点赞 0 评论 664 浏览

Imagine Yourself

Imagine Yourself是一款由Meta公司开发的个性化AI图像生成模型，无需针对特定用户进行调整即可生成高质量、多样化的图像。该模型采用了合成配对数据生成和并行注意力架构，提升了图像质量和文本对齐的准确性。主要功能包括无需特定微调、生成合成配对数据、并行注意力架构以及多阶段微调过程。应用场景广泛，包括社交媒体个性化、虚拟试衣间、游戏和虚拟现实、广告和营销以及艺术创作辅助。

AI项目与工具 2025年06月12日 15 点赞 0 评论 664 浏览

LLM Course

一个关于LLMs课程的集合，包含学习路线图和Colab笔记本，帮助用户从基础到高级逐步掌握LLMs的知识和应用。

Ai学习资源 2025年06月05日 85 点赞 0 评论 656 浏览

Xmind

Xmind是一款非常实用的商业思维导图软件，应用全球最先进的Eclipse RCP 软件架构，全力打造易用、高效的可视化思维软件。致力于使用先进的软件技术帮助用户真正意义上提高生产率。

思维导图 2025年06月05日 64 点赞 0 评论 653 浏览

Veo是Google DeepMind开发的一款视频生成模型，用户可以通过文本、图像或视频提示来指导其生成所需的视频内容。Veo具备深入的自然语言理解能力，能够准确解析用户的文本提示，生成高质量、高分辨率的视频。其主要功能包括高分辨率视频输出、自然语言处理、风格适应性、创意控制与定制、遮罩编辑功能、参考图像与风格应用、视频片段的剪辑与扩展以及视觉连贯性。Veo技术目前仍处于实验阶段，但已在电影制作

AI项目与工具 2024年01月01日 34 点赞 0 评论 650 浏览

xLAM

xLAM 是 Salesforce 开源的一款大型语言模型，专为功能调用任务设计。该模型具备多语言支持、预训练模型、迁移学习、自然语言处理等主要功能，并基于 Transformer 架构实现。它在多个基准测试中表现出色，适用于自动化任务、模板共享、插件开发和教育等多个应用场景。

AI项目与工具 2025年06月12日 55 点赞 0 评论 648 浏览

SWAPP

SWAPP 是建筑行业中的一个突破性工具，它通过 AI 技术帮助建筑团队提高工作效率和文档质量。通过个性化的规则和算法，SWAPP 能够自动化地创建和注释建筑文档，同时保持对数据安全...

创作工具 2026年06月29日 0 点赞 0 评论 645 浏览

CogSound

CogSound是一款基于AI的音效生成工具，能够为无声视频添加与内容匹配的高质量音效，涵盖多种复杂场景。该工具通过先进的音视频特征匹配技术和优化的生成算法，提升了视频的沉浸感和真实感，广泛应用于视频创作、广告制作及影视后期等多个领域。

AI项目与工具 2025年06月12日 12 点赞 0 评论 644 浏览

EXAONE 3.5

EXAONE 3.5是一款由LG AI研究院开发的开源AI模型，包含多种参数规模版本，专长于长文本处理和复杂场景下的推理任务。其核心技术包括检索增强生成与多步推理，可显著减少错误信息并提升准确性。此外，EXAONE 3.5还具备双语支持及强大的上下文理解能力，适用于聊天机器人、语言翻译、内容创作等多个领域。

AI项目与工具 2025年06月12日 14 点赞 0 评论 642 浏览

架构

首页

架构

列表

默认

浏览次数

发布日期