生成式 - 智狐AI导航

Aether

Aether是由上海AI Lab开发的生成式世界模型，基于合成数据训练，具备4D动态重建、动作条件视频预测和目标导向视觉规划等核心功能。它通过三维时空建模和多任务协同优化，实现对环境的精准感知与智能决策，具有出色的零样本泛化能力，适用于机器人导航、自动驾驶、虚拟现实等多个领域。

AI项目与工具 2025年06月11日 25 点赞 0 评论 766 浏览

SimpleAR

SimpleAR是一款由复旦大学与字节跳动联合研发的纯自回归图像生成模型，采用简洁架构实现高质量图像生成。其通过“预训练-有监督微调-强化学习”三阶段训练方法，提升文本跟随能力与生成效果。支持文本到图像及多模态融合生成，兼容加速技术，推理速度快。适用于创意设计、虚拟场景构建、多模态翻译、AR/VR等多个领域。

AI项目与工具 2025年06月11日 76 点赞 0 评论 693 浏览

Midlibrary

Midlibrary是为Midjourney用户提供提示词资源的平台，收录了5505种艺术风格、技法和关键词，涵盖风格、特征和类别三大模块，并提供绘画指南。用户可通过标签和搜索功能快速获取创作灵感，提升AI图像生成效率，适用于建筑、时尚、插画、游戏设计等多个领域。

AI项目与工具 2025年06月12日 16 点赞 0 评论 642 浏览

Runway Gen

Runway Gen-4 是一款由 Runway 公司推出的高保真 AI 视频生成模型，能够跨场景保持人物、物体和环境的一致性，无需额外训练。用户仅需提供一张参考图和文字指令，即可生成具有真实物理效果和高质量视觉风格的视频内容。支持多种应用场景，如影视制作、动画创作、音乐视频、游戏开发和广告营销，有效提升创作效率并降低成本。

AI项目与工具 2025年06月12日 61 点赞 0 评论 637 浏览

InfiniteYou

InfiniteYou 是由字节跳动推出的基于扩散变换器的身份保持图像生成框架，通过 InfuseNet 注入身份特征，确保生成图像与输入图像的高度相似。结合多阶段训练策略，提升文本与图像对齐、图像质量和美学效果。支持插件化设计，兼容多种工具，适用于社交媒体、影视制作、广告营销等多个领域。

AI项目与工具 2025年06月12日 79 点赞 0 评论 489 浏览

Stable Virtual Camera

Stable Virtual Camera 是 Stability AI 推出的 AI 工具，能够将 2D 图像转换为具有真实深度和透视感的 3D 视频。用户可通过自定义相机轨迹生成多种宽高比的视频，支持最长 1000 帧的高质量输出。其核心技术包括生成式 AI、神经渲染和多视图一致性优化，确保视频在不同视角间过渡自然且保持 3D 一致性。适用于广告、内容创作及教育等多个领域。

AI项目与工具 2025年06月12日 61 点赞 0 评论 600 浏览