框架 - 智狐AI导航

Animate Anyone

Animate Anyone是一款由阿里巴巴智能计算研究院开发的开源框架，旨在将静态图像中的角色或人物动态化。它采用扩散模型，结合ReferenceNet、Pose Guider姿态引导器和时序生成模块等技术，确保输出的动态视频具有高度一致性和稳定性。该框架支持多种应用，包括角色动态化、时尚视频合成及人类舞蹈生成，用户可通过GitHub或Hugging Face社区轻松体验。

AI项目与工具 2025年06月12日 19 点赞 0 评论 840 浏览

MagicVideo

MagicVideo-V2是一款由字节跳动公司团队开发的AI视频生成模型和框架。该模型通过集成文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块，实现了从文本到高保真视频的转换。生成的视频不仅具有高分辨率，而且在视觉质量和运动流畅度方面表现出色，为用户提供卓越的观看体验。

AI项目与工具 2024年01月01日 56 点赞 0 评论 833 浏览

OThink

OThink-MR1是由OPPO研究院与香港科技大学（广州）联合研发的多模态语言模型优化框架，基于动态KL散度策略（GRPO-D）和奖励模型，提升模型在视觉计数、几何推理等任务中的泛化与推理能力。其具备跨任务迁移能力和动态平衡探索与利用机制，适用于智能视觉问答、图像描述生成、内容审核等多个领域，具有广阔的应用前景。

AI项目与工具 2025年06月12日 21 点赞 0 评论 824 浏览

Motion Dreamer

Motion Dreamer是由香港科技大学（广州）研发的视频生成框架，采用两阶段架构生成物理合理的视频内容。通过引入“实例流”实现从稀疏到密集的运动控制，支持用户以少量提示生成时间连贯的视频。其随机掩码训练策略增强了模型的推理能力与泛化性能，已在多个数据集上验证其优越性。适用于视频创作、动画制作、VR/AR及自动驾驶等多个领域。

AI项目与工具 2025年06月12日 12 点赞 0 评论 820 浏览

MiniCPM 4.0

MiniCPM 4.0是面壁智能推出的高效端侧大模型，包含8B和0.5B两种参数规模。其采用创新稀疏架构和三值量化技术，实现模型体积缩小90%并保持高性能。自研CPM.cu推理框架在极限场景下可提升220倍速度，支持多种开源框架部署，并适配主流芯片。具备高效双频换挡机制、多平台适配和多种版本选择，适用于智能辅导、医疗辅助、客服、游戏剧情生成等场景。

AI项目与工具 2025年06月11日 59 点赞 0 评论 817 浏览

DeepSeek百宝箱

DeepSeek百宝箱是DeepSeek官方维护的GitHub项目，集成了多种支持DeepSeek API的工具和应用，涵盖聊天、知识管理、开发等多个领域。提供开箱即用、详实文档、本地化支持及多平台兼容性，助力开发者高效使用语言模型，提升工作效率。支持模型训练、部署、监控全流程，具备低代码配置、智能上下文感知、毫秒级响应等特性，适用于办公、编程、内容创作等多种场景。

AI项目与工具 2025年06月12日 45 点赞 0 评论 810 浏览

DemoFusion是一个技术框架，旨在低成本生成高分辨率图像。该框架通过扩展现有的开源生成人工智能模型（如Stable Diffusion），使得这些模型能够在不进行额外训练和不产生过高内存需求的情况下，将模糊的低分辨率图像转化为高清晰度图像。DemoFusion采用渐进式增强、跳跃残差和扩张采样机制，确保高分辨率图像生成的同时，保持图像的全局语义一致性和细节质量。适用于艺术创作、游戏开发、电影

AI项目与工具 2024年01月01日 29 点赞 0 评论 797 浏览

UNO

UNO是字节跳动推出的AI图像生成框架，支持单主体和多主体图像生成，解决多主体一致性难题。采用扩散变换器和渐进式跨模态对齐技术，结合通用旋转位置嵌入（UnoPE），实现高一致性与可控性。适用于虚拟试穿、产品设计、创意设计等多个领域，具备强大泛化能力，已开源并提供完整技术文档。

AI项目与工具 2025年06月11日 23 点赞 0 评论 797 浏览

Company Research Agent

Company Research Agent是一款基于多智能体框架的公司研究工具，支持一键生成全面的公司研究报告。它从公司网站、新闻文章、财务报告和行业分析等多源数据中收集信息，并利用Gemini 2.0 Flash和GPT-4.1-mini模型进行高语境研究综合与精确报告格式化。该工具具备AI内容过滤功能，确保信息的相关性和准确性，并通过WebSocket实现实时进度更新，提升研究效率和用户体验

AI项目与工具 2025年06月11日 78 点赞 0 评论 790 浏览

GRUtopia 2.0

GRUtopia 2.0是上海人工智能实验室推出的通用具身智能仿真平台，提供模块化框架、场景自动生成与高效数据采集功能。用户可使用“三行代码”快速定义任务，平台内置百万级标准化物体资产，支持复杂场景的一键生成。同时具备大规模3D场景数据集、AI驱动的NPC系统及基准测试平台，适用于机器人训练、社交互动、导航与操作等任务，推动具身智能从仿真走向现实。

AI项目与工具 2025年06月12日 16 点赞 0 评论 787 浏览

框架

首页

框架

列表

默认

浏览次数

发布日期