模型 - 智狐AI导航

Link·AI

Link·AI 是一款面向企业和个人的 AI 智能体开发平台，集成了多模态大模型、RAG 知识库和插件，支持零代码快速创建具备企业私有知识和高级任务执行能力的智能体。用户能够将 AI 应用轻松接入主流平台，广泛应用于客户服务、营销自动化、企业协作及个人助理等场景，助力提升运营效率和用户体验。

AI项目与工具 2025年06月12日 78 点赞 0 评论 721 浏览

DiffEditor

DiffEditor是由北京大学深圳研究生院与腾讯PCG联合研发的图像编辑工具，基于扩散模型，结合图像与文本提示，支持细粒度对象移动、尺寸调整、内容拖动及跨图像编辑。采用区域随机微分方程（Regional SDE）和时间旅行策略，提升编辑准确性和灵活性。无需额外训练即可实现高效图像处理，适用于创意设计、人像修复和风景优化等场景。

AI项目与工具 2025年06月12日 76 点赞 0 评论 721 浏览

neural frames

Neural Frames 是一款基于人工智能的文本转视频工具，能够将文本描述转换为动态视频内容，支持多种神经网络模型的选择与自定义训练。它具备音频反应动画、帧级编辑控制和高分辨率输出等功能，适用于音乐视频制作、数字艺术创作、广告设计、教育视频开发等多个领域，为创意工作者提供高效且灵活的解决方案。

AI项目与工具 2025年06月12日 33 点赞 0 评论 721 浏览

EmaFusion

EmaFusion 是一种基于多模型融合的人工智能技术，可动态结合多种语言模型，智能选择最优组合以提升任务处理的准确性与效率。其自优化系统能根据任务复杂度和预算自动调整模型配置，并具备故障转移机制，确保系统稳定性。适用于合同分析、客户服务、数据分析、内容生成等多种企业级场景，兼顾性能与成本效益。

AI项目与工具 2025年06月11日 52 点赞 0 评论 722 浏览

Topaz Photo AI

Topaz Photo AI 是一款使用人工智能（AI）来提高照片和视频质量的软件。它可以通过先进的技术锐化、去除噪点来提高图像的分辨率。

Ai图片处理 2025年06月05日 12 点赞 0 评论 722 浏览

NVLM

NVLM是NVIDIA研发的多模态大型语言模型，涵盖图像理解、语言理解、跨模态融合、图像描述生成、视觉推理及多模态翻译等功能。它具备多种架构（NVLM-D、NVLM-X、NVLM-H），并采用动态高分辨率输入、1-D平铺标签设计及多模态预训练与微调技术，广泛应用于图像描述、视觉问答、文档理解、多模态搜索及辅助驾驶等领域。

AI项目与工具 2025年06月12日 57 点赞 0 评论 722 浏览

OmniHuman

OmniHuman是字节跳动推出的多模态人类视频生成框架，基于单张图像和运动信号生成高逼真视频。支持音频、姿势及组合驱动，适用于多种图像比例和风格。采用混合训练策略和扩散变换器架构，提升生成效果与稳定性，广泛应用于影视、游戏、教育、广告等领域。

AI项目与工具 2025年06月12日 43 点赞 0 评论 722 浏览

VSI

VSI-Bench是一种用于评估多模态大型语言模型（MLLMs）视觉空间智能的基准测试工具，包含超过5000个问题-答案对，覆盖多种真实室内场景视频。其任务类型包括配置型任务、测量估计和时空任务，可全面评估模型的空间认知、理解和记忆能力，并提供标准化的测试集用于模型性能对比。 ---

AI项目与工具 2025年06月12日 10 点赞 0 评论 723 浏览

心流AI助手

一款智能搜索助手，AI助手集成了先进的人工智能技术，为用户提供了一个强大的知识管理和信息处理平台。适用于科研人员、高校教师、学生和职场人士。

Ai办公效率 2025年06月05日 29 点赞 0 评论 723 浏览

Amodal3R

Amodal3R 是一种基于条件的 3D 生成模型，能够从部分遮挡的 2D 图像中重建完整的 3D 模型。通过引入掩码加权多头交叉注意力机制和遮挡感知注意力层，提升了遮挡场景下的重建精度。该模型仅使用合成数据训练，却能在真实场景中表现出色，具有较强的泛化能力。广泛应用于 AR/VR、机器人视觉、自动驾驶及 3D 资产创建等领域。

AI项目与工具 2025年06月12日 39 点赞 0 评论 723 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期