模型 - 智狐AI导航

SigLIP 2

SigLIP 2 是 Google DeepMind 开发的多语言视觉-语言模型，具有强大的图像与文本对齐能力。它支持多种语言输入，具备零样本分类、图像-文本检索等功能，并通过 Sigmoid 损失函数和自监督学习技术提升训练效率与模型性能。其支持多种分辨率的变体，适用于文档理解、视觉问答及开放词汇任务。该模型基于 Vision Transformer 架构，具备良好的兼容性。

AI项目与工具 2025年06月12日 94 点赞 0 评论 905 浏览

Kiss3DGen

Kiss3DGen是一款基于2D扩散模型的3D资产生成框架，通过“3D Bundle Image”结构实现多视角图像与法线图的融合，从而高效生成和编辑3D模型。它支持文本与图像输入，具备3D编辑、网格优化和纹理增强等功能，适用于游戏开发、影视制作、VR/AR、数字孪生及教育等多个领域。

AI项目与工具 2025年06月12日 86 点赞 0 评论 905 浏览

探一下

探一下是一款依托于多模态大模型技术的AI视觉搜索工具，用户可通过其摄像头识别花草、宠物、潮玩等物体，获取旅游讲解、商品药品详情等信息，同时具备趣味解读图片的功能，支持文字翻译与场景触发滤镜，适用于多种生活场景。 ---

AI项目与工具 2025年06月12日 47 点赞 0 评论 905 浏览

Ditto

Ditto是一款基于Flask框架的Web应用程序生成工具，通过自然语言输入和大型语言模型（LLM）实现自动化代码生成，支持模块化结构和无代码操作，适合快速原型开发、教育学习及非技术人员使用。其核心功能包括自然语言解析、代码自动生成、模块化管理以及环境变量配置等。

AI项目与工具 2025年06月12日 99 点赞 0 评论 906 浏览

LightLab

LightLab是一款基于扩散模型的图像光源控制工具，支持对图像中的光源强度、颜色、环境光以及虚拟光源进行精细调整。通过结合真实照片与合成图像训练，该工具能生成逼真的光照效果，如阴影和反射。其交互式界面使用户能够直观地进行光照编辑，适用于摄影后期、影视特效、室内设计、游戏开发和广告制作等多个领域。

AI项目与工具 2025年06月11日 34 点赞 0 评论 906 浏览

Psi R0

Psi R0是一款基于强化学习的端到端具身模型，支持双灵巧手协同操作，具备多技能串联混训和跨物品、跨场景的泛化能力。通过仿真数据训练及技能优化，Psi R0能在复杂环境中完成长程任务，同时具备自主切换技能的功能，确保高成功率和鲁棒性。主要应用场景包括电商商品打包、工厂产线组装、服务业拣货打包及家居环境清洁整理。

AI项目与工具 2025年06月12日 18 点赞 0 评论 906 浏览

TrajectoryCrafter

TrajectoryCrafter是一种基于双流条件视频扩散模型的单目视频相机轨迹重定向工具，支持用户自定义相机运动路径并生成高质量、4D一致的视频内容。其核心技术包括解耦视图变换与内容生成、动态点云渲染以及混合数据集训练策略，具备强大的场景泛化能力。适用于沉浸式娱乐、视频创作、智能会议、自动驾驶及教育等多个领域。

AI项目与工具 2025年06月12日 76 点赞 0 评论 907 浏览

爱写作

只需简单输入，即可转化为结构严谨，富有逻辑性的长篇文章。无论是深入学术论文，还是专业的职场报告，或是生动的生活故事，爱写作都能提供专业支持。

AI写作对话 2025年06月05日 16 点赞 0 评论 907 浏览

书生·万象InternVL 2.5

书生·万象InternVL 2.5是一款开源多模态大型语言模型，基于InternVL 2.0升级而来。它涵盖了从1B到78B不同规模的模型，支持多种应用场景，包括图像和视频分析、视觉问答、文档理解和信息检索等。InternVL 2.5在多模态理解基准上表现优异，性能超越部分商业模型，并通过链式思考技术提升多模态推理能力。

AI项目与工具 2025年06月12日 100 点赞 0 评论 907 浏览

封神榜

封神榜-IDEA研究院是一套致力于中文认知智能的研究项目，它通过一系列先进的语言模型和多模态模型，推动了中文自然语言处理技术的发展。

Ai平台模型 2026年07月28日 0 点赞 0 评论 907 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期