模型 - 智狐AI导航

DianJin

DianJin-R1是由阿里云与苏州大学联合开发的金融领域推理增强型大模型，基于CFLUE、FinQA和CCC等高质量数据集训练，通过监督微调和强化学习优化，提升金融任务的推理能力。模型支持结构化输出，具备高效推理与低计算成本优势，在合规检查、金融问答、考试辅助等领域表现优异，适用于多种金融应用场景。

AI项目与工具 2025年06月11日 68 点赞 0 评论 692 浏览

Proxy Lite

Proxy Lite是一款开源的轻量级视觉语言模型，具有30亿参数，支持自动化网页操作。它通过“观察-思考-工具调用”机制，实现网页交互、数据抓取、表单填写等功能，适用于自动化测试、数据提取和智能任务辅助等场景。该工具资源占用低，可在消费级GPU上高效运行，适合开发者快速部署和使用。

AI项目与工具 2025年06月12日 53 点赞 0 评论 692 浏览

冒泡鸭AI

一个基于多模态大模型技术的AI聊天机器人和AI智能体平台，冒泡鸭AI内部载有众多由大模型技术驱动的智能对话实体，这些"智能体"不仅致力于为用户解答疑惑、激发创意，还能深度聊天，旨在与用户建立情感纽带。

AI写作对话 2025年06月05日 99 点赞 0 评论 691 浏览

InstructMove

InstructMove是由东京大学与Adobe合作开发的图像编辑模型，基于视频帧对变化学习如何根据指令进行图像操作。它能够执行非刚性编辑、视角调整和元素重排等任务，同时支持精确的局部编辑。该模型采用真实视频数据训练，提升编辑自然性与真实性，适用于影视、广告、设计等多个领域。其技术基于多模态语言模型和扩散模型，结合掩码和ControlNet等控制机制，实现灵活高效的图像编辑。

AI项目与工具 2025年06月12日 21 点赞 0 评论 691 浏览

VideoAnydoor

VideoAnydoor是一款由多所高校与研究机构联合开发的视频对象插入系统，基于文本到视频的扩散模型，支持高保真对象插入与精确运动控制。其核心模块包括ID提取器和像素变形器，能实现对象的自然融合与细节保留。该工具适用于影视特效、虚拟试穿、虚拟旅游、教育等多个领域，具备良好的通用性和扩展性。

AI项目与工具 2025年06月12日 61 点赞 0 评论 691 浏览

SongCreator

SongCreator是一款基于AI技术的音乐生成工具，由清华大学深圳国际研究生院与香港中文大学等机构联合开发。它采用双序列语言模型（DSLM）和注意力掩码策略，支持歌词到歌曲、歌词到声乐、伴奏到歌曲等多种音乐生成任务，并允许用户灵活调整生成内容的声学特性。SongCreator适用于音乐制作、教育、娱乐、内容创作等多个领域，为用户提供高效便捷的音乐解决方案。

AI项目与工具 2025年06月12日 88 点赞 0 评论 691 浏览

OOTDiffusion

OOTDiffusion是一款开源AI虚拟试衣工具，支持根据用户上传的模特和服装图片生成自然贴合的试穿效果，具有智能适配、多种试穿模式及快速生成等特点。它通过预训练扩散模型、Outfitting UNet、Outfitting Fusion等技术实现高质量服装图像生成，适用于电商、设计、定制服务等多个领域。

AI项目与工具 2025年06月12日 81 点赞 0 评论 691 浏览

T2I

T2I-R1是由香港中文大学与上海AI Lab联合开发的文本到图像生成模型，采用双层推理机制（语义级和 Token 级 CoT），实现高质量图像生成与复杂场景理解。其基于 BiCoT-GRPO 强化学习框架，结合多专家奖励模型，提升生成图像的多样性和稳定性。适用于创意设计、内容制作、教育辅助等多个领域，具有广泛的应用潜力。

AI项目与工具 2025年06月11日 63 点赞 0 评论 690 浏览

Unique3D

Unique3D是一款由清华大学团队开发的开源框架，专注于单张图像到3D模型的转换。它利用多视图扩散模型和法线扩散模型，结合多级上采样策略和ISOMER算法，能够在短时间内生成高保真度且纹理丰富的3D网格模型。Unique3D能够从单个2D图像生成3D网格模型、多个正交视图图像和法线贴图，并通过多级上采样过程提高图像分辨率，最终实现颜色和几何细节的高度整合。

AI项目与工具 2025年06月12日 28 点赞 0 评论 690 浏览

Diffuse to Choose

一种基于扩散的图像修复模型，主要用于虚拟试穿场景。它能够在修复图像时保留参考物品的细节，适用于在线购物等虚拟试穿场景中的图像修复任务。

Ai开源项目 2025年06月05日 74 点赞 0 评论 690 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期