多任务 - 智狐AI导航

Migician

Migician是一款由多所高校联合开发的多模态大语言模型，专为多图像定位任务设计。它基于大规模数据集MGrounding-630k，采用端到端架构和两阶段训练方法，支持跨图像精准定位与多任务处理。Migician适用于自动驾驶、安防监控、医疗影像等多个领域，具有高效的推理能力和灵活的输入方式。

AI项目与工具 2025年06月12日 90 点赞 0 评论 767 浏览

SynthLight

SynthLight是由耶鲁大学与Adobe Research联合开发的基于扩散模型的人像重照明工具，通过物理渲染引擎生成合成数据并结合多任务训练策略，实现高质量的光照效果生成。它能够根据环境光照图重新渲染人像，生成自然的高光、阴影和漫反射效果，并适用于摄影后期、虚拟场景、游戏开发及广告设计等多个领域，具备良好的泛化能力和实用性。

AI项目与工具 2025年06月12日 73 点赞 0 评论 765 浏览

ComflowySpace

Comflowy社区开箱即用的 Comfy UI 整合包一键安装，小白也能轻松上手。

Ai开源项目 2025年06月05日 25 点赞 0 评论 760 浏览

VPP

VPP（Video Prediction Policy）是清华大学与星动纪元联合开发的AIGC机器人模型，基于视频扩散模型实现未来场景预测与动作生成。支持高频预测与跨机器人本体学习，显著降低对真实数据的依赖。在复杂任务中表现出色，适用于家庭、工业、医疗、教育等多个领域。其开源特性推动了具身智能机器人技术的发展。

AI项目与工具 2025年06月11日 61 点赞 0 评论 743 浏览

UniVG

百度公司推出的视频生成模型，能够以文本和图像的任意组合作为输入条件进行视频生成。

Ai开源项目 2025年06月05日 22 点赞 0 评论 738 浏览

SongCreator

SongCreator是一款基于AI技术的音乐生成工具，由清华大学深圳国际研究生院与香港中文大学等机构联合开发。它采用双序列语言模型（DSLM）和注意力掩码策略，支持歌词到歌曲、歌词到声乐、伴奏到歌曲等多种音乐生成任务，并允许用户灵活调整生成内容的声学特性。SongCreator适用于音乐制作、教育、娱乐、内容创作等多个领域，为用户提供高效便捷的音乐解决方案。

AI项目与工具 2025年06月12日 88 点赞 0 评论 728 浏览

Remio.ai

一个 AI驱动的个人知识中心，通过自动捕获浏览的网页内容、解析本地文件并整合个人笔记，生成个性化的知识库。

Ai办公效率 2025年06月05日 79 点赞 0 评论 724 浏览

Delta

Delta-CoMe是一种由清华大学NLP实验室牵头研发的增量压缩算法，它通过低秩分解与混合精度量化技术，显著减少了大型语言模型的存储和内存需求，同时保持了模型性能几乎无损。该工具支持多任务处理、推理加速，并广泛适用于云计算、边缘计算及学术研究等领域，特别擅长应对数学、代码和多模态任务。

AI项目与工具 2025年06月12日 58 点赞 0 评论 717 浏览

HybridRAG

HybridRAG是一种结合了检索增强生成模型的混合架构，通过检索系统和生成模型的协同工作，生成更准确和丰富的输出。其主要功能包括信息检索、上下文理解、知识融合和生成能力。HybridRAG适用于多种自然语言处理任务，如问答系统、文本摘要和对话生成，能够利用大量外部知识提高生成内容的质量和相关性。

AI项目与工具 2025年06月12日 54 点赞 0 评论 707 浏览

ACE++ 是阿里巴巴通义实验室推出的图像生成与编辑工具，支持指令化操作和上下文感知内容填充。其包含多个专用模型，如 ACE++ Portrait 用于人物肖像生成，ACE++ Subject 保证主题一致性，ACE++ LocalEditing 实现局部图像修改。支持虚拟试穿、风格化编辑、照片修复等多种任务，适用于艺术创作、广告设计及影视制作等领域。技术上采用改进的 LCU++ 架构与两阶段训练

AI项目与工具 2025年06月12日 56 点赞 0 评论 702 浏览

多任务

首页

多任务

列表

默认

浏览次数

发布日期