模型

Objaverse

Objaverse 是一个为3D领域提供巨大资源的数据库,它不仅支持 AI 模型的训练和3D内容的生成,还与流行的3D编辑软件 Blender 兼容。

Insert Anything

Insert Anything是由多所高校联合开发的图像插入框架,支持多种场景下的对象无缝融合,如艺术创作、虚拟试穿和影视特效等。基于大规模数据集训练,具备高分辨率输出与语义一致性保障。用户可通过掩码或文本指令实现精准控制,适用于创意设计与数字内容生成领域。

书生·筑梦2.0

它不仅提供了更大的创作灵活性,还通过高质量的视频输出满足了用户对画质和帧率的高需求。Vchitect 2.0及其配套的VEnhancer框架,为视频内容创作者提供了强大的工具,以创造更加生...

星环无涯•金融大模型

星环无涯•金融大模型是一个综合性的金融投研工具,它通过先进的数据分析和自然语言处理技术,为专业投资者和机构提供了深入的市场分析、策略构建和投资决策支持。

CodeFuse

CodeFuse-muAgent是由蚂蚁集团CodeFuse团队开发的一款多智能体框架,通过知识图谱引擎驱动智能体的编排和协作,简化复杂工作流程的自动化。它支持多种智能体类型,包括问答、工具使用和代码执行,并具备通信、记忆管理和自定义模型支持等功能,促进智能体间的高效协作。应用场景广泛,涵盖自动化办公流程、客户服务自动化、智能监控和安全、个性化推荐系统以及教育和培训等多个领域。

FlagevalMM

FlagEvalMM是一个由北京智源人工智能研究院开发的开源多模态模型评测框架,专注于评估处理文本、图像、视频等多模态任务的模型性能。它支持多种任务和指标,采用解耦评测与推理的设计,提供统一的评测流程,集成丰富模型库并兼容多种后端引擎。该工具适用于学术研究、工业应用、模型开发、教育领域及内容创作等多个场景。

Speech

Speech-02 是 MiniMax 推出的先进文本到语音模型,支持零样本语音克隆和高质量语音合成,具备多语言支持和情感控制功能。采用自回归 Transformer 和 Flow-VAE 架构提升语音自然度和相似度,适用于配音、有声读物、智能助手等多种场景。提供 HD 和 Turbo 两个版本,满足不同性能需求。

MAGI

MAGI-1是一款由Sand AI开发的开源视频生成大模型,采用自回归架构,支持高效、高质量的视频生成,具备高分辨率输出、无限扩展能力和可控生成特性。适用于内容创作、影视制作、游戏开发等多个领域,技术上融合了自回归去噪、Transformer VAE、扩散模型等创新方法,提升生成效率与稳定性。

Resume Matcher

Resume Matcher 是一个免费的开源项目,专门为开发者设计,以简化简历创建过程并加速求职搜索。

Delta

Delta-CoMe是一种由清华大学NLP实验室牵头研发的增量压缩算法,它通过低秩分解与混合精度量化技术,显著减少了大型语言模型的存储和内存需求,同时保持了模型性能几乎无损。该工具支持多任务处理、推理加速,并广泛适用于云计算、边缘计算及学术研究等领域,特别擅长应对数学、代码和多模态任务。