模型 - 智狐AI导航

BuboGPT | 字节大模型

BuboGPT是由字节跳动开发的大型语言模型,能够处理多模态输入,包括文本、图像和音频,并具有将其响应与视觉对象相对应的独特能力。

Ai平台模型 2025年06月05日 99 点赞 0 评论 443 浏览

MVGenMaster

MVGenMaster是一款基于多视图扩散模型的工具，利用增强的3D先验技术实现新视角合成任务。它可以从单一图像生成多达100个新视图，具有高度的灵活性和泛化能力。模型结合了度量深度、相机姿态扭曲以及全注意力机制等技术，支持高效的前向传播过程，同时兼容大规模数据集。MVGenMaster在视频游戏、电影特效、虚拟现实、3D建模及建筑可视化等领域具有广泛应用前景。

AI项目与工具 2025年06月12日 65 点赞 0 评论 444 浏览

Hyper

Hyper-SD是由字节跳动研究人员开发的高效图像合成框架，通过轨迹分割一致性蒸馏（TSCD）、人类反馈学习（ReFL）和分数蒸馏等技术，显著降低了扩散模型在多步推理过程中的计算成本。该框架在保持高图像质量的同时，大幅减少了推理步骤，实现了快速生成高分辨率图像，推动了生成式AI技术的发展。

AI项目与工具 2025年06月12日 73 点赞 0 评论 445 浏览

万兴天幕多媒体大模型

一个涵盖了视觉、音频、语言等多模态AI生成和优化能力的多媒体大模型，万兴天幕多媒体大模型核心功能包括一键成片、AI美术设计、文生音乐、音频增强、音效分析、多语言对话等。

Ai平台模型 2025年06月05日 40 点赞 0 评论 445 浏览

Mobile

Mobile-Agent 是一种具备移动能力的智能代理系统，能够跨设备执行任务并优化资源使用。基于多模态大语言模型和视觉感知技术，支持自动操作、自我规划与反思，适用于多应用协同、跨平台操作及纯视觉交互。其技术架构包含多个智能体协作机制，提升了移动设备任务处理的效率与灵活性。

AI项目与工具 2025年06月12日 18 点赞 0 评论 447 浏览

SpeciesNet

SpeciesNet 是 Google 开发的 AI 模型，用于识别相机陷阱图像中的动物物种，支持超过 2000 种标签分类，涵盖动物、分类群及非生物对象。基于 6500 万张图像训练，具备高效数据处理和跨场景识别能力，适用于野生动物监测、生物多样性研究及生态保护。模型开源，可在 GitHub 获取，支持开发人员部署与优化。

AI项目与工具 2025年06月12日 39 点赞 0 评论 447 浏览

DELIFT

DELIFT是一种针对大型语言模型微调的数据优化算法，通过成对效用度量与次模优化技术，有效减少数据量需求，同时维持甚至提升模型性能。它适用于指令调优、任务特定微调及持续微调三个关键阶段，并具备高计算效率和广泛适用性，广泛应用于数据科学家、研究人员及教育工作者等领域。

AI项目与工具 2025年06月12日 51 点赞 0 评论 447 浏览

Resume Matcher

Resume Matcher 是一个免费的开源项目，专门为开发者设计，以简化简历创建过程并加速求职搜索。

创作工具 1970年01月01日 0 点赞 0 评论 447 浏览

Pirate Diffusion

Pirate Diffusion 是一个提供基于云的 AI 图像生成器网站。它允许用户使用各种模型和样式创建逼真和艺术的图像。

Ai绘画生成 2025年06月05日 21 点赞 0 评论 448 浏览

OpenMath-Nemotron是由英伟达推出的一系列开源数学推理模型，专为解决复杂数学问题设计，涵盖从基础到奥林匹克级别的题目。其基于大规模数据集OpenMathReasoning训练，具备长推理、多模式推理和工具集成推理能力。模型支持多种应用场景，包括数学教育、竞赛训练、学术研究和工业应用。项目提供GitHub、HuggingFace和arXiv等资源，适用于需要高精度数学推理的AI系统开发

AI项目与工具 2025年06月11日 56 点赞 0 评论 448 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期