模型 - 智狐AI导航

Hunyuan3D 2.0

Hunyuan3D 2.0是腾讯推出的3D资产生成系统，支持从文本和图像生成高分辨率3D模型。系统采用两阶段生成流程，包含几何生成与纹理合成两个核心模块，具备高精度、高质量输出能力。支持多平台使用，涵盖游戏开发、UGC创作、电商、工业设计等多个应用场景，并提供多个开源模型供研究与开发使用。

AI项目与工具 2025年06月12日 89 点赞 0 评论 684 浏览

Embodied Reasoner

Embodied Reasoner是由多家科研机构联合开发的具身交互推理模型，通过视觉搜索、推理与行动协同完成复杂任务。采用模仿学习、自我探索和自我修正三阶段训练方法，生成多样化思考过程，提升任务规划效率。在长时序任务中表现优异，减少重复搜索和逻辑错误。适用于智能家居、仓储物流、医疗辅助等多个场景，具备多模态交互和强推理能力。

AI项目与工具 2025年06月11日 88 点赞 0 评论 685 浏览

Index

Index-AniSora是由哔哩哔哩开发的动漫视频生成模型，支持多种动画风格的生成，涵盖番剧、国创、VTuber等内容。其核心技术包括扩散模型、时空掩码模块和Transformer架构，具备图像到视频生成、帧插值、局部引导等能力。模型提供高质量数据集，适用于动画制作、创意验证、教育及营销等多个领域。

AI项目与工具 2025年06月11日 32 点赞 0 评论 685 浏览

Pix2Gif

Pix2Gif是一个由微软研究院开发的基于运动引导的扩散模型，能够将静态图像转换成动态的GIF动画或视频。该模型通过运动引导的扩散过程实现图像到GIF的生成，并利用文本描述和运动幅度作为输入。Pix2Gif还引入了感知损失机制，确保生成的GIF帧在视觉上与原始图像保持一致性和连贯性。

AI项目与工具 2024年01月01日 30 点赞 0 评论 685 浏览

Orpheus TTS

Orpheus TTS 是一款基于 Llama-3b 架构的开源文本到语音系统，支持自然、富有情感的语音生成。具备零样本语音克隆能力，无需预训练即可模仿特定语音，延迟低至 200 毫秒，适合实时应用。支持多种语音风格和情感控制，适用于有声读物、虚拟助手、游戏、教育等多个领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 685 浏览

Lobe

Lobe通过一个免费、易于使用...

Ai平台模型 1970年01月01日 0 点赞 0 评论 686 浏览

MathGPT

MathGPT，是国内首个专为数学打造的大模型。仅需要通过文字或图片上传数学题，即可得到对话式的解答反馈。另外，你也可以通过「随机来一题」的选项，随机生成数学题目并由系统给出解答。

Ai平台模型 2025年06月05日 81 点赞 0 评论 687 浏览

Agent K v1.0

Agent K v1.0 是一款端到端自主数据科学智能体，由华为诺亚方舟实验室与伦敦大学学院团队联合开发。该工具能够自动化处理数据科学生命周期中的各个环节，支持多模态数据处理，具备动态多步骤问题解决能力，并通过结构化推理和动态记忆管理实现自我学习与优化。Agent K v1.0 在Kaggle多模态挑战赛中表现优异，广泛应用于金融、医疗、零售、制造及客户服务等领域。

AI项目与工具 2025年06月12日 68 点赞 0 评论 688 浏览

eSheep

eSheep是一款专注于为用户提供多样化AI生成图片展示的应用。在这个创新的应用上，用户能够轻松地探索、浏览各种在 eSheep网站上是由 AI 生成的画作、图片，并掌握从中产生的独一无二的视觉艺术。

Ai绘画生成 2025年06月05日 91 点赞 0 评论 688 浏览

BitsAI

BitsAI-CR是字节跳动推出的基于大型语言模型的自动化代码审查工具，采用两阶段处理流程提升审查精度。通过219条规则检测潜在问题，并结合“过时率”指标动态优化规则。支持多语言审查，可无缝集成到现有流程中，自动识别问题、生成评论并跟踪修改情况，提升代码质量与开发效率。

AI项目与工具 2025年06月12日 37 点赞 0 评论 688 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期