端到端 - 智狐AI导航

MMedAgent

MMedAgent是一款面向医疗领域的多模态AI平台，集成了指令优化的多模态大型语言模型（MLLM）及一系列定制化医疗工具，支持多种医学成像模式（如MRI、CT、X射线等），可高效处理视觉问答、分类、定位、分割、医学报告生成（MRG）及检索增强生成（RAG）等任务，显著提升了医疗数据处理效率与准确性。

AI项目与工具 2025年06月12日 45 点赞 0 评论 632 浏览

Helix

Helix 是 Figure 公司推出的视觉-语言-动作（VLA）模型，专为人形机器人设计，支持对上半身的高精度、高频次控制，频率达 200Hz。它能基于自然语言指令执行未见过的物品操作，具备强大的泛化能力。系统采用端到端训练方式，可在低功耗设备上运行，适用于多机器人协作、家庭服务、工业自动化等多种场景，具有较高的商业化潜力。

AI项目与工具 2025年06月12日 69 点赞 0 评论 871 浏览

Migician

Migician是一款由多所高校联合开发的多模态大语言模型，专为多图像定位任务设计。它基于大规模数据集MGrounding-630k，采用端到端架构和两阶段训练方法，支持跨图像精准定位与多任务处理。Migician适用于自动驾驶、安防监控、医疗影像等多个领域，具有高效的推理能力和灵活的输入方式。

AI项目与工具 2025年06月12日 90 点赞 0 评论 815 浏览

Maestro

Maestro是一款高效的端到端自动化测试框架，支持移动和Web应用的全面测试。具备内置容错机制和自动等待功能，提升测试稳定性。采用声明式YAML语法，支持快速迭代与跨平台兼容，适用于多设备和浏览器环境。适合开发团队在CI/CD流程中高效进行UI测试。

AI项目与工具 2025年06月12日 40 点赞 0 评论 732 浏览

PixelFlow

PixelFlow是由香港大学与Adobe联合开发的图像生成模型，支持在像素空间中直接生成高质量图像。其基于流匹配技术和多尺度生成策略，实现从低分辨率到高分辨率的逐步生成，有效降低计算成本。该模型在类别条件图像生成和文本到图像生成任务中表现优异，具备强大的语义理解和视觉表达能力。此外，PixelFlow采用端到端训练方式，支持多种ODE求解器，适用于艺术设计、内容创作、教育研究等多个领域。

AI项目与工具 2025年06月11日 100 点赞 0 评论 547 浏览

Magnitude

Magnitude 是一个开源的视觉 AI 代理驱动的端到端测试框架，支持自然语言编写测试用例，结合推理代理与视觉代理实现智能化测试流程。它具备本地运行、CI/CD 集成和托管服务等多种部署方式，适用于 Web 应用测试、自动化测试、生产环境监控等场景，提高测试效率与准确性。

AI项目与工具 2025年06月11日 88 点赞 0 评论 736 浏览

豆包1.5·UI

豆包1.5·UI-TARS是字节跳动推出的一款面向图形用户界面（GUI）的智能代理模型，具备视觉理解、逻辑推理和操作执行能力。它无需预定义规则，即可实现端到端的GUI任务自动化，适用于办公、测试、客服及机器人交互等多个场景。模型基于多模态融合与端到端学习技术，支持高效的界面交互与精准的视觉定位。

AI项目与工具 2025年06月11日 31 点赞 0 评论 732 浏览

PartCrafter

PartCrafter是一款先进的3D生成模型，能够从单张RGB图像中生成多个语义明确且几何形态各异的3D网格。通过组合潜在空间表示每个3D部件，并利用层次化注意力机制确保全局一致性。该模型基于预训练的3D网格扩散变换器（DiT），支持多部件联合生成、端到端生成和部件级编辑，适用于游戏开发、建筑设计、影视制作等多个领域。

AI项目与工具 2025年06月11日 66 点赞 0 评论 915 浏览

文心百中

一款基于百度文心大模型推出的创新搜索产品，文心百中通过极简的框架设计和新一代语义向量搜索模式，实现了搜索效果与效率的双重突破，为企业和开发者提供了更加高效和便捷的搜索解决方案。

Ai平台模型 2025年06月05日 72 点赞 0 评论 844 浏览

心辰Lingo语音大模型

实现了从语音输入到语音输出的全程无缝对接，心辰Lingo能够直接理解语音内容，捕捉语气、节奏和情绪，并以同样丰富的语音形式进行回复。

Ai平台模型 2025年06月05日 84 点赞 0 评论 1800 浏览

端到端

首页

端到端

列表

默认

浏览次数

发布日期