场景 - 智狐AI导航

Poify

Poify是一款由快手推出的AI图像生成工具，支持AI模特试衣、背景更换、局部重绘等功能，帮助商家和创作者高效生成高质量商品展示图及创意内容。用户可通过文字或图片输入，快速生成符合需求的视觉作品，适用于电商营销、海报设计、社交媒体等内容创作场景，提升视觉吸引力和传播效果。

AI项目与工具 2025年06月11日 42 点赞 0 评论 615 浏览

HealthBench

HealthBench是OpenAI推出的开源医疗评估工具，用于衡量大型语言模型在医疗保健领域的表现和安全性。它包含5000个由医生设计的多轮对话，涵盖多种健康场景，并通过多维度评分标准评估模型的准确性、沟通质量等。支持按主题和行为维度进行细分分析，帮助开发者识别模型优势与不足，指导优化方向。适用于模型性能评估、安全测试及医疗AI工具选择。

AI项目与工具 2025年06月11日 79 点赞 0 评论 515 浏览

EvoAgentX 是一个开源的 AI Agent 自进化框架，通过进化算法实现多 Agent 系统的自动化生成与优化。它能根据目标描述自动生成工作流，并通过迭代优化提升性能。框架采用模块化设计，包含工作流生成器、Agent 管理器、执行器、评估器和优化器等核心组件，支持多种 LLM 模型，用户可通过自然语言提示轻松定制 Agent 和工作流。同时提供可视化工具和多环境支持，适用于复杂系统模拟、自

AI项目与工具 2025年06月11日 94 点赞 0 评论 518 浏览

CodeWave

CodeWave是网易数帆推出的低代码开发平台，通过智能化手段提升软件开发效率。具备数据模型设计、页面搭建、逻辑与流程设计等核心功能，支持从简单应用到复杂系统的快速构建。平台提供大量标准化组件及扩展能力，满足不同行业和场景的开发需求。可视化设计器让开发过程更直观，降低技术门槛。CodeWave支持应用源码导出和独立部署，确保代码级安全，满足企业对数据隐私和安全的严格要求。

AI项目与工具 2025年06月11日 42 点赞 0 评论 513 浏览

3DTown

3DTown是由哥伦比亚大学联合Cybever AI等机构开发的AI工具，能够从单张俯视图生成高精度的3D城镇场景。它采用区域化生成和空间感知3D修复技术，将输入图像分解为重叠区域，分别生成3D内容并修复缺失结构，确保几何和纹理一致性。支持多种风格的场景生成，适用于虚拟世界构建、游戏开发、机器人模拟等领域，优于现有方法。

AI项目与工具 2025年06月11日 17 点赞 0 评论 565 浏览

QwenLong

QwenLong-L1-32B是阿里巴巴集团Qwen-Doc团队开源的首个长文本推理大模型，基于渐进式上下文扩展、课程引导的强化学习和难度感知的回顾性采样策略，显著提升长文本场景下的推理能力。该模型在多个DocQA基准测试中表现优异，平均准确率达70.7%，超越多个现有旗舰模型。其功能包括长文本推理、稳定训练、混合奖励、广泛适用性和高性能表现，适用于法律、金融、科研等多个领域。

AI项目与工具 2025年06月11日 24 点赞 0 评论 707 浏览

WonderPlay

WonderPlay 是斯坦福大学与犹他大学联合开发的新型框架，能够从单张图片和用户定义的动作生成动态3D场景。它结合物理模拟与视频生成技术，支持多种物理材质和动作类型，实现逼真的动态效果。用户可通过简单操作与场景互动，生成丰富的物理响应。该工具具备交互式查看器，适用于AR/VR、影视特效、教育、游戏开发等多个领域。

AI项目与工具 2025年06月11日 35 点赞 0 评论 590 浏览

AIpai

AIpai是一款AI视频创作Agent工具，支持用户快速生成专业视频内容。其主要功能包括智能编剧、角色设计、场景构建、图像生成、视频生成、声音设置和参数调整。用户只需输入文案，AIpai即可自动生成分镜、图像和视频选项，并支持多种风格和参数定制。适用于短视频制作、品牌宣传、个人创作、教育领域和影视制作等多种场景，大幅提升创作效率，降低制作门槛。

AI项目与工具 2025年06月11日 45 点赞 0 评论 469 浏览

TrackVLA

TrackVLA是银河通用推出的端到端导航大模型，具备纯视觉环境感知、语言指令驱动、自主推理和零样本泛化能力。它能在复杂环境中自主导航、灵活避障，并根据自然语言指令识别和跟踪目标对象。无需提前建图，适用于多种场景，如陪伴服务、安防巡逻、物流配送等，为具身智能商业化提供支撑，推动机器人走向日常生活。

AI项目与工具 2025年06月11日 79 点赞 0 评论 770 浏览

VRAG

VRAG-RL是阿里巴巴通义大模型团队推出的视觉感知驱动的多模态RAG推理框架，旨在提升视觉语言模型在处理视觉丰富信息时的检索、推理和理解能力。通过定义视觉感知动作空间，实现从粗粒度到细粒度的信息获取，并结合强化学习和综合奖励机制优化模型性能。该框架支持多轮交互推理，具备良好的可扩展性，适用于智能文档问答、视觉信息检索、多模态内容生成等多种场景。

AI项目与工具 2025年06月11日 84 点赞 0 评论 809 浏览

场景

首页

场景

列表

默认

浏览次数

发布日期