多步骤推理

Genmoai

Genmoai-smol 是一款专为单 GPU 设备设计的开源视频生成模型,能够将文本描述转化为高质量视频内容。其核心优势在于高保真度运动表现、强大的文本提示遵循能力及显存优化技术,支持用户在资源受限条件下开展视频创作。该工具提供了 Gradio UI 和命令行界面两种操作方式,并广泛应用于视频内容创作、超现实效果视频制作和技术研究等领域。

OctoTools

OctoTools是斯坦福大学推出的开源智能体框架,通过标准化工具卡片实现复杂推理任务的高效处理。支持多步骤任务规划、工具集成与优化,具备高准确率和广泛适用性,适用于数学、医学、视觉分析等多个领域。