Optima是由清华大学开发的一种专门用于优化基于大型语言模型(LLM)的多智能体系统(MAS)的框架。该框架采用迭代式的生成、排名、选择和训练模式,显著提升了通信效率和任务执行效果。Optima在任务性能、令牌效率以及通信可读性之间找到了良好的平衡点,同时结合了多种强化学习算法,并引入蒙特卡洛树搜索技术来生成高质量的训练数据。实验结果表明,Optima在多智能体任务中的表现优于传统的单智能体系统及常规MAS,其性能提升幅度最高可达2.8倍,同时大幅降低了令牌消耗,为未来推理计算的高效运行提供了新思路。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部