MILS MILS是由Meta AI开发的一种无需额外训练即可为大型语言模型(LLM)提供多模态能力的框架。它通过多步推理、评分反馈和迭代优化,实现图像、视频、音频等多模态内容的生成与理解。MILS支持零样本描述生成、风格迁移、跨模态推理等任务,适用于内容生成、多模态检索、视觉问答等多个场景,具备高效、灵活和无需训练的优势。 AI项目与工具 2025年06月12日 31 点赞 0 评论 106 浏览
YuLan YuLan-OneSim是一款基于大型语言模型的社会模拟工具,支持自然语言交互构建模拟场景,无需编程即可生成代码。提供50多个社会科学领域预设场景,支持大规模智能体模拟,具备自动优化和报告生成能力,适用于经济、社会学、政治学等多个研究领域,推动AI与社会科学的融合应用。 AI项目与工具 2025年06月11日 55 点赞 0 评论 109 浏览
oli oli 是一款开源的智能代码助手,结合 Rust 后端与 React/Ink 前端,提供高效的代码辅助、文件操作、命令执行等功能。支持多模型集成,包括云 API 和本地 LLM,适用于代码理解、优化、开发调试及项目管理等场景,提升开发效率和用户体验。 AI项目与工具 2025年06月11日 35 点赞 0 评论 116 浏览
MinT MinT是一款基于时间基位置编码技术的多事件视频生成框架,允许用户通过文本提示生成包含多个事件的连贯视频,并支持对事件顺序及持续时间的精确控制。其核心技术ReRoPE使得模型能够有效关联文本提示与视频帧,同时结合预训练的视频扩散变换器(DiT)和大型语言模型(LLM)的提示增强功能,进一步提升了视频生成的质量与丰富度。MinT适用于娱乐、广告、教育等多个领域,为视频创作带来了创新性的解决方案。 AI项目与工具 2025年06月12日 42 点赞 0 评论 118 浏览
Cerebellum Cerebellum是一款结合Claude 3.5 Sonnet与Selenium WebDriver的智能化浏览器助手,通过构建网页浏览的有向图模型,利用LLM技术分析页面内容和交互元素,智能规划操作路径并动态调整策略。它支持多浏览器操作,可精确模拟用户行为,广泛应用于网页自动化测试、数据抓取、内容管理及电子商务等多个领域。 AI项目与工具 2025年06月12日 54 点赞 0 评论 121 浏览
ScaleMCP ScaleMCP是普华永道推出的工具选择方法,通过动态为大型语言模型(LLM)Agents配备Model Context Protocol(MCP)工具,解决手动更新工具库导致的低效和不一致问题。其核心是自动同步工具索引管道,基于CRUD操作确保工具存储与MCP服务器一致,并采用工具文档加权平均(TDWA)嵌入策略提升工具检索和调用性能。支持多种LLM模型和存储系统,适用于金融、客服、医疗等多个场 AI项目与工具 2025年06月11日 48 点赞 0 评论 121 浏览
Liquid Liquid是由华中科技大学、字节跳动和香港大学联合开发的多模态生成框架,通过VQGAN将图像编码为离散视觉token并与文本共享词汇空间,使大型语言模型无需修改结构即可处理视觉任务。该框架降低训练成本,提升视觉生成与理解性能,并在多模态任务中表现出色。支持图像生成、视觉问答、多模态融合等应用,适用于创意设计、内容创作及智能交互等领域。 AI项目与工具 2025年06月12日 82 点赞 0 评论 123 浏览
Kheish Kheish 是一款基于大型语言模型的开源多智能体协作平台,支持复杂任务的分解与处理。它通过多智能体工作流、模块化集成和反馈循环机制,实现任务的高效执行与优化。Kheish 可无缝接入外部模块,如文件系统、Shell 和向量存储,广泛应用于代码审计、法律文件分析、客户服务自动化、内容创作等领域。 AI项目与工具 2025年06月12日 50 点赞 0 评论 124 浏览