BEHAVIOR Robot Suite BEHAVIOR Robot Suite(BRS)是斯坦福大学李飞飞团队研发的机器人操作框架,专注于实现全身协调与复杂家务任务。它结合了低成本遥操作接口JoyLo和多模态学习算法WB-VIMA,提升机器人在真实环境中的适应性和操作精度。适用于家务自动化、垃圾处理、衣物整理等多个场景,具备高度灵活性和故障恢复能力。 AI项目与工具 2025年06月12日 93 点赞 0 评论 442 浏览
VideoRefer VideoRefer是由浙江大学与阿里达摩院联合开发的视频对象感知与推理系统,基于增强型视频大型语言模型,实现对视频中对象的细粒度理解与分析。其核心包括大规模视频数据集、多功能空间-时间编码器和全面评估基准,支持对象识别、关系分析、推理预测及多模态交互等功能,适用于视频剪辑、教育、安防、机器人控制和电商等多个领域。 AI项目与工具 2025年06月12日 19 点赞 0 评论 442 浏览
Agent TARS Agent TARS 是字节跳动推出的开源多模态 AI 代理工具,支持浏览器、命令行和文件系统的集成,实现复杂任务的自动化执行。其核心功能包括代理工作流、数据处理、代码生成与解释等。基于事件流和模型上下文协议(MCP),Agent TARS 能高效分解任务并实时反馈结果,适用于网页自动化、任务管理、数据分析和代码辅助等多种场景。目前支持 macOS 平台,处于技术预览阶段。 AI项目与工具 2025年06月12日 29 点赞 0 评论 442 浏览
FluxMusic FluxMusic 是一个开源的音乐生成工具,能够将文本描述转化为音乐。它采用先进的扩散模型和Transformer架构,通过修正流技术提高音乐的自然度和质量。该工具支持多种规模的模型,具备文本到音乐生成、语义理解、多模态融合等功能,适用于音乐创作、影视配乐、游戏音乐生成等多种场景。 AI项目与工具 2025年06月12日 66 点赞 0 评论 444 浏览
异世界回响 异世界回响是一款基于人工智能的社交平台,用户可与虚拟角色进行沉浸式交流。平台支持自定义角色形象与声音,提供AIGC工具创建独一无二的角色,并具备数字分身功能。主要面向寻求创新社交体验、情感陪伴以及对AI技术感兴趣的人群。 AI项目与工具 2025年06月12日 28 点赞 0 评论 444 浏览
Emu3 Emu3是一款由北京智源人工智能研究院开发的原生多模态世界模型,结合了多模态自回归技术和单一Transformer架构,能够在图像、视频和文本之间实现无缝转换。它不仅能够根据文本生成高质量图像,还能预测视频发展并理解图文内容,广泛应用于内容创作、广告营销、教育、娱乐等多个领域。 AI项目与工具 2025年06月12日 58 点赞 0 评论 446 浏览
AutoGLM AutoGLM-Web是一款基于大型语言模型开发的AI浏览器助手,具备网页浏览、信息检索、内容总结及邮件自动回复等功能。它通过自进化在线课程强化学习框架不断优化性能,支持多场景应用,适用于办公自动化、学术研究、电商运营及客户服务等领域。 AI项目与工具 2025年06月12日 74 点赞 0 评论 447 浏览
百度搜索MCP广场 百度搜索MCP广场是百度搜索AI开放平台提供的MCP Servers集成平台,为开发者提供海量服务资源,涵盖搜索、地图、文件系统等多个领域。平台具备智能搜索与推荐功能,支持快速筛选和集成所需服务,提升开发效率。同时支持本地与云端部署,适用于AI应用开发、多模态生成、企业级解决方案及内容创作等多种场景。 AI项目与工具 2025年06月11日 86 点赞 0 评论 448 浏览
FakeShield FakeShield是一款由北京大学研发的多模态大型语言模型框架,主要用于检测和定位图像篡改。它通过结合视觉与文本信息,生成篡改区域掩码并提供详细的判断依据。其核心模块包括领域标签引导的检测模块和多模态定位模块,支持多种篡改技术的分析,具有较高的准确性与可解释性。FakeShield广泛应用于社交媒体内容审核、法律取证、新闻媒体真实性验证以及版权保护等领域。 AI项目与工具 2025年06月12日 41 点赞 0 评论 449 浏览