开源
RTranslator
RTranslator是一款基于AI技术的开源、免费离线翻译应用,专为Android设备设计。它支持对话模式、对讲机模式及文本翻译功能,能够实现高质量的多语言实时翻译。RTranslator采用Meta的NLLB翻译模型和OpenAI的Whisper语音识别技术,支持多种语言,完全离线运行,保障用户隐私安全。
AgiBot Digital World
AgiBot Digital World 是一款基于 NVIDIA Isaac-Sim 的高保真机器人仿真框架,支持多模态大模型驱动的任务与场景自动生成,具备真实感强的视觉与物理模拟能力。其提供多样化专家轨迹生成、域随机化与数据增强功能,助力机器人技能训练与算法优化,并开源了包含多种场景和技能的数据集,适用于工业自动化、服务机器人开发及人工智能研究等领域。
Whisper Input
Whisper Input 是一款开源语音输入工具,基于 Python 和 OpenAI Whisper 模型开发,支持多语言语音识别与实时转录。用户可通过快捷键操作录音并生成文本,具备翻译、自动标点、高效处理及本地运行等功能。适用于会议记录、教育、智能交互及媒体制作等多种场景。
LazyGraphRAG
LazyGraphRAG是微软研究院推出的一种图形增强生成增强检索框架,旨在降低数据索引成本并提升查询效率。相比GraphRAG,其索引成本仅为其0.1%,并通过混合搜索策略优化查询性能。该工具支持本地与全局查询,适用于多种应用场景,包括内容推荐、项目管理和客户服务等,且计划开源以促进技术普及。
MindSearch
MindSearch是一款开源的AI搜索框架,由上海人工智能实验室联合研发团队推出。它结合了大规模信息搜集和整理能力,利用InternLM2.5 7B对话模型,可在短时间内从众多网页中搜集有效信息。该框架采用多智能体框架模拟人类思维模式,先规划后搜索,从而提高信息的准确性和完整性。主要功能包括复杂查询处理、动态图构建、并行信息检索、分层检索策略、上下文管理和响应生成等。其应用场景广泛,包括学术研究
