开源

妙言

一款功能丰富的 Markdown 笔记编辑器,无需联网,纯本地使用,提供语法高亮,深浅主题,多语言,演示模式,PPT 模式,专注模式、单独文件模式、图床,LaTeX 等功能。

MM

MM-StoryAgent是由上海交通大学X-LANCE实验室与阿里巴巴集团联合开发的开源多模态、多智能体框架,用于生成沉浸式有声故事绘本视频。它结合大型语言模型与多模态生成技术,通过多阶段写作流程和模态对齐优化,提升故事内容的质量与连贯性。支持灵活模块化设计,适用于儿童教育、数字内容创作、在线教育等多个场景,为故事创作提供高效、可定制的解决方案。

Casevo

Casevo是一款由中国传媒大学研发的开源社会传播模拟系统,结合大语言模型与多智能体技术,用于模拟人类认知、决策和社会交互,分析并预测社会传播现象。其模块化设计支持从场景设定到复杂社会网络建模的全流程仿真,适用于新闻传播、社会计算、公共政策等多个领域,助力研究者进行理论构建与策略优化,推动AI在社会科学中的应用发展。

AgiBot World

AgiBot World是一个由智元机器人开发的百万真机数据集,专注于具身智能技术的研究。它涵盖了80多种日常生活技能,涉及家居、餐饮、工业、商超及办公五大场景,数据规模和质量均领先于谷歌的Open X-Embodiment。数据采集利用了智元自建的工厂和实验基地,通过8个摄像头和6自由度灵巧手等先进硬件,确保了全域真实场景下的高质量数据获取。项目还计划开源仿真数据、发布具身基座大模型及配套工具链

LeRobot

LeRobot是一个由HuggingFace开发的开源AI聊天机器人项目,旨在简化机器人技术的学习过程。它提供了预训练模型、数据集和模拟环境,支持模仿学习和强化学习,适用于多种机器人硬件。该项目具有多用途、可扩展的特点,通过提供预训练模型、数据集共享、模拟环境和多功能库等功能,帮助用户加速机器人项目的开发进程。

薏米AI

一个AI平台,使用者可以提出问题、获得即时答案,可以与各种先进的人工智慧机器人进行自由对话,它可在WEB和客户端上使用。

Pipecat

Pipecat是一款开源Python框架,用于构建语音和多模态对话系统。它整合了语音识别、文本转语音及对话处理功能,支持与主流AI平台集成,采用模块化管道架构,提升开发效率。基于帧的实时处理机制确保流畅交互,适用于语音助手、企业服务、教育、医疗及多模态应用等多种场景。

DevDocs

DevDocs是一款面向开发者的技术文档爬取与处理工具,支持1至5层深度爬取,具备智能去重、多线程处理及内容清洗功能。其支持Markdown和JSON格式输出,并集成MCP协议,便于与AI工具对接。该工具可通过Docker快速部署,适用于AI训练、文档整理、知识管理等多种场景,提升开发效率与数据可用性。

Reflection 70B

Reflection 70B是一款基于Meta的Llama 3.1 70B Instruct构建的开源AI大模型,采用“Reflection-Tuning”技术,能够在生成最终回答前检测并纠正错误,显著提高输出的准确性。该模型特别适用于需要高精度推理的任务,并具备出色的零样本推理能力。用户可以通过引入特殊token,以更结构化的方式与模型交互。此外,Reflection 70B支持通过Huggin

CogView4

CogView4是一款由智谱推出的开源文生图模型,具有60亿参数,支持中英文输入与高分辨率图像生成。在DPG-Bench基准测试中表现优异,达到当前开源模型的领先水平。模型具备强大的语义理解能力,尤其在中文文字生成方面表现突出,适用于广告设计、教育、儿童绘本及电商等领域。其技术架构融合扩散模型与Transformer,并采用显存优化技术提升推理效率。