LLM

smoltalk

Smoltalk-Chinese 是 OpenCSG 开发的中文大型语言模型专用合成数据集,包含 70 多万条高质量数据,涵盖多种任务类型,如信息查询、编程、数学、创意写作等。数据通过先进模型生成并经过严格筛选和去重,确保多样性与质量,适用于模型微调和多场景应用,提升语言理解和生成能力。

Liquid

Liquid是由华中科技大学、字节跳动和香港大学联合开发的多模态生成框架,通过VQGAN将图像编码为离散视觉token并与文本共享词汇空间,使大型语言模型无需修改结构即可处理视觉任务。该框架降低训练成本,提升视觉生成与理解性能,并在多模态任务中表现出色。支持图像生成、视觉问答、多模态融合等应用,适用于创意设计、内容创作及智能交互等领域。

ScaleMCP

ScaleMCP是普华永道推出的工具选择方法,通过动态为大型语言模型(LLM)Agents配备Model Context Protocol(MCP)工具,解决手动更新工具库导致的低效和不一致问题。其核心是自动同步工具索引管道,基于CRUD操作确保工具存储与MCP服务器一致,并采用工具文档加权平均(TDWA)嵌入策略提升工具检索和调用性能。支持多种LLM模型和存储系统,适用于金融、客服、医疗等多个场

Cerebellum

Cerebellum是一款结合Claude 3.5 Sonnet与Selenium WebDriver的智能化浏览器助手,通过构建网页浏览的有向图模型,利用LLM技术分析页面内容和交互元素,智能规划操作路径并动态调整策略。它支持多浏览器操作,可精确模拟用户行为,广泛应用于网页自动化测试、数据抓取、内容管理及电子商务等多个领域。

MinT

MinT是一款基于时间基位置编码技术的多事件视频生成框架,允许用户通过文本提示生成包含多个事件的连贯视频,并支持对事件顺序及持续时间的精确控制。其核心技术ReRoPE使得模型能够有效关联文本提示与视频帧,同时结合预训练的视频扩散变换器(DiT)和大型语言模型(LLM)的提示增强功能,进一步提升了视频生成的质量与丰富度。MinT适用于娱乐、广告、教育等多个领域,为视频创作带来了创新性的解决方案。

oli

oli 是一款开源的智能代码助手,结合 Rust 后端与 React/Ink 前端,提供高效的代码辅助、文件操作、命令执行等功能。支持多模型集成,包括云 API 和本地 LLM,适用于代码理解、优化、开发调试及项目管理等场景,提升开发效率和用户体验。

BuboGPT

BuboGPT是一个创新的大型多模态语言模型,它通过结合视觉、音频和文本输入,提供了一种全新的交互体验。

YuLan

YuLan-OneSim是一款基于大型语言模型的社会模拟工具,支持自然语言交互构建模拟场景,无需编程即可生成代码。提供50多个社会科学领域预设场景,支持大规模智能体模拟,具备自动优化和报告生成能力,适用于经济、社会学、政治学等多个研究领域,推动AI与社会科学的融合应用。

MILS

MILS是由Meta AI开发的一种无需额外训练即可为大型语言模型(LLM)提供多模态能力的框架。它通过多步推理、评分反馈和迭代优化,实现图像、视频、音频等多模态内容的生成与理解。MILS支持零样本描述生成、风格迁移、跨模态推理等任务,适用于内容生成、多模态检索、视觉问答等多个场景,具备高效、灵活和无需训练的优势。

Farfalle

一个开源的AI 驱动的答案搜索引擎,定位为 Perplexity 的自托管替代品。