LLM

Promptic

Promptic 是一款基于 Python 的轻量级 LLM 应用开发框架,提供类型安全的输出验证、流式响应支持、对话记忆管理及错误处理等特性。它通过集成 LiteLLM 和装饰器模式,帮助开发者快速构建稳定高效的 LLM 应用,同时支持多种主流 LLM 服务提供商的无缝切换。主要功能包括动态提示生成、响应验证、状态管理和工具函数代理构建,广泛应用于聊天机器人、内容生成、语言翻译、情感分析和数据摘

CodeArena

CodeArena是一个在线平台,用于实时比较多个大型语言模型(LLM)的代码生成能力。它通过实时渲染和排名机制,帮助开发者评估LLM的性能,包括代码的可读性、效率和准确性。CodeArena集成了开发者工具,支持企业选型、学术研究、编程教育和技能提升等多种应用场景。

FACTS Grounding

FACTS Grounding是一款由谷歌DeepMind研发的基准测试工具,专门用于评估大型语言模型在生成事实准确文本方面的能力。它通过设置包含多个领域的复杂任务,要求模型基于长文档生成响应,并采用两阶段评估流程验证事实准确性及避免“幻觉”。FACTS Grounding不仅支持信息检索与问答,还能应用于内容摘要生成、文档改写以及客户服务等领域,为模型提供全面而可靠的性能评估。

Kheish

Kheish 是一款基于大型语言模型的开源多智能体协作平台,支持复杂任务的分解与处理。它通过多智能体工作流、模块化集成和反馈循环机制,实现任务的高效执行与优化。Kheish 可无缝接入外部模块,如文件系统、Shell 和向量存储,广泛应用于代码审计、法律文件分析、客户服务自动化、内容创作等领域。

Browser Use

Browser Use是一款基于大语言模型的智能浏览器工具,支持多标签页管理和视觉识别,可提取网页内容并记录操作步骤。它允许开发者自定义动作,如保存文件或推送至数据库,并兼容多种主流LLM模型,具备并行运行和自我修正能力,旨在提升任务执行效率与准确性。

FinRobot

FinRobot是一款开源的AI代理平台,专注于金融领域的应用,基于大型语言模型(LLMs)构建能够执行复杂分析和决策的专业金融AI代理。平台通过金融思维链(CoT)提示功能提升分析能力,并通过开源方式促进AI在金融决策中的广泛应用。架构涵盖金融AI代理层、金融LLM算法层、LLMOps和DataOps层以及多源LLM基础模型层,支持市场预测、文档分析及交易策略等多种金融专业AI代理。

RAG Logger

RAG Logger 是一款专为检索增强生成(RAG)应用设计的开源日志记录工具,支持查询跟踪、检索结果记录、LLM 交互记录及性能监控等功能。其核心特性包括结构化 JSON 日志存储、每日日志组织、事件驱动架构和灵活配置选项。RAG Logger 能够帮助开发者有效监控和优化 RAG 管道的运行效率,广泛适用于搜索引擎优化、智能问答系统、内容推荐系统、NLP 研究及教育辅助工具等领域。

MinT

MinT是一款基于时间基位置编码技术的多事件视频生成框架,允许用户通过文本提示生成包含多个事件的连贯视频,并支持对事件顺序及持续时间的精确控制。其核心技术ReRoPE使得模型能够有效关联文本提示与视频帧,同时结合预训练的视频扩散变换器(DiT)和大型语言模型(LLM)的提示增强功能,进一步提升了视频生成的质量与丰富度。MinT适用于娱乐、广告、教育等多个领域,为视频创作带来了创新性的解决方案。

VITRON

VITRON是一款由多家顶尖机构联合研发的像素级视觉大型语言模型,具备强大的图像与视频处理能力,涵盖理解、生成、分割及编辑等功能。它融合了编码器-LLM-解码器架构、视觉-语言编码和视觉专家系统,支持多种视觉任务,广泛应用于图像编辑、视频创作、教育辅助、电商营销和新闻报道等领域。

Cognita

Cognita是一个开源的模块化RAG框架,用于构建高效的问答系统和知识管理系统。它支持本地和生产环境部署,具备API驱动的架构、无代码UI、增量索引和多文档检索功能,适用于企业知识管理、客户支持、内容推荐等场景。开发人员可通过其模块化设计灵活扩展系统,非技术用户也可通过图形界面进行操作。