LLM

Laminar

Laminar是一款面向大型语言模型(LLM)的开源可观测性和分析平台,具备自动追踪LLM调用与数据库交互、事件驱动分析及数据标注等功能,同时支持高效的数据存储与可视化展示。其目标是提升LLM应用的透明度和效率,适用于开发调试、性能监控、用户体验优化及业务决策支持等多个场景。

VideoLingo

VideoLingo是一款集成了自然语言处理与大型语言模型技术的全自动视频翻译工具,具备智能字幕分割、上下文感知翻译、精准字幕对齐及高质量配音等功能。它能够高效处理视频翻译任务,适用于在线教育、企业培训、视频内容创作等多个领域,帮助用户突破语言障碍,提升内容传播效果。

AgentStack

AgentStack 是一款开源工具,用于简化 AI 代理项目的构建过程。它提供预配置模板、集成多种流行框架和工具,并支持跨平台操作。主要功能包括快速项目初始化、交互式测试运行器、实时开发反馈和生产构建脚本。AgentStack 还具备模块化设计和依赖管理能力,适用于自动化客户服务、数据管理、内容创作、个人助理及教育等领域。 ---

Mellum

Mellum 是 JetBrains 推出的一款专为开发者设计的大型语言模型(LLM),通过深度集成 JetBrains IDE,提供低延迟、高精度的代码补全服务,支持多种编程语言,显著提升开发效率。其训练数据仅限于公开可用且许可宽松的代码,保障用户隐私。

钛镁AI

钛镁AI是一家专注于企业级AIGC营销解决方案的平台服务商,提供从市场洞察到舆情管理的全链路服务。其核心功能包括智能体、AI搜索、数智员工、多模态生成能力及专属大模型定制,旨在帮助企业提升营销效率和决策准确性,推动营销AI化转型。

Cerebellum

Cerebellum是一款结合Claude 3.5 Sonnet与Selenium WebDriver的智能化浏览器助手,通过构建网页浏览的有向图模型,利用LLM技术分析页面内容和交互元素,智能规划操作路径并动态调整策略。它支持多浏览器操作,可精确模拟用户行为,广泛应用于网页自动化测试、数据抓取、内容管理及电子商务等多个领域。

VideoChat

VideoChat是一款开源的实时数字人对话系统,支持语音输入与实时对话功能。用户可自定义数字人形象与音色,实现音色克隆。系统集成多种技术,包括语音识别、大语言模型生成及文本转语音,支持流式视频输出,适用于客户服务、在线教育、新闻播报、直播互动及娱乐等多个领域。

AgileGen

AgileGen是一个基于人机协作的生成式软件开发框架,通过Gherkin语言定义用户需求并生成代码,支持快速原型设计和迭代优化。其主要功能包括需求收集与澄清、场景设计、代码生成及反馈迭代,同时具备记忆池机制以提升决策效率。适用于初创公司、教育领域及企业内部工具开发等场景。

LongRAG

LongRAG是一个专为长文本问答设计的双视角鲁棒检索增强生成框架,包含混合检索器、LLM增强信息提取器、CoT引导过滤器和LLM增强生成器。它通过整合全局上下文与细节信息,解决长文本中的复杂问答挑战,并在多个数据集上展现优异性能。此外,其自动化微调数据构建能力增强了模型的指令遵循能力和领域适用性。

StableAnimator

StableAnimator是一款由复旦大学、微软亚洲研究院、虎牙公司及卡内基梅隆大学联合开发的高质量身份保持视频生成框架。它能够根据参考图像和姿态序列,直接生成高保真度、身份一致的视频内容,无需后处理工具。框架集成了图像与面部嵌入计算、全局内容感知面部编码器、分布感知ID适配器以及Hamilton-Jacobi-Bellman方程优化技术,确保生成视频的流畅性和真实性。StableAnimato