检索

FlexRAG

FlexRAG 是一个高效的检索增强生成(RAG)框架,通过压缩编码器和选择性压缩机制优化长上下文处理,提升计算效率与生成质量。支持多模态数据、多种检索器和多数据类型,适用于开放域问答、对话系统、文档摘要等知识密集型任务,具备灵活配置和可扩展性。

MMedAgent

MMedAgent是一款面向医疗领域的多模态AI平台,集成了指令优化的多模态大型语言模型(MLLM)及一系列定制化医疗工具,支持多种医学成像模式(如MRI、CT、X射线等),可高效处理视觉问答、分类、定位、分割、医学报告生成(MRG)及检索增强生成(RAG)等任务,显著提升了医疗数据处理效率与准确性。

TITAN

TITAN是一款由哈佛医学院研究团队开发的多模态全切片病理基础模型,通过视觉自监督学习和视觉-语言对齐预训练,能够在无需微调或临床标签的情况下提取通用切片表示并生成病理报告。它在多种临床任务中表现出色,包括线性探测、少样本和零样本分类、罕见癌症检索、跨模态检索和病理报告生成,尤其适用于资源有限的临床场景。

AutoRAG

AutoRAG是一款由中科院相关机构研发的自主迭代检索模型,专为大型语言模型设计,通过多轮对话实现检索规划与查询细化,具备动态调整迭代次数、增强可解释性的特点。它在复杂任务处理方面表现出色,支持智能问答、学术研究、市场分析、在线教育及客户服务等多样化应用场景。 ---

RAG Logger

RAG Logger 是一款专为检索增强生成(RAG)应用设计的开源日志记录工具,支持查询跟踪、检索结果记录、LLM 交互记录及性能监控等功能。其核心特性包括结构化 JSON 日志存储、每日日志组织、事件驱动架构和灵活配置选项。RAG Logger 能够帮助开发者有效监控和优化 RAG 管道的运行效率,广泛适用于搜索引擎优化、智能问答系统、内容推荐系统、NLP 研究及教育辅助工具等领域。

ModernBERT

ModernBERT是一种基于Transformer架构的新型编码器-only模型,是对经典BERT模型的深度优化版本。它通过在大规模数据集上的训练,提升了对长上下文的理解能力,并在信息检索、文本分类、实体识别等多个自然语言处理任务中展现出卓越性能。此外,ModernBERT在速度和资源效率方面均有显著改进,适合应用于多个领域。

VMB

VMB是一个由多机构合作研发的多模态音乐生成框架,可从文本、图像和视频等多样化输入生成音乐。它通过文本桥接和音乐桥接优化跨模态对齐与可控性,显著提高了音乐生成的质量和定制化程度。VMB具有增强模态对齐、提升可控性、显式条件生成等特点,适用于电影、游戏、虚拟现实等多个领域。

ColorFlow

ColorFlow是一款由清华大学与腾讯ARC实验室联合研发的图像序列着色模型,具备检索增强、上下文学习及超分辨率技术,能够精准保持个体身份并实现高质量着色。该工具在漫画、动画制作、老照片修复及艺术创作等领域具有广泛应用价值,同时支持学术研究和技术探索。

Paperpal

Paperpal是一款专为学术写作设计的AI工具,提供语言编辑、文本改写、投稿检查、抄袭检测、学术翻译等多功能服务。通过整合先进的AI技术,Paperpal能够实时提供符合学术规范的语言建议,并支持多种语言翻译与文献引用生成,助力用户高效完成科研任务。其适用范围覆盖学术写作全流程,特别适合全球范围内从事科学研究的专业人士。

豆包向量化API

Doubao-embedding是字节跳动推出的语义向量化API,支持中英文文本处理及长文本向量化,提供多种维度的向量输出和丰富的SDK支持,适用于搜索引擎、推荐系统、知识图谱构建和自然语言处理等多种应用场景。