语言处理

Ovis2

Ovis2是阿里巴巴国际团队开发的多模态大语言模型,采用结构化嵌入对齐技术提升视觉与文本的融合效果。支持视频、图像和多语言处理,强化了思维链推理和复杂场景下的OCR能力。提供多个参数规模的版本,适用于研究、开发及各类应用场景,展现卓越性能。

Klee

Klee是一款本地运行的AI桌面应用,专注于数据安全与隐私保护,所有操作均在用户设备上完成。它集成了RAG技术、开源AI模型,并支持笔记管理、文件分析、团队协作等功能。适用于个人知识管理、软件测试、数据分析及自然语言处理等多种场景,尤其适合注重隐私和高效工作的用户。

Devika

Devika是一款开源的AI编程工具,支持自然语言指令解析、复杂任务分解以及跨平台代码生成。凭借其先进的AI搜索与推理能力,Devika能够协助开发者高效完成从概念到实现的全过程,涵盖新功能开发、代码重构、Bug修复及自动化测试等多个应用场景。同时,其模块化架构便于扩展,确保了在不同项目中的灵活性与实用性。

Ming

Ming-Lite-Omni是蚂蚁集团开源的统一多模态大模型,基于MoE架构,支持文本、图像、音频和视频等多种模态的输入输出,具备强大的理解和生成能力。模型在多个任务中表现优异,如图像识别、视频理解、语音问答等,适用于OCR识别、知识问答、视频分析等多个领域。其高效处理能力和多模态交互特性,为用户提供一体化智能体验。

anime.gf

Anime.gf 是一款基于开源技术开发的本地应用程序,支持用户创建和管理个性化虚拟角色。它利用先进的自然语言处理技术和多种大型语言模型 API,提供智能化的对话体验。主要功能涵盖角色创建、编辑与删除、多 API 接入、聊天记录管理以及响应再生成等。适用于娱乐、情感陪伴、语言学习、故事创作、教育辅助以及心理治疗等多个领域。

Rose AI

Rose AI是一个旨在帮助用户查找、参与、可视化和共享数据的云数据平台。

Muyan

Muyan-TTS是一款面向播客场景的开源文本转语音工具,基于超10万小时播客数据训练,支持零样本语音合成与说话人适配,可在0.33秒内生成1秒音频,适合实时与长内容合成。支持本地部署与API调用,应用于播客、有声书、视频配音、AI角色及新闻播报等领域,兼具高效性与灵活性。

Vanna

Vanna 是一款开源的 Python RAG 框架,能够基于大型语言模型生成精确的 SQL 查询。它支持多类型数据库与 LLMs,采用检索增强生成技术提高查询准确性,同时保障数据安全。Vanna 还具备自定义前端界面和用户反馈机制,广泛适用于数据分析师、BI 工具、客户支持系统及数据科学项目等领域。

VideoRAG

VideoRAG是一种基于检索增强生成(RAG)技术的工具,旨在提升长视频的理解能力。它通过提取视频中的多模态信息(如OCR、ASR和对象检测),并将其与视频帧和用户查询结合,增强大型视频语言模型的处理效果。该技术轻量高效,易于集成,适用于视频问答、内容分析、教育、媒体创作及企业知识管理等多个领域。

会问AI

会问AI是一个多功能的AI助手,它不仅能回答各种问题,还能参与自然对话,作为学习工具和日常助手使用。