问答

OmniAudio

OmniAudio-2.6B是一款专为边缘设备设计的高性能音频语言模型,具备语音识别、转录、问答、对话生成及内容创作等核心功能。其技术优势在于多模态架构的高效集成、稀疏性利用以及三阶段训练流程,支持FP16和Q4_K_M量化版本,确保在资源受限的环境下仍能稳定运行。OmniAudio-2.6B可应用于智能助手、车载系统、会议记录、教育和医疗等多个领域,为用户提供便捷、高效的语音交互体验。

Chat Video

Chat Video 基于AI的高效视频学习工具,具有语音识别、摘要总结、AI 问答等功能。

Trae 插件

Trae 插件是一款基于 AI 的编程辅助工具,支持多种编程语言和主流 IDE,提供代码补全、生成、解释、注释、单测生成及智能问答等功能,提升开发效率与代码质量。支持多模型切换,具备高度可定制性,适用于快速开发、代码优化与团队协作等场景。

CAR

CAR(Certainty-based Adaptive Reasoning)是字节跳动联合复旦大学推出的自适应推理框架,旨在提升大型语言模型(LLM)和多模态大型语言模型(MLLM)的推理效率与准确性。该框架通过动态切换短答案和长形式推理,根据模型对答案的置信度(PPL)决定是否进行详细推理,从而在保证准确性的同时节省计算资源。CAR适用于视觉问答(VQA)、关键信息提取(KIE)等任务,在数学

MatChat AI

MatChat AI是一款面向材料科学领域的AI工具,基于大语言模型和增强搜索技术,整合了大量专业论文知识,构建了权威的知识库。用户可通过自然对话方式获取精准的材料科学信息,并获得可靠的参考文献。该工具专注于材料科学应用,避免通用模型的“幻觉”问题,为科研人员提供高效的知识支持,推动研究智能化发展。

Documate

Documate是一款针对站内文档问答的开源 AI 工具,旨在将 AI 聊天对话框无缝嵌入到您的网站之中。

立理LitLit

AI学术工作站,立理LitLit可以为知识探索、论文研读、选题开题、组会汇报、项目申报、综述写作、论文写作等一些列基础研究工作提供强大的文献支撑。

PaliGemma 2

PaliGemma 2是一款由Google DeepMind研发的视觉语言模型(VLM),结合了SigLIP-So400m视觉编码器与Gemma 2语言模型,支持多种分辨率的图像处理。该模型具备强大的知识迁移能力和出色的学术任务表现,在OCR、音乐乐谱识别以及医学图像报告生成等方面实现了技术突破。它能够处理多模态任务,包括图像字幕生成、视觉推理等,并支持量化和CPU推理以提高计算效率。

奇智孔明AInnoGC工业大模型

奇智孔明AInnoGC工业大模型是创新奇智在工业智能制造领域的重要成果,它通过其强大的参数量和专业的工业领域适应性,为制造业提供了全面的AI解决方案。

Kotaemon

Kotaemon 是一款基于RAG技术的开源工具,支持用户通过自然语言与文档进行互动,从而实现高效的信息检索和理解。它支持多种语言模型,包括OpenAI、Azure OpenAI和Cohere等,提供简易的安装脚本。Kotaemon 还支持多用户协作、文档管理和复杂的推理方法,并允许用户自定义UI元素。其主要功能包括基于RAG技术的问答系统、多语言模型支持、文档管理、混合RAG管道、多模式问答支持