语音

OmniAudio

OmniAudio-2.6B是一款专为边缘设备设计的高性能音频语言模型,具备语音识别、转录、问答、对话生成及内容创作等核心功能。其技术优势在于多模态架构的高效集成、稀疏性利用以及三阶段训练流程,支持FP16和Q4_K_M量化版本,确保在资源受限的环境下仍能稳定运行。OmniAudio-2.6B可应用于智能助手、车载系统、会议记录、教育和医疗等多个领域,为用户提供便捷、高效的语音交互体验。

Freed

Freed是一款基于AI技术的医疗文档助手,通过语音转录和自然语言处理技术,实现医患对话的自动化记录与结构化文档生成。其核心功能包括环境感知技术、个性化学习以及多语言支持,广泛适用于门诊、住院、急诊及远程医疗等多种医疗场景,旨在减轻医生文书负担,提升工作效率。

MNN

MNN是一个由阿里巴巴开源的轻量级深度学习推理框架,支持多种模型格式和网络结构,具备高性能、低内存占用及跨平台特性。它通过模型量化、计算图优化和异构计算等技术,在移动设备和嵌入式系统中实现高效推理。主要功能涵盖模型转换、硬件加速、内存优化及多模型支持,广泛应用于图像识别、语音处理、智能家居及工业检测等领域。

Mathtutor on Groq

Mathtutor on Groq 是一款基于 Groq 架构的 AI 辅导工具,通过语音识别功能接收数学问题,结合强大的数学引擎提供实时解题过程与答案。其主要功能包括语音输入、LaTeX 公式渲染、高精度计算及自然语言处理支持,适用于代数、微积分等领域的学习与教学辅助。此外,它还集成了 xRx 框架、Whisper 和 Llama 模型,确保高效且精准的问题解决能力。Mathtutor on G

通义浏览器插件

通义浏览器插件是一款集实时语音识别、AI字幕翻译、智能总结于一体的多功能AI工具。支持在线课程、会议记录、外语视频观看等多种应用场景,提供语音转文字、翻译、内容总结等功能,帮助用户高效管理在线信息。此外,用户可通过插件快速访问网页版平台,查看和整理记录内容,实现更便捷的信息处理体验。

星火陪练

星火陪练是一款基于AI技术的企业员工培训平台,集智能配置、自然对话、虚拟陪练及多维评分于一体。其主要功能包括快速生成课程内容、场景模拟对话、沉浸式虚拟陪练以及多维度评价反馈,广泛应用于企业培训、新员工入职、技能提升及在线教育等领域,助力员工高效掌握专业知识与实践技能。

Mind GPT

Mind GPT-3o是一款由理想汽车推出的大规模多模态端到端人工智能模型,集成了语音、视觉与语言理解技术,具备记忆、规划、工具集成及表达能力。它不仅能理解复杂信息,还能提供个性化服务,如智能驾驶辅助、家居设备控制、日程管理和健康咨询等。通过强化逻辑推理与上下文理解,该模型实现了从感知到表达的智能化跨越,为用户提供全面的支持。

Luvvoice

Luvvoice 是一款基于 AI 技术的在线文本到语音转换平台,提供超过 200 种高质量 AI 声音和 70 多种语言选项。用户可以通过上传 PDF 或 TXT 文件,将文本快速转换为自然语音,适用于教育、内容创作、营销及无障碍服务等多个场景。平台支持多种语言调节功能,生成的音频文件支持 MP3 格式下载。

Scribenote

Scribenote是一款面向兽医的AI记录工具,利用自然语言处理技术将语音转换为结构化医疗笔记,支持SOAP格式、多宠物记录及客户沟通管理。它简化了文书工作,提高记录效率,适用于日常诊疗、手术记录、紧急处理及远程咨询等场景,同时兼容主流医疗信息系统。

Buddy.ai

Buddy.ai是一款面向儿童的AI英语学习平台,结合语音识别与人工智能技术,提供个性化的游戏化学习体验。支持多种学习风格,包含语音互动、全身反应及多语言课程,适用于家庭、学校及特殊教育等场景,旨在提升孩子的语言能力与学习兴趣。