Tactiq.io 一个为各种在线会议平台(例如 Google Meet、Zoom 和 MS Teams)提供实时转录服务的平台。Tactiq.io提供实时转录、人工智能生成的会议摘要、行动项目以及提出自定义问题的功能等功能。 Ai办公效率 2025年06月05日 75 点赞 0 评论 519 浏览
Universal Universal-1是一款由AssemblyAI开发的多语言语音识别和转录模型,经过大量多语种音频数据训练,支持英语、西班牙语、法语和德语等。该模型在各种复杂环境中提供高精度的语音转文字服务,具备快速响应能力和改进的时间戳准确性。Universal-1在准确率、响应时间、时间戳估计和用户偏好等方面表现优异,适用于对话智能平台、AI记事本、创作者工具和远程医疗平台等多个应用场景。 AI项目与工具 2024年01月01日 88 点赞 0 评论 519 浏览
CleanS2S CleanS2S是一款流式语音到语音交互智能体原型,通过集成自动语音识别(ASR)、大型语言模型(LLM)、文本到语音(TTS)以及WebSockets等技术,提供高质量、实时的语音交互体验。它支持全双工交互和打断功能,可整合网络搜索和RAG模型以增强回答能力,适用于客户服务、智能家居控制、教育辅助、健康咨询及车载系统等多个领域。 AI项目与工具 2025年06月12日 99 点赞 0 评论 519 浏览
SenseVoice 一款阿里通义实验室发布的FunAudioLLM框架多语言音频基础模型,SenseVoice具有多语种、混合语言、音色和情感控制能力。 Ai语音工具 2025年06月05日 58 点赞 0 评论 520 浏览
小虫快读 小虫快读(BugQR)是一款集成OCR技术和AI大语言模型的高效阅读工具,支持拍照识别、文字提取、核心内容总结及语音播放等功能。其三大总结模式(Summary、Explain、Note)满足多样化阅读需求,适用于学生、教师、研究人员、商业分析人士及法律专业人士等多个领域。免费版提供基础功能,高级版本支持内容导出。 AI项目与工具 2025年06月12日 24 点赞 0 评论 522 浏览
EzVideos 一款能够快速生成适用于Instagram、TikTok和YouTube的爆款短视频工具,EzVideos能够自动完成视频编辑,让用户专注于内容创作。 Ai视频生成 2025年06月05日 21 点赞 0 评论 523 浏览
Ultravox Ultravox 是一种多模态大型语言模型(LLM),能够直接处理文本和语音输入,无需额外的语音识别步骤。其核心技术包括多模态投影器,用于将音频数据转换为高维空间表示,显著提升语音理解和处理效率。该模型支持实时语音对话、多语言扩展及领域特定知识的学习,适用于智能客服、虚拟助手、语言学习、实时翻译及教育等领域。 AI项目与工具 2025年06月12日 51 点赞 0 评论 523 浏览
NewsBang NewsBang是一款基于AI技术的新闻应用,提供无偏见、深度的新闻洞察。通过整合多源信息生成简洁摘要,并支持实时问答、语音播放及个性化推荐等功能,帮助用户高效获取关键信息。适用于忙碌人群、新闻爱好者及投资者等,满足多样化信息需求。 AI项目与工具 2025年06月12日 19 点赞 0 评论 524 浏览