语音 - 智狐AI导航

HMoE

HMoE（混合异构专家模型）是腾讯混元团队提出的一种新型神经网络架构，旨在提升大型语言模型的性能和计算效率。通过引入不同规模的专家来处理不同复杂度的输入数据，HMoE增强了模型的专业化程度，并采用了新的训练目标和策略，如P-Penalty Loss，以提高参数利用率和计算效率。HMoE在多个预训练评估基准上表现出色，适用于自然语言处理、内容推荐、语音识别、图像和视频分析以及多模态学习等领域。

AI项目与工具 2025年06月12日 90 点赞 0 评论 807 浏览

SpicyChat

SpicyChat是一款面向成人用户的AI聊天应用，提供角色扮演聊天功能，支持用户与超过150,000个聊天机器人互动，并可创建个性化虚拟角色。该平台强调隐私保护，提供安全、无偏见的环境，支持多语言交流，具备AI语音回应及基于对话的图像生成功能，旨在为用户提供深入的情感体验和创意灵感。

AI项目与工具 2025年06月12日 37 点赞 0 评论 931 浏览

Dola

Dola是一款基于人工智能的日历助手，它允许用户通过多种方式（包括文字、语音和图片）与主要的即时通讯软件交互，以高效地创建和管理日程事件。Dola具备自然语言理解和日历同步功能，能够自动识别并添加日程，支持跨平台同步，并在事件开始前发送提醒。此外，它还提供群组管理功能，适合团队和组织使用。Dola简化了日程管理流程，提升了个人和团队的工作效率。

AI项目与工具 2025年06月12日 93 点赞 0 评论 743 浏览

蚂小财

蚂小财是一款由蚂蚁集团开发的AI金融助手，基于自主研发的大模型技术，为用户提供实时市场热点解读、个性化理财建议和复杂财报的图文解读等功能。支持语音控制和定制简报服务，连接多家专业金融机构，适用于日常理财咨询、投资决策支持和金融知识普及等多种场景。

AI项目与工具 2025年06月12日 17 点赞 0 评论 633 浏览

Mini-Omni 是一个开源的端到端语音对话模型，具备实时语音输入和输出的能力，能在对话中实现“边思考边说话”的功能。模型设计无需额外的自动语音识别（ASR）或文本到语音（TTS）系统，直接进行语音到语音的对话。Mini-Omni 采用文本指导的语音生成方法，通过批量并行策略提高性能，同时保持了原始模型的语言能力。它支持实时语音交互、文本和语音并行生成、跨模态理解等功能，适用于智能助手、客户服务

AI项目与工具 2025年06月12日 93 点赞 0 评论 969 浏览

Slax Note

SlaxNote是一款利用语音识别技术的AI语音笔记应用，能够实时将语音转换为文本，并自动润色以提升文本质量。它特别适用于户外灵感捕捉、想法整理和内容总结。其主要功能包括实时语音转文字、自动润色、录音保存以及用户友好的界面设计，广泛应用于会议记录、灵感捕捉、日常笔记、亲子时光记录及内容创作等多个场景。

AI项目与工具 2025年06月12日 14 点赞 0 评论 842 浏览

PocketPod

PocketPod是一款基于人工智能技术的个性化播客生成工具。它可以根据用户的兴趣和需求，自动创建包括每日新闻更新和特定主题深入探讨在内的播客内容。用户还可以将PDF文件等文档转换成播客形式，便于在多种场合下收听。该工具主要服务于忙碌人士、学生及播客爱好者，提供了个性化新闻播客、广泛话题覆盖、按需内容创建、文档转播客等功能，并支持与用户的日历和提醒系统集成。

AI项目与工具 2025年06月12日 80 点赞 0 评论 794 浏览

蓝心大模型

蓝心大模型是由vivo研发的通用大模型矩阵，包括语言、端侧、语音、图像及多模态模型。该模型在内容创作、知识问答、逻辑推理、代码生成、信息提取、多语言翻译等方面表现出色。蓝心端侧大模型3B在移动设备上表现出色，蓝心语音大模型支持多语言，蓝心图像大模型融合了中国特色和东方美学，蓝心多模态大模型则提供了流畅的视频对话体验。

AI项目与工具 2025年06月12日 76 点赞 0 评论 818 浏览

MoneyPrinterPlus

MoneyPrinterPlus是一款基于AI技术的短视频生成工具，能够实现一键批量生成并自动混剪短视频。该工具支持将视频自动发布至多个社交平台，简化了视频内容创作流程。MoneyPrinterPlus的核心功能包括AI一键批量生成短视频、自动批量混剪、自动发布到社交平台、支持本地和云语音服务以及AI生图功能。

AI项目与工具 2025年06月12日 61 点赞 0 评论 773 浏览

VoxInstruct

VoxInstruct是清华大学开源的语音合成技术，能够根据人类语言指令生成高质量的语音。该系统采用统一的多语言编解码器语言建模框架，将传统的文本到语音任务扩展到了更广泛的人类指令到语音任务。VoxInstruct通过引入语音语义标记和多种无分类器指导策略，提升了语音合成的自然度和表现力。它支持多语言和跨语言合成，适用于智能语音助手、有声读物、教育培训等多个领域。

AI项目与工具 2025年06月12日 79 点赞 0 评论 882 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期