MyVocal.AI 一种快速简便的方法,用于克隆您的声音,以进行唱歌或演讲。MyVocal.AI提供声音克隆,文本转语音和文本转歌曲的功能。 Ai语音工具 2025年06月05日 55 点赞 0 评论 396 浏览
OpenAudio S1 OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于200万小时音频数据训练,支持13种语言。采用双自回归架构和RLHF技术,生成自然流畅的语音,支持50多种情感和语调标记。具备零样本和少样本语音克隆功能,仅需10到30秒音频即可生成高保真声音。适用于视频配音、播客、游戏角色语音、虚拟助手、游戏娱乐、教育培训及客服系统等场景。提供40亿参数完整版和5亿参数开源版,满足 AI项目与工具 2025年06月11日 28 点赞 0 评论 396 浏览
GenFM GenFM是一款由ElevenLabs开发的AI工具,可将PDF、文章、电子书等内容转换为多角色播客音频。它支持32种语言,具备自动化声音选择、人性化填充词添加及高度定制化功能,适用于教育、播客制作、有声书创作、商业推广等多个领域。 AI项目与工具 2025年06月12日 85 点赞 0 评论 397 浏览
dots.llm1 dots.llm1 是小红书 hi lab 开源的中等规模 Mixture of Experts(MoE)文本大模型,拥有 1420 亿参数,激活参数为 140 亿。模型在 11.2T 高质量 token 数据上预训练,采用高效的 Interleaved 1F1B 流水并行和 Grouped GEMM 优化技术,提升训练效率。该模型支持多语言文本生成、复杂指令遵循、知识问答、数学与代码推理以及多轮 AI项目与工具 2025年06月11日 78 点赞 0 评论 400 浏览
Speechki Speechki 是一款高效文本转语音工具,支持多语言和多种语音选择,具备实时校对、角色管理和精准音频控制功能。用户可通过可视化编辑器灵活调整语速、语调和音高,适用于内容创作、教育、企业营销等多种场景。同时支持与 ChatGPT 集成,提升文本转音频的效率和实用性。 AI项目与工具 2025年06月12日 50 点赞 0 评论 401 浏览
CosyVoice 2.0 CosyVoice 2.0是一款基于深度学习的语音生成大模型,通过有限标量量化技术和新型架构设计,在发音准确性、音色一致性和韵律表达方面表现出色。其支持流式推理,延迟低至150ms,广泛应用于智能助手、有声读物、视频配音及语言学习等领域,同时具备多语言支持和情感控制等功能。 AI项目与工具 2025年06月12日 10 点赞 0 评论 401 浏览
Qwen3 Embedding Qwen3 Embedding 是基于 Qwen3 基础模型开发的文本表征、检索与排序专用模型,支持 119 种语言,参数规模从 0.6B 到 8B。它能够精准捕捉文本语义,支持多语言处理、高效检索和语义相关性排序,并可通过个性化优化提升用户体验。在 MTEB 等任务中表现优异,适用于智能搜索、推荐系统、问答系统和教育领域等场景。 AI项目与工具 2025年06月11日 37 点赞 0 评论 401 浏览
DeepSeek Coder 中国人工智能公司深度求索(DeepSeek)推出的开源代码生成大模型系列,通过深度学习技术提升代码生成和理解能力,提升开发者的编程效率。 Ai编程建站 2025年06月05日 24 点赞 0 评论 403 浏览
UNI UNI-CourseHelper是一款基于AI技术的学习辅助工具,支持多模态问答、长文解析、思维链推理等功能,覆盖多个学科领域。通过Markdown格式展示答案,支持图片和文档提问,适用于学生、教师及研究人员,提升学习效率与理解深度。 AI项目与工具 2025年06月12日 86 点赞 0 评论 403 浏览