MiniMax MCP Server MiniMax MCP Server MiniMax MCP Server 是一款基于 MCP 协议的多模态生成服务器,支持视频、图像、语音及声音克隆等功能。其具备高分辨率输出、自然语音生成与声音克隆能力,兼容多种主流客户端。平台采用客户端-服务器架构,结合 RAG 技术提升响应准确性,适用于教学、游戏开发、内容创作等多个领域。 AI项目与工具 2025年06月11日 14 点赞 0 评论 485 浏览
紫东太初 – 多模态大模型 紫东太初 – 多模态大模型 “紫东太初”平台展现了中国科学院自动化研究所在人工智能领域的深厚实力。它不仅具备强大的多模态处理能力,还通过自监督学习和跨模态语义关联技术,为广泛的AI应用提供了坚实的模... Ai平台模型 1970年01月01日 0 点赞 0 评论 483 浏览
音子AI 音子AI 音子AI利用人工智能技术提供了一系列便捷的音频处理服务,无论是音乐制作的音轨分离,还是有声读物的文本转语音,都能满足用户的不同需求。 创作工具 1970年01月01日 0 点赞 0 评论 483 浏览
KHOJ KHOJ KHOJ是一款开源的AI助手,支持多源知识整合与语义搜索,兼容多种文档格式和AI模型。提供图像生成、语音交互、跨平台访问等功能,支持本地与云端部署,适用于个人知识管理、学习研究、团队协作等场景,具有高度灵活性和可扩展性。 AI项目与工具 2025年06月12日 24 点赞 0 评论 483 浏览
VoxInstruct VoxInstruct VoxInstruct是清华大学开源的语音合成技术,能够根据人类语言指令生成高质量的语音。该系统采用统一的多语言编解码器语言建模框架,将传统的文本到语音任务扩展到了更广泛的人类指令到语音任务。VoxInstruct通过引入语音语义标记和多种无分类器指导策略,提升了语音合成的自然度和表现力。它支持多语言和跨语言合成,适用于智能语音助手、有声读物、教育培训等多个领域。 AI项目与工具 2025年06月12日 79 点赞 0 评论 481 浏览
Voicemaker Voicemaker Voicemaker,强大的文本到语音转换器,它也能通过先进的人工智能技术来制作高质量的画外音,听起来像人性化且富有表现力。 Ai语音工具 2025年06月05日 44 点赞 0 评论 481 浏览
Bon French Bon French 一款专为法语初学者设计的法语学习工具,Bon French通过AI技术提供了一系列辅助学习功能。这些功能包括AI句子分析、语音朗读、单词本和句子收藏夹等 教育学习 2025年06月05日 67 点赞 0 评论 480 浏览
TIGER TIGER TIGER是由清华大学研发的轻量级语音分离模型,采用时频交叉建模策略与多尺度注意力机制,有效提升语音分离性能,同时显著降低计算和参数开销。模型通过频带切分优化资源利用,适应复杂声学环境,广泛应用于会议记录、视频剪辑、电影音频处理及智能语音助手等领域。 AI项目与工具 2025年06月12日 98 点赞 0 评论 478 浏览
FakeYou FakeYou FakeYou是一个多功能的AI声音生成平台,它通过模拟名人声音,为用户提供了一个创意无限的声音创作工具。 Ai语音工具 1970年01月01日 0 点赞 0 评论 477 浏览
AsrTools AsrTools AsrTools是一款无需复杂配置的智能语音转文字工具,支持多种音频格式的转换,生成SRT和TXT字幕文件,适用于视频字幕、会议记录、音频转写等多个场景。它具有友好的用户界面、高效的多线程处理能力以及详细的技术文档,旨在为用户提供便捷、准确的语音转文字解决方案。 AI项目与工具 2025年06月12日 40 点赞 0 评论 477 浏览