RealtimeSTT RealtimeSTT是一款开源的实时语音转文本库,具备高精度语音活动检测、GPU加速的实时转录能力以及语音唤醒功能。支持多语言识别,适用于语音助手、会议记录、实时字幕等场景,提供灵活的音频输入与预处理机制,便于开发者快速集成和扩展。 AI项目与工具 2025年06月12日 97 点赞 0 评论 702 浏览
DemoCreator 一款适用于教育工作者、视频会议演示者、企业主和游戏玩家的屏幕录像机和视频编辑器,DemoCreator是制作演示视频和解说视频的一站式解决方案。 视频剪辑 2025年06月05日 60 点赞 0 评论 703 浏览
Bark Bark是一款开源的文本到音频转换模型,由Suno AI开发,能够生成逼真的多语言语音及多种音频类型,包括音乐和背景噪音,并支持非语言交流的声音。该模型提供预训练模型,适用于研究和商业用途。其主要功能涵盖文本到音频转换、多语言支持、音频多样性和非语言交流模拟。Bark在多语言内容创作、音频内容生成和非语言交流场景中具有广泛应用。 AI项目与工具 2025年06月12日 28 点赞 0 评论 703 浏览
MusicFX DJ MusicFX DJ是一款由Google DeepMind开发的人工智能音乐生成工具,利用实时文本提示生成多样化音乐作品。它支持多提示词混合、风格精细调控、乐器编排以及高质量音频输出等功能,适用于个人创作、现场表演、音乐教育及社交媒体内容制作等多个场景,为音乐爱好者和专业人士提供便捷高效的创意工具。 AI项目与工具 2025年06月12日 30 点赞 0 评论 706 浏览
音控 音控是一款基于AI技术的音乐创作平台,提供AI作词、作曲、伴奏生成、AI歌手模拟等多功能支持,适用于个人创作、专业制作、音乐教育及治疗等领域。其智能化工具能够显著降低音乐创作门槛,同时满足多样化的音乐风格需求,使创作过程更高效且趣味盎然。 --- AI项目与工具 2025年06月12日 44 点赞 0 评论 707 浏览
Aconvert 一款免费的在线格式转换工具,支持多达 110 多种文件格式转换,包括 PDF、文档、电子书、图片、音频、视频和压缩文件等。 格式转换 2025年06月05日 28 点赞 0 评论 714 浏览
sCM sCM是一种由OpenAI开发的基于扩散模型的连续时间一致性模型,通过简化理论框架与优化采样流程,实现了图像生成速度的大幅提升。该模型仅需两步采样即可生成高质量图像,且速度比传统扩散模型快50倍。得益于连续时间框架和多项技术改进,sCM不仅提高了训练稳定性,还提升了生成质量。其应用场景广泛,包括视频生成、3D建模、音频处理及跨媒介内容创作,适用于艺术设计、游戏开发、影视制作等多个行业。 AI项目与工具 2025年06月12日 50 点赞 0 评论 718 浏览
UniScribe 一个帮你更快的从音视频中获取信息的音视频转录和翻译工具。UniScribe能快速将本地音频、视频文件或 YouTube 视频转化为简短摘要,帮助您轻松掌握要点,支持98种语言。 Ai办公效率 2025年06月05日 33 点赞 0 评论 720 浏览