VoxInstruct VoxInstruct是清华大学开源的语音合成技术,能够根据人类语言指令生成高质量的语音。该系统采用统一的多语言编解码器语言建模框架,将传统的文本到语音任务扩展到了更广泛的人类指令到语音任务。VoxInstruct通过引入语音语义标记和多种无分类器指导策略,提升了语音合成的自然度和表现力。它支持多语言和跨语言合成,适用于智能语音助手、有声读物、教育培训等多个领域。 AI项目与工具 2025年06月12日 79 点赞 0 评论 603 浏览
PDF2Audio PDF2Audio 是一款开源工具,支持将 PDF 文档转换为音频内容,适用于播客制作、教育、业务演示等多个场景。其核心功能包括 PDF 转文本、生成播客脚本、文本转语音转换、多语言支持及高级编辑功能。用户可通过自定义选项调整文本生成模型、语音风格等,支持批量处理和多种模板适配,方便用户根据需求生成高质量音频。 AI项目与工具 2025年06月12日 35 点赞 0 评论 603 浏览
Poe AI新功能「Previews」 Poe AI是一个集成多个强大AI聊天机器人的平台,用户可以通过统一界面与多个AI聊天机器人互动,获得多样化的信息和解决方案。Poe AI的新功能“Previews”允许用户实时预览AI生成的Web应用,支持交互体验,简化编程和设计流程,提高开发效率。该功能支持多种类型的应用程序,包括游戏、文本编辑器、数据分析工具等。用户可以与多个AI聊天机器人进行对话,并且可以无缝切换,获取不同的解决方案或优化 AI项目与工具 2025年06月12日 77 点赞 0 评论 602 浏览
Kimi浏览器插件 Kimi浏览器插件是一款集成即时问答、全文摘要和划线互动功能的工具,支持用户通过划线提问获取上下文相关答案,并可一键生成文章摘要,提高阅读效率。划线互动功能还允许用户查看其他用户对特定文本的疑问和解答,增强社区互动。插件兼容多种浏览器,提供简洁的用户体验,适用于学术研究、资料查询、学习新知识、专业信息检索、内容创作等多个应用场景。 AI项目与工具 2025年03月03日 81 点赞 0 评论 602 浏览
A1.art A1.art是一款结合AI技术的在线艺术创作平台,提供超3400种艺术风格选择,支持从静态到动态(GIF)的多样化创作需求。平台兼具智能推荐、社区互动及个性化服务功能,适用于个人、设计师、企业和教育领域的艺术创作与教学应用。 AI项目与工具 2025年06月12日 82 点赞 0 评论 602 浏览
Caveduck 一个AI角色扮演聊天服务,支持中、英、日韩等多语言,提供多种LLM选择,RWD支援良好,任何设备开启网页即用,无需App。 AI写作对话 2025年06月05日 15 点赞 0 评论 601 浏览
LearnCoach LearnCoach 是一款面向 K12 学生的 AI 学习平台,提供个性化课程、智能辅导和多种学习模式,如辅导课程与视频播放列表。平台包含丰富的视频教程和考试题库,帮助学生掌握重点知识,提升学习效率。支持语音输入与全天候访问,适用于日常学习、考前复习及课堂教学辅助,助力学生高效学习与成绩提升。 AI项目与工具 2025年06月12日 53 点赞 0 评论 601 浏览
33字幕 33字幕是一款集语音识别与文本翻译于一体的AI字幕生成工具,支持多种语言的语音转文字及翻译,可实现实时字幕生成与同步翻译。用户可通过本地AI模型免费运行,显著降低使用成本。该工具具备边识别边生成字幕、台词搜索等功能,广泛应用于视频创作、教育培训、企业会议等领域。 AI项目与工具 2025年06月12日 73 点赞 0 评论 600 浏览