Speech Studio Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法,可以访问诸如实时语音到文本、自定义语音识别模型、发... Ai语音工具 1970年01月01日 0 点赞 0 评论 313 浏览
Gemini 2.0 Gemini 2.0 是谷歌推出的原生多模态AI模型,具备快速处理文本、音频和图像的能力,支持多语言输出和实时音视频流输入。通过Agent技术和工具调用,Gemini 2.0 能够自主理解任务并提供解决方案,已在编程、数据分析、游戏等领域展示应用潜力。目前提供免费试用,计划逐步开放更多功能。 AI项目与工具 2025年06月12日 63 点赞 0 评论 312 浏览
Riffusion 一种旨在生成实时音乐的工具,可以实现稳定的实时音乐生成扩散。它特别适合创作包含民谣、蓝调、放克、爵士乐和其他流派元素的音乐作品。 Ai语音工具 2025年06月05日 92 点赞 0 评论 310 浏览
Hertz Hertz-Dev是一款由Standard Intelligence开发的开源音频模型,专注于低延迟实时对话AI。它具备强大的音频生成与处理能力,能够处理和生成高质量的音频信号,并支持多任务微调,适用于语音识别、语音合成等多种应用场景。此外,Hertz-Dev还提供了音频自动编码、流式生成等功能,广泛应用于智能助手、客户服务、语音识别及合成等领域。 AI项目与工具 2025年06月12日 48 点赞 0 评论 309 浏览
ReHiFace ReHiFace-S是一款由硅基智能团队开发的开源AI项目,专注于高保真、实时的人脸替换。该算法具备无需数据训练、高保真度换脸、支持多目标人脸替换、色彩矫正、一键快速部署、Gradio交互界面及支持ONNX格式等特点。ReHiFace-S适用于娱乐、影视制作、VR/AR等多个领域,具有实时处理能力、零样本推理、改进的人脸分割模型等功能。 AI项目与工具 2025年06月12日 97 点赞 0 评论 308 浏览
Buzz Buzz是一款基于OpenAI Whisper模型的离线语音转文字工具,支持实时语音转文字和音频视频文件转录。它具备多语言识别和翻译功能,支持多种格式导出,并能在本地离线操作以保护用户隐私。主要应用于视频字幕制作、采访记录整理、语言学习辅助、会议记录和学术研究等场景。 AI项目与工具 2025年06月12日 10 点赞 0 评论 304 浏览
SwiftAgent 2.0 SwiftAgent 2.0 是一款依托于大模型与 AI Agent 技术的企业级数据分析工具,旨在帮助企业实现从数据到决策的智能化升级。其主要特点包括统一语义层构建、多源数据集成、实时交互体验以及持续学习优化机制,广泛应用于业务决策支持、销售预测、客户洞察及财务规划等多个领域。 AI项目与工具 2025年06月12日 60 点赞 0 评论 304 浏览
Superhuman Superhuman是一款AI驱动的电子邮件客户端,提供智能分类、快速回复、阅读状态追踪及团队协作等功能,帮助用户提升邮件管理效率。它还具备社交洞察与日历集成特性,支持用户在一个平台内全面掌控邮件和日程安排,从而专注核心任务。 AI项目与工具 2025年06月12日 100 点赞 0 评论 303 浏览
Shop AI Shop AI是一款集成了AI技术的购物助手,提供包括个性化购物建议、快速结账服务(Shop Pay)、实时订单追踪及奖励机制(Shop Cash)等功能。用户可以通过此应用享受长达12个月的免息分期付款,并通过购物赚取现金回馈。此外,它还具有高评价的移动应用程序,便于用户管理订单和享受便捷的购物流程。 AI项目与工具 2025年06月12日 55 点赞 0 评论 303 浏览