语音

蚂小财

蚂小财是一款由蚂蚁集团开发的AI金融助手,基于自主研发的大模型技术,为用户提供实时市场热点解读、个性化理财建议和复杂财报的图文解读等功能。支持语音控制和定制简报服务,连接多家专业金融机构,适用于日常理财咨询、投资决策支持和金融知识普及等多种场景。

EzAudio

EzAudio是一款基于文本到音频(Text-to-Audio, T2A)生成模型,通过优化的扩散变换器架构和高效的数据训练策略,实现了快速生成高质量音频的功能。它支持多种应用场景,如音乐创作、影视后期制作、语音合成等,并具备高保真度和低资源消耗的特点。

Ichigo

Ichigo是一款开源的多模态AI语音助手,采用混合模态模型,支持实时处理语音和文本交织序列。它通过统一的Transformer架构实现跨模态联合推理,提供低延迟的实时性能,并支持多语言、多轮对话及模糊输入处理。Ichigo适用于智能家居、个人助理、客户服务、教育和健康咨询等多种应用场景,展现了高效、灵活的技术优势。

熊猫字幕

一款专业的在线字幕网站,提供自动在线字幕生成,视频音频字幕生成,字幕制作,语音转字幕,语音自动生成字幕,字幕翻译,字幕格式转换等各种字幕功能。

猫头音

猫头音是一款基于深度学习技术的AI配音与翻唱工具,支持将文字转化为高质量语音输出,并提供多样化音色选择及丰富的音频处理功能。用户可通过简单操作实现个性化配音、修音翻唱以及音频编辑,广泛适用于视频创作、广告制作、有声读物开发及音乐翻唱等多个领域。

ChatGPT Windows客户端

ChatGPT Windows客户端是一款为Windows用户打造的桌面应用程序,支持快捷键调用、截图发送、文件上传、图片拖拽、对话搜索及语音交互等功能。它旨在提升用户的工作效率,涵盖学术研究、编程开发、内容创作、客户服务和语言学习等多个领域。目前处于测试阶段,未来将全面开放。

TurboTTS

TurboTTS是一款支持多语言的在线文本转语音工具,提供300多种真实语音选择,生成自然流畅的语音效果。适用于短视频、教育、广告及播客等多种场景,操作简单,支持多种音频格式下载,并可合法用于商业用途。凭借AI技术,用户能高效完成语音内容制作,满足多样化需求。

easegen

Easegen 是一款开源的 AI 工具,支持数字人课程的制作与管理。它能够批量生成 PPT 课件、克隆数字人形象和声音,并通过 AI 技术实现视频渲染和智能出题。其核心功能包括课程制作、视频管理、智能课件生成、数字人克隆及声音克隆,旨在提升教学内容的互动性和趣味性。Easegen 的技术基础涵盖人工智能、计算机视觉、自然语言处理和语音合成等,适用于在线教育、企业培训、学术研究、语言学习及职业培训

Aider

Aider 是一款开源 AI 编程辅助工具,支持多语言开发,集成多种大型语言模型,通过命令行实现代码编辑、自动提交和多文件处理。具备语音编程、图片交互等功能,提升开发效率。适用于新项目搭建、代码修复、重构及团队协作,支持与主流 IDE 集成,提供流畅的开发体验。

Notato

Notato 是一款基于 AI 的笔记应用,支持音频、视频、文档及网页内容的自动转录与结构化整理,生成摘要、闪卡和测验,适用于学习、会议、资料整理等多种场景。其具备多语言翻译、错题分析、后台录音等功能,提升信息处理与知识管理效率。