音频

Allavsoft

一款专业的视频下载和转换工具,Allavsoft支持从 YouTube、Spotify、Vimeo 等 10000 多个网站下载视频和音频。用户可以轻松下载高清视频、音乐视频、播放列表等,并将其转换为 MP4、MP3、AVI 等多种格式。

存了个图

一款支持从国外主流网站下载视频和图片的专业下载工具,存了个图提供从平台如YouTube、Instagram、TikTok、Pinterest、Facebook、Rumble、Triller、Likee、Vimeo、Nicovideo、Reddit 等下载视频、图片和字幕,并支持4K分辨率下载与编辑功能。

万彩录课大师

一款免费的PPT微课录制工具,万彩录课大师集PPT录制、真人录音、虚拟人物讲解与后期编辑于一体,专注于各种PPT课件课程的录制和编辑。

AI绘画箱

AI绘画箱收录近千个AI绘画工具网站,提供Midjourney、Stable Diffusion等一站式AI绘画工具、AI图片处理工具、AI素材下载、AI视频音频等工具,只做最好的AI绘画工具网址导航站。

Whisper语音识别模型

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。

QuickRecorder

一款基于ScreenCapture Kit for macOS的轻量级录屏工具/基于 ScreenCapture Kit的多功能、轻量化、高性能的开源macOS屏幕录制工具。

Emote Portrait Alive

阿里巴巴发布的EMO,一种音频驱动的AI肖像视频生成框架。通过输入单一的参考图像和语音音频,Emote Portrait Alive可以生成动态的、表情丰富的肖像视频。

BuboGPT | 字节大模型

BuboGPT是由字节跳动开发的大型语言模型,能够处理多模态输入,包括文本、图像和音频,并具有将其响应与视觉对象相对应的独特能力。

Gemini

Gemini是Google DeepMind推出的全新AI模型,集成了多模态推理功能,超越了以往模型的性能,适用于科学文献洞察、竞争性编程等多种应用场景。

GPT智库

一款强大的人工智能大模型综合应用,提供智能对话、文生图、图生图、音频翻译、图像分析和全球学术资料搜索等多种功能。