深度学习
Magic Copy
Magic Copy是一款基于开源技术的AI图像处理工具,支持Chrome浏览器扩展。它利用Meta的Segment Anything Model技术,实现图像中前景对象的自动识别与提取。用户可将提取的内容直接复制到剪贴板或下载保存,广泛应用于设计、教育、电商及办公等领域,提升工作效率。
NSFW Detector
NSFW Detector是一款基于深度学习的开源工具,利用Google的`vit-base-patch16-224-in21k`模型,能够在CPU环境中高效检测图像、PDF、视频及压缩包内的不适宜内容。该工具支持API集成与Docker部署,具备多CPU加速特性,可实现快速且安全的本地化内容分类,广泛应用于社交媒体、内容共享平台、企业网络等多个领域。
MyTimeMachine
MyTimeMachine是一款基于深度学习的面部年龄转换工具,支持高质量的年龄回退与进展效果,同时保持个体身份特征。它通过适配器网络结合个性化与全局老化特征,能够生成高分辨率、逼真的静态图像及时间一致的视频老化效果。此外,MyTimeMachine在身份保持、外推能力及视频扩展方面具有显著优势,并广泛应用于影视制作、广告、法医学、历史重现及个人娱乐等领域。
Micro LLAMA
Micro LLAMA 是一款基于简化版 Llama 3 模型的教学工具,通过约 180 行代码实现 8B 参数的最小化模型,支持自注意力机制和前馈神经网络。它提供 Jupyter 笔记本和 Conda 环境配置指南,帮助用户轻松学习和实验,特别适用于学术教学、研究开发和个人学习。
Fish Speech 1.5
Fish Speech 1.5是一款基于深度学习的文本转语音(TTS)工具,支持多语言文本输入,通过Transformer、VITS、VQVAE和GPT等技术实现高质量语音合成。它具备零样本和少样本语音合成能力,延迟时间短,无需依赖音素,泛化性强,且支持本地化部署。Fish Speech 1.5可应用于有声读物、辅助技术、语言学习及客户服务等多个领域。