学习

Video2PPT

一个开源、免费的可以将任意视频智能转换为精美PPT的工具,它支持多种视频来源,包括本地视频文件、在线视频链接(如 YouTube、Bilibili 等),还支持实时录屏。

Melty

Melty是一款开源的AI编程助手,旨在提升开发者的编码效率和代码质量。它能够实时理解开发者从终端到GitHub的编码内容,提供智能协作和代码生成。Melty具备学习能力,能够适应并模仿开发者的编程风格,与编译器、调试器等开发工具无缝集成。此外,它还支持代码重构、Web应用开发以及大型代码库的浏览等高级功能。通过自然语言处理、机器学习、代码生成和上下文感知等技术,Melty不仅提高了代码的质量和稳

OpenVoice

OpenVoice是一款由MyShell开发的免费开源AI语音克隆工具,其主要功能包括精准的音色和音调克隆及灵活的语音风格控制。该工具能够捕捉并复制不同语言或口音的音色,生成自然流畅的语音,并支持零样本跨语言语音克隆。开发者可以通过GitHub项目地址进行本地安装和运行,也可以通过Lepton AI、MyShell或HuggingFace提供的在线演示体验该工具。

MagicSchool AI

MagicSchool AI 是一款利用生成式AI的工具,旨在帮助教师在课堂中应用生成式AI。

Vocloner

Vocloner是一款基于人工智能的在线语音克隆工具,用户可通过上传目标语音音频并输入文本,快速生成克隆声音,无需训练语音网络。支持多语言及多种中文方言,提供经典版本和更新版本两种克隆选项,经典版使用Coqui TTS技术,更新版采用Coqui AI的XTTS工具,增强克隆效果。功能包括即时语音克隆、模型创建与保存、多语言支持、不同说话风格和角色模仿,适用于内容创作、无障碍支持、语言学习和个性化数

WarriorCoder

WarriorCoder是由华南理工大学与微软联合开发的代码生成大语言模型,采用专家对抗机制生成高质量训练数据,无需依赖专有模型或数据集。它具备代码生成、优化、调试、推理及多语言支持等功能,在代码生成、库使用等任务中达到SOTA性能,适用于自动化开发、教育辅助及跨语言转换等场景。模型通过Elo评分系统和裁判评估确保训练数据质量,提升泛化能力与多样性。

TEN VAD

TEN VAD是一款高性能的实时语音活动检测系统,专为企业级应用设计。它基于深度学习技术,能够精确区分语音和非语音信号,具有低延迟、轻量级和高精度的特点。支持多种平台和编程接口,适用于智能助手、客服机器人等场景,帮助构建更高效、更智能的对话系统。

DrawingSpinUp

DrawingSpinUp 是一种基于深度学习的3D动画生成技术,可将平面绘画转化为动态三维动画,同时保持原画风格。其核心技术包括轮廓线去除、几何细化、纹理合成及3D模型重建,适用于数字艺术、游戏开发、影视特效以及教育领域,大幅提升了创作效率和视觉表现力。

WorldMem

WorldMem是由多所高校与研究机构联合开发的AI世界生成模型,通过引入记忆机制解决传统模型在长时间序列生成中的一致性问题。它支持动态环境模拟、多场景交互及长期一致性保持,适用于虚拟游戏、VR/AR、自动驾驶等多个领域,具备高度真实性和可扩展性。

FaceSwap AI

FaceSwap是一个功能强大且用户友好的在线换脸工具,利用AI技术提供快速、高质量的换脸效果。无论是个人娱乐还是专业项目,FaceSwap都能满足用户的需求。