AI项目与工具

OuteTTS

OuteTTS是一款基于开源技术的文本到语音(TTS)工具,利用纯语言建模方法生成自然语音。它支持语音克隆和自定义说话人声音,具备音频标记化、CTC强制对齐和结构化提示创建等功能。OuteTTS与llama.cpp和GGUF格式兼容,适用于有声读物、智能客服、语音导航等多种应用场景。

Samsung Gauss2

Samsung Gauss2是一款由三星推出的第二代多模态生成式AI模型,具备处理文本、代码和图像等多类型数据的能力。它通过引入知识图谱技术和专家混合技术,实现了个性化服务和高效的任务执行。此外,该模型还支持多种语言及编程语言,并能在无网络环境下独立运行,广泛适用于智能手机、平板电脑、笔记本电脑以及企业级应用场景。

VoiceDub

VoiceDub 是一款AI驱动的音频处理平台,支持人声替换、声音克隆、文本转语音及音频分离等功能,提供超过10,000种AI人声音色。用户可通过平台进行音乐创作、有声内容制作及个性化音频生成,适用于多种应用场景,如语言学习、娱乐互动等。

II

II-Agent 是一个开源的 Agent 框架,通过与大型语言模型(LLM)交互,简化和提升跨领域的工作流程。其核心功能包括研究与事实核查、内容生成、数据分析与可视化、软件开发、工作流自动化及问题解决等。具备动态上下文提示、智能 token 管理、规划与反思能力、多模态处理以及实时通信等功能。支持 CLI 和 WebSocket 接口,适用于智能客服、金融投顾、医疗诊断和教育辅导等多种场景。

BioMedGPT

BioMedGPT-R1是由清华大学AI产业研究院与北京水木分子生物科技联合开发的多模态生物医药开源大模型。基于DeepSeek R1技术,实现生物模态(如分子、蛋白质)与自然语言的统一融合,支持跨模态问答与深度推理。该模型在药物分子理解、靶点挖掘等领域表现优异,适用于药物设计、临床前研究及医学文本分析等多种场景,具备较高的文本推理能力和多模态处理能力。

点点

点点是一款以生活服务为核心的AI搜索应用,主要功能涵盖生活经验总结、精准避坑指南、真实用户反馈及及时信息更新。它支持用户通过文字、图片或视频形式提问,并提供互动式问答体验,旨在满足用户在日常生活中多方面的实际需求。

Audio Decomposition

Audio Decomposition 是一款基于傅里叶变换和信封匹配技术的开源音频处理工具,能够分离音乐中的不同乐器声音并生成乐谱。它支持音乐转录、教育、制作及分析,通过深度音频处理为用户提供了强大的音乐解析能力。

cpmGO

cpmGO是面壁智能推出的端侧智能助手,专为汽车座舱设计,支持多模态交互与本地化处理,保障隐私并适应弱网环境。其基于MiniCPM模型优化,具备智能任务处理、快速响应及灵活定制能力,适用于多种智能汽车场景,提升人车交互的便捷性与安全性。

Medeo

Medeo是一款基于AI技术的视频创作平台,能够将文字描述自动转化为高质量视频。它具备智能文生视频、素材匹配、AI配音、音乐推荐、URL转视频及动画生成等功能,广泛应用于内容创作、企业营销、教育培训、个人娱乐和新闻媒体等多个领域。平台集成了多种先进AI模型,提升视频制作效率与创意表现力,是创作者的理想工具。

BrushEdit

BrushEdit是一款基于多模态大型语言模型和双分支图像修复模型的先进图像编辑框架,支持用户通过自然语言指令进行自由形式的多轮交互式编辑操作。其核心功能包括指令引导的图像编辑、多轮交互式编辑、自由形式掩码编辑、背景与前景处理以及图像修复。该工具通过特征融合、零卷积层和混合微调策略,实现了对编辑区域的精准控制和背景的无缝衔接,适用于内容创作、影视修复、广告设计、社交媒体分享及电商产品图片优化等多个