AI项目与工具

CleanS2S

CleanS2S是一款流式语音到语音交互智能体原型，通过集成自动语音识别（ASR）、大型语言模型（LLM）、文本到语音（TTS）以及WebSockets等技术，提供高质量、实时的语音交互体验。它支持全双工交互和打断功能，可整合网络搜索和RAG模型以增强回答能力，适用于客户服务、智能家居控制、教育辅助、健康咨询及车载系统等多个领域。

AI项目与工具 2025年06月12日 99 点赞 0 评论 849 浏览

PDF2Audio

PDF2Audio 是一款开源工具，支持将 PDF 文档转换为音频内容，适用于播客制作、教育、业务演示等多个场景。其核心功能包括 PDF 转文本、生成播客脚本、文本转语音转换、多语言支持及高级编辑功能。用户可通过自定义选项调整文本生成模型、语音风格等，支持批量处理和多种模板适配，方便用户根据需求生成高质量音频。

AI项目与工具 2025年06月12日 35 点赞 0 评论 893 浏览

CustomCrafter

CustomCrafter是一个由腾讯和浙江大学合作开发的自定义视频生成框架，能够根据文本提示和参考图像生成高质量的个性化视频。该框架支持自定义主体身份和运动模式，具备文本提示生成视频、保留运动生成能力和概念组合能力等功能。其核心技术包括视频扩散模型、空间主题学习模块和动态加权视频采样策略等，广泛应用于影视制作、虚拟现实、游戏开发、广告营销和社交媒体内容创作等领域。

AI项目与工具 2025年06月12日 31 点赞 0 评论 856 浏览

RuoYi AI

RuoYi AI 是一个集成了本地 RAG 方案和多模型支持的全栈式 AI 开发平台，提供高效的代码管理、数据隐私保护和丰富的多媒体功能。支持多种大语言模型接入，具备微信扩展、插件系统和支付接口，适用于企业及个人开发者构建智能应用。

AI项目与工具 2025年06月12日 42 点赞 0 评论 550 浏览

WhisperChain

WhisperChain 是一款开源语音识别工具，支持实时语音转文本并提供文本优化功能，可去除填充词、优化语法。用户可通过全局热键快速启动语音输入，处理结果自动复制到剪贴板。支持 Streamlit 界面与 FastAPI 架构，适用于会议记录、写作辅助等场景。

AI项目与工具 2025年06月12日 57 点赞 0 评论 740 浏览

超算互联网

超算互联网是国家级算力服务平台，整合全国超算与智算资源，提供算力调度、AI模型服务、SaaS平台、数据支持及技术支持。支持DeepSeek、Qwen等AI模型的在线推理、API部署和私有化开发，适用于科研、工业、企业数字化、人工智能及教育等多个领域，推动算力普惠与科技创新。

AI项目与工具 2025年06月12日 25 点赞 0 评论 884 浏览

MangaNinja

MangaNinja是一款基于参考图像的线稿上色工具，采用Reference U-Net和Denoising U-Net架构，结合补丁重排模块与点驱动控制方案，实现高精度、细粒度的上色效果。其可处理复杂场景、多参考图像协调及极端姿势等问题，广泛应用于漫画创作、插画设计、平面设计和数字艺术等领域。

AI项目与工具 2025年06月12日 66 点赞 0 评论 839 浏览

Samwell.ai

Samwell.ai是一款利用人工智能技术打造的写作平台，主要服务于学术界和专业人士。它提供了强大的抄袭检测功能、多种引用格式支持以及全球学术资源访问权限，同时具备扩展段落和应用批判性思维等高级编辑能力，以提升用户的写作质量和效率。无论是撰写学术论文、课程作业还是商业计划，Samwell.ai都能提供全面的支持。

AI项目与工具 2025年06月12日 43 点赞 0 评论 681 浏览