InspireMusic InspireMusic是由阿里巴巴通义实验室开发的AI音乐生成工具,支持通过文字描述或音频提示生成多种风格的音乐作品。其核心技术包括音频 tokenizer、自回归 Transformer 模型、扩散模型(CFM)和 Vocoder,实现文本到音乐的转换、音乐续写及高质量音频输出。该工具支持长音频生成、多种采样率,并提供快速与高音质两种推理模式,适用于音乐创作、音频处理及个性化音乐生成等场景。 AI项目与工具 2025年06月12日 83 点赞 0 评论 728 浏览
EliGen EliGen是由浙江大学与阿里巴巴集团联合开发的实体级可控图像生成框架,采用区域注意力机制实现对图像中实体的精确控制,支持多实体修复、风格化生成及交互式编辑。基于50万高质量注释样本训练,具备强大泛化能力,适用于虚拟场景、角色设计、数据合成及产品展示等场景。 AI项目与工具 2025年06月12日 97 点赞 0 评论 728 浏览
iTextMaster iTextMaster是一款AI驱动的文本分析与交互工具,支持用户通过对话形式快速总结PDF文档和网页内容,具备精准搜索与智能推荐功能。它广泛应用于学术研究、法律行业、商业分析、教育以及项目管理等领域,助力用户高效处理信息并提升工作效率。 AI项目与工具 2025年06月12日 87 点赞 0 评论 728 浏览
ChatTS ChatTS-14B 是一款由字节跳动开发的大型语言模型,专为时间序列数据的理解与推理设计,具备 140 亿参数规模。通过合成数据对齐技术提升任务表现,支持自然语言交互,可应用于金融、气象、工业、医疗和运维等多个场景,提供数据分析、预测与诊断功能。模型已开源,便于开发者使用和扩展。 AI项目与工具 2025年06月11日 73 点赞 0 评论 728 浏览
Aqua Voice Aqua Voice 是一款AI驱动的语音转录与文档编辑工具,支持语音转文字、自然语言指令编辑、自动格式优化及多语言处理。它适用于高效写作、辅助输入及跨平台办公场景,兼容多种主流应用,提升文本创作效率与准确性。 AI项目与工具 2025年06月11日 81 点赞 0 评论 728 浏览
RealtimeSTT RealtimeSTT是一款开源的实时语音转文本库,具备高精度语音活动检测、GPU加速的实时转录能力以及语音唤醒功能。支持多语言识别,适用于语音助手、会议记录、实时字幕等场景,提供灵活的音频输入与预处理机制,便于开发者快速集成和扩展。 AI项目与工具 2025年06月12日 97 点赞 0 评论 728 浏览
LightPDF LightPDF是一款基于AI的在线PDF处理工具,支持格式转换、OCR识别、文本编辑、注释标注、水印添加、页面操作、加密解密、数字签名等功能。用户可通过智能聊天功能提取文档关键信息并生成摘要,支持多语言处理。适用于文献管理、内容创作、移动扫描及文件处理等多种场景。 AI项目与工具 2025年06月12日 17 点赞 0 评论 728 浏览
通往AGI之路 《通往 AGI 之路》! 这里旨在提供一个全面系统、易于理解的 AI 学习路径,帮助您了解 AI 从概念到应用等各方面知识。 Ai学习资源 2025年06月05日 10 点赞 0 评论 728 浏览
OpenScholar OpenScholar是一款由华盛顿大学与艾伦AI研究所联合研发的检索增强型语言模型,专为科学家设计,能够高效检索并综合海量科学文献信息,生成基于文献的事实性回答。该工具具备强大的跨学科适用性,涵盖计算机科学、生物医学等多个领域,同时支持自我反馈迭代优化,显著提升回答质量和引用可靠性。所有相关资源已完全开源,便于全球学者使用与研究。 AI项目与工具 2025年06月12日 30 点赞 0 评论 729 浏览
Bing Video Creator Bing Video Creator是微软推出的AI视频生成工具,基于OpenAI的Sora模型,用户可通过输入文本描述快速生成5秒短视频。支持9:16格式,提供快速模式和标准模式,初始有10次免费生成机会。功能包括视频生成、多种风格选择、视频存储和分享等,适用于广告、教学、创意和个人娱乐等多种场景。 AI项目与工具 2025年06月11日 80 点赞 0 评论 729 浏览