AI项目与工具

moonshot

moonshot-v1-vision-preview 是一款由月之暗面开发的多模态图像理解模型，具备精准的图像识别、OCR 文字识别和数据解析能力。支持 API 集成，适用于内容审核、文档处理、医学分析、智能交互等多个领域。模型可识别复杂图像细节、分析图表数据，并从美学角度进行图像评价，适合需要高效图像处理和智能交互的应用场景。

AI项目与工具 2025年06月12日 52 点赞 0 评论 716 浏览

Prometheus

Prometheus是一款基于潜在扩散模型的3D生成工具，能够从文本描述中快速生成高质量、高保真的3D场景。其核心技术包括两阶段训练框架、RGB-D潜在空间解耦、前馈生成策略和无分类器引导，确保生成结果在视觉和几何上的准确性与一致性。适用于内容创作、游戏开发、建筑设计等多个领域，显著提升了3D内容生成的效率和质量。

AI项目与工具 2025年06月12日 27 点赞 0 评论 716 浏览

清言PPT

清言PPT是一款基于人工智能技术的PPT生成工具，支持从文本、文件或网址快速生成高质量PPT大纲。它具备强大的文本处理能力，支持长达2万字的输入，并提供多样化的模板选择。用户可以手动编辑大纲、利用AI优化内容，最终实现自动化排版与设计，适用于职场、教育及营销等多个领域。

AI项目与工具 2025年06月12日 91 点赞 0 评论 717 浏览

NLWeb

NLWeb是微软推出的开源项目，旨在通过自然语言界面简化网站交互，使网站成为AI驱动的应用程序。它利用半结构化数据（如Schema.org、RSS）和LLM工具，提供自然语言交互、内容发现、智能体交互等功能。支持MCP协议，实现与AI助手的无缝对接，具备跨平台和高度可扩展性，适用于零售、餐饮、旅游、新闻及客服等多种场景。

AI项目与工具 2025年06月11日 50 点赞 0 评论 717 浏览

OpenAudio S1是Fish Audio推出的文本转语音（TTS）模型，基于200万小时音频数据训练，支持13种语言。采用双自回归架构和RLHF技术，生成自然流畅的语音，支持50多种情感和语调标记。具备零样本和少样本语音克隆功能，仅需10到30秒音频即可生成高保真声音。适用于视频配音、播客、游戏角色语音、虚拟助手、游戏娱乐、教育培训及客服系统等场景。提供40亿参数完整版和5亿参数开源版，满足

AI项目与工具 2025年06月11日 28 点赞 0 评论 717 浏览