AI

YuE

YuE 是一款由香港科技大学与 Multimodal Art Projection 联合开发的开源 AI 音乐生成模型,支持多语言和多种音乐风格,如流行、金属、爵士、嘻哈等。通过语义增强音频分词器、双分词技术和三阶段训练方案,解决长上下文处理与音乐生成难题,生成结构连贯、旋律优美的歌曲。模型完全开源,用户可自由使用和定制,适用于音乐创作、影视配乐、游戏音效及社交媒体内容制作等多个场景。

PaperOMG

PaperOMG是一款集论文写作、查重、降重和PPT制作于一体的AI辅助工具,支持开题报告、文献综述和初稿撰写等功能。其查重系统基于指纹比对技术,覆盖大量学术资源,准确率高。平台还提供多种查重版本及降重策略,帮助用户提升论文原创性,保障学术规范。

Vocalist.ai

一款可以使用定制的声乐模型将人声录音转换为专业品质的歌唱和说唱表演的录音室级AI声音转换工具,在几秒钟内将您的声音转变为世界一流的歌手和说唱歌手。

ArtSmart AI

一款利用AI训练的艺术和写实模型生成独特惊艳的图像的AI图像生成器。它能够将想象力变成现实,帮助用户将他们的想法变成美丽的艺术品。

Step

覆盖了从个人使用到企业级应用的多个方面的多模态大模型。

MinerU

MinerU是一款开源智能数据提取工具,专注于复杂PDF文档的高效解析与提取。它能够将包含多种内容类型的PDF文档转换为结构化的Markdown格式,支持图像、公式、表格和文本等多种内容处理,保留原始文档结构和格式,支持公式识别与转换成LaTeX格式,自动删除页眉、页脚、脚注和页码等非内容元素,适用于学术、财务、法律等多个领域。

ElevenLabs Flash

ElevenLabs Flash是一款专为对话型AI设计的低延迟语音合成模型,支持多种语言,能够以极短的延迟(75毫秒)生成高质量语音,广泛应用于虚拟助手、客户服务、语音播报、教育及娱乐等领域,为用户提供即时反馈和沉浸式体验。该工具以其高效性和灵活性成为超低延迟语音合成领域的领先解决方案。

Refly Ai

一款基于自由画布构建的AI原生内容创作平台,通过多线程对话、知识库整合、上下文记忆、智能搜索和AI文档编辑器等功能,轻松将想法转化为优质内容。

Upheal

Upheal是一款面向心理健康专业人士的AI平台,提供自动化的进展记录和视频会话功能。它支持多种治疗形式和多语言环境,具备会话分析、笔记编辑和模板自定义等功能,并可与EHR系统集成。其灵活的定价方案适用于不同需求,助力治疗师提升工作效率,专注于核心治疗工作。