AI

ElevenLabs Flash

ElevenLabs Flash是一款专为对话型AI设计的低延迟语音合成模型,支持多种语言,能够以极短的延迟(75毫秒)生成高质量语音,广泛应用于虚拟助手、客户服务、语音播报、教育及娱乐等领域,为用户提供即时反馈和沉浸式体验。该工具以其高效性和灵活性成为超低延迟语音合成领域的领先解决方案。

Refly Ai

一款基于自由画布构建的AI原生内容创作平台,通过多线程对话、知识库整合、上下文记忆、智能搜索和AI文档编辑器等功能,轻松将想法转化为优质内容。

Upheal

Upheal是一款面向心理健康专业人士的AI平台,提供自动化的进展记录和视频会话功能。它支持多种治疗形式和多语言环境,具备会话分析、笔记编辑和模板自定义等功能,并可与EHR系统集成。其灵活的定价方案适用于不同需求,助力治疗师提升工作效率,专注于核心治疗工作。

StreamBridge

StreamBridge是一款由苹果与复旦大学联合开发的端侧视频大语言模型框架,支持实时视频流的理解与交互。通过内存缓冲区和轮次衰减压缩策略,实现长上下文处理与主动响应。项目配套发布Stream-IT数据集,包含60万样本,适用于多种视频理解任务,展现出在视频交互、自动驾驶、智能监控等领域的应用前景。

MoshiVis

MoshiVis是一款由Kyutai开发的开源多模态语音模型,支持图像与语音的自然交互。它基于Moshi 7B架构,集成了视觉编码器和跨注意力机制,实现低延迟、自然流畅的对话体验。支持多种后端部署,适用于无障碍应用、智能家居、教育及工业场景,提升人机交互的智能化水平。

Emote

Emote是一款基于AI技术的智能笔记工具,支持实时语音转录、情感分析及关键词提取等功能。它能帮助用户记录生活、管理时间、分析消费习惯,并提供私人笔友服务以实现情感支持。同时,Emote允许用户自定义笔记本和标签,满足个性化需求。

AiFaceSwap

一款在线AI换脸工具,用户可以轻松添加人脸图像和目标图像,然后使用AiFaceSwap进行换脸,得到逼真的换脸效果、搞笑创作、名人变身。

TreeMind树图 | 思维导图

TreeMind树图是基于AI人工智能的在线思维导图工具。提供海量知识导图、素材资源,支持一键AI生成导图;分屏浏览,边看资料边做导图。

YuE

YuE 是一款由香港科技大学与 Multimodal Art Projection 联合开发的开源 AI 音乐生成模型,支持多语言和多种音乐风格,如流行、金属、爵士、嘻哈等。通过语义增强音频分词器、双分词技术和三阶段训练方案,解决长上下文处理与音乐生成难题,生成结构连贯、旋律优美的歌曲。模型完全开源,用户可自由使用和定制,适用于音乐创作、影视配乐、游戏音效及社交媒体内容制作等多个场景。