AI

滴食

滴食通过其智能计时和同步功能,使得烹饪变得更加轻松和愉快,无论是对于烹饪新手还是经验丰富的厨师。

Dream Machine AI

Luma Labs 开发的一种先进的AI模型,可以通过文本和图像快速生成运动流畅、具有电影品质和戏剧元素的 5 秒视频剪辑,将静态快照转变为动态故事。

ChildMandarin

ChildMandarin是由智源研究院与南开大学合作开发的3-5岁儿童普通话语音数据集,包含41.25小时高质量语音,覆盖全国22个省市。数据通过家长引导式对话采集,保证自然真实。该数据集支持语音识别、说话人验证和语言研究,适用于儿童语言学习、教育系统、智能玩具和语音助手优化等领域,为儿童语音技术研究提供重要资源。

WorldSense

WorldSense是由小红书与上海交通大学联合开发的多模态基准测试工具,用于评估大型语言模型在现实场景中对视频、音频和文本的综合理解能力。该平台包含1662个同步视频、3172个问答对,覆盖8大领域及26类认知任务,强调音频与视频信息的紧密耦合。所有数据经专家标注并多重验证,确保准确性。适用于自动驾驶、智能教育、监控、客服及内容创作等多个领域,推动AI模型在多模态场景下的性能提升。

AbletonMCP

AbletonMCP 是一个开源工具,通过模型上下文协议(MCP)将 Ableton Live 与 Claude AI 连接,实现音乐制作过程中的 AI 辅助。支持双向通信,允许用户通过 AI 创建和编辑 MIDI 与音频轨道、选择乐器和效果、控制播放等。技术上采用 JSON 协议和套接字通信,适用于音乐创作、实时制作、教学及音频后期处理等多种场景。

Qwen3

Qwen3 是阿里巴巴推出的下一代大型语言模型,支持“思考模式”和“非思考模式”,适用于复杂与简单任务。具备 119 种语言支持,优化了编码与 Agent 能力,数据量达 36 万亿 token,采用四阶段训练流程。提供多种模型配置,涵盖从轻量级到企业级应用。在多项基准测试中表现优异,广泛应用于文本生成、机器翻译、法律文书、技术文档、医疗辅助等领域。

ElevenLabs

ElevenLabs 是一个为内容创作者和出版商提供功能强大且用途广泛的 AI 语音软件的平台。它允许用户使用其先进的多用途 AI 语音工具以任何语音和风格生成高质量的口语音频。

Tolan

Tolan是一款AI驱动的陪伴应用,提供个性化对话、星球互动、照片反馈及语音交流等功能,帮助用户在日常生活中获得情感支持与互动体验。其应用场景涵盖社交娱乐、创意写作、语言学习等,适用于寻求情感陪伴或趣味互动的用户。支持多平台使用,提供灵活的订阅方案。

熊猫字幕

一款专业的在线字幕网站,提供自动在线字幕生成,视频音频字幕生成,字幕制作,语音转字幕,语音自动生成字幕,字幕翻译,字幕格式转换等各种字幕功能。

Hairgen.ai

Hairgen.ai 是一个使用 AI 来预览模拟头发移植后预览的样子的网站。