Talkpal AI Talkpal AI是一款利用GPT技术构建的语言学习平台,支持多语言学习,包括英语、西班牙语、法语和德语等。其主要功能涵盖自适应学习系统、角色扮演、情景对话、听力及口语练习,并提供即时反馈,助力用户提升语言实际应用能力。 AI项目与工具 2025年06月12日 36 点赞 0 评论 464 浏览
Speech Speech-02 是 MiniMax 推出的先进文本到语音模型,支持零样本语音克隆和高质量语音合成,具备多语言支持和情感控制功能。采用自回归 Transformer 和 Flow-VAE 架构提升语音自然度和相似度,适用于配音、有声读物、智能助手等多种场景。提供 HD 和 Turbo 两个版本,满足不同性能需求。 AI项目与工具 2025年06月11日 33 点赞 0 评论 464 浏览
蘑兔听记 一款音视频转文字工具,超98%的语音识别准确率,30分钟音频只需3分钟就可转成文字,支持20多种方言、30余种外语,极大提高了工作和学习效率。 Ai语音工具 2025年06月05日 26 点赞 0 评论 463 浏览
Tarsier2 Tarsier2是字节跳动研发的大规模视觉语言模型,擅长生成高精度视频描述并在多项视频理解任务中表现优异。其核心技术包括大规模数据预训练、细粒度时间对齐微调以及直接偏好优化(DPO)。该模型在视频问答、定位、幻觉检测及具身问答等任务中均取得领先成绩,支持多语言处理,具有广泛的应用潜力。 AI项目与工具 2025年06月12日 59 点赞 0 评论 461 浏览
spiritme Spiritme是一款基于人工智能的视频创作工具,支持用户通过拍摄或输入文本生成逼真的数字化身视频。其核心功能包括数字化身创建、文本转视频转换、AI辅助拍摄及多语言支持,适用于营销、教育、社交媒体及企业演示等多种应用场景,为用户提供了高效且灵活的视频制作解决方案。 AI项目与工具 2025年06月12日 80 点赞 0 评论 461 浏览
Notta Notta是由MIND CRUISER LIMITED推出的语音转写软件,主要针对个人使用,并在海外拥有数十万用户。这款软件具有录音实时转写、音/视频导入转写、文本多格式导出、音频标记等功能,... Ai办公效率 1970年01月01日 0 点赞 0 评论 460 浏览
麦琪的花园 《麦琪的花园》是一款融合AI技术与沙盒玩法的冒险游戏,玩家可创建个性化AI伙伴并与之互动,同时建设营地、探索魔法大陆。游戏支持多语言对话和语音合成,提供沉浸式社交体验,适合沙盒、二次元及AI技术爱好者。 AI项目与工具 2025年06月12日 77 点赞 0 评论 459 浏览
Chatterbox Chatterbox是Resemble AI推出的开源文本转语音(TTS)模型,基于0.5B规模的LLaMA架构,用超过50万小时精选音频训练。它支持零样本语音克隆,仅需5秒参考音频即可生成高度逼真的个性化语音,并具备情感夸张控制功能,可调节情绪、语速和语调。Chatterbox还拥有超低延迟的实时语音合成能力,延迟低至200毫秒以下,适用于交互式应用。此外,它采用安全水印技术防止滥用,适用于内容 AI项目与工具 2025年06月11日 55 点赞 0 评论 456 浏览
文心快码Zulu 百度文心快码推出的一款 AI 自动编程智能体,能够自主理解编码需求,精准拆解任务,并突破单文件限制,实现跨模块、跨目录的系统级代码生成。 Ai编程建站 2025年06月05日 34 点赞 0 评论 454 浏览