R

Pot划词翻译

Pot划词翻译,一个跨平台的划词翻译软件, 免费、方便的跨平台划词翻译、截图翻译工具,支持多个翻译源,技术外文阅读利器。

Favird

一个你可以一起学习、分享和发展资源的社区。

Emu3

Emu3是一款由北京智源人工智能研究院开发的原生多模态世界模型,结合了多模态自回归技术和单一Transformer架构,能够在图像、视频和文本之间实现无缝转换。它不仅能够根据文本生成高质量图像,还能预测视频发展并理解图文内容,广泛应用于内容创作、广告营销、教育、娱乐等多个领域。

AIPRM

ChatGPT浏览器扩展的AIPRM为用户提供了一个简单有效的方法来优化他们的网站,并提高其在搜索引擎上的排名。它为SEO, SaaS,营销,艺术,编程等提供了一系列精心策划的提示模板,只...

OmniTalker

OmniTalker 是一款由阿里巴巴开发的实时多模态交互技术,支持文本、图像、音频和视频的同步处理,并能生成自然流畅的语音响应。其核心技术包括 Thinker-Talker 架构和 TMRoPE 时间对齐技术,实现音视频精准同步与高效流式处理。适用于智能语音助手、内容创作、教育、客服及工业质检等场景,具有高实时性与稳定性。

加利福尼亚大学伯克利分校

加利福尼亚大学伯克利分校(University of California, Berkeley),简称伯克利,坐落美国旧金山湾区伯克利市,是公立研究型大学,被誉为“公立常春藤”,是美国大学协会成员,全球...

kokoroTTS

一款开源、高性能的文本转语音(TTS)模型,Kokoro TTS拥有8200万参数,基于StyleTTS 2架构,提供高质量、自然的语音合成,适用于有声书、播客等。

Trados

Trados塔多思是一款专业AI翻译工具,业界首屈一指的翻译平台,广受世界各地翻译机构和独立翻译工作者的喜爱。

ColorMagic

ColorMagic是一个由人工智能驱动的色彩调色板生成工具,你可以输入图像或色彩情绪的关键字,它会根据关键词生成您输入的颜色图像的颜色。

Whisper语音识别模型

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。