多语言

混元DiT

混元DiT(Hunyuan-DiT)是腾讯混元团队开源的高性能文本到图像的扩散Transformer模型,具备细粒度的中英文理解能力,能够生成多分辨率的高质量图像。该模型结合了双语CLIP和多语言T5编码器,通过精心设计的数据管道进行训练和优化。混元DiT的主要功能包括双语文本到图像生成、细粒度中文元素理解、长文本处理能力、多尺寸图像生成、多轮对话和上下文理解、高一致性和艺术性。此外,混元DiT在

Qwen3 Embedding

Qwen3 Embedding 是基于 Qwen3 基础模型开发的文本表征、检索与排序专用模型,支持 119 种语言,参数规模从 0.6B 到 8B。它能够精准捕捉文本语义,支持多语言处理、高效检索和语义相关性排序,并可通过个性化优化提升用户体验。在 MTEB 等任务中表现优异,适用于智能搜索、推荐系统、问答系统和教育领域等场景。

OpenL.io

Openl.io是一个支持100多种语言的AI驱动惊人的翻译工具。具有翻译、润色、语法修正、语言学习等功能。

Scribe

Scribe 是由 ElevenLabs 推出的高精度语音转文本模型,支持 99 种语言,具备多说话者区分、非语言事件检测和单词级时间戳功能。输出结构化的 JSON 数据,适用于会议记录、字幕生成、内容创作等多种场景,广泛应用于教育、客服及媒体领域。

品食PicEats

一款专为海外旅行者设计的 AI 美食工具,品食PicEats集成了菜单拍照翻译、菜品识别、当地美食推荐与餐厅点评等功能。

逗哥配音

逗哥配音是一款基于AI技术的在线配音平台,专为短视频创作者设计。它提供多样化的语音风格选择、智能配音制作工具以及声音克隆功能,支持无损音质输出。用户可以利用该平台轻松生成个性化配音作品,广泛适用于广告宣传、教育培训、游戏开发等多个领域。

JobJump

JobJump是一款基于AI技术的视频面试助手扩展程序,支持与Google Meet、Zoom及Microsoft Teams等平台兼容。它具备多语言支持、行业和职位定制化服务等功能,能够实时识别面试问题并提供个性化答案提示,帮助求职者在面试中展现最佳状态。适用于技术、非技术、多语言及远程面试场景,特别适合职业转换者。

Lipsync

Lipsync-2 是 Sync Labs 推出的全球首个零样本嘴型同步模型,无需预训练即可快速生成符合说话者风格的嘴型动作。支持多语言、个性化表达和温度参数调节,具备高精度、高真实感和高效处理能力,广泛应用于视频翻译、动画制作、多语言教育及 AI 内容生成等领域。

BannerBoo

一个AI 驱动的横幅生成器,只需点击几下即可生成非常惊叹的横幅广告。无论您是设计专家还是新手,任何人都可以根据自己的需求制作具有专业外观的广告。

text.cortex

text.cortex是一款集成了文本重写、句子扩展、长篇内容生成、文本摘要、多语言翻译及语法检查等功能的AI写作辅助工具。其核心优势在于支持超过25种语言,用户可通过高亮文本直接使用工具栏优化内容。无论是学术研究、商业报告还是日常写作,text.cortex都能显著提高创作效率与质量。