多语言

Toorch

Toorch是一款基于人工智能技术的新闻阅读器,主要功能包括连续对话支持、搜索历史查询、快速内容生成、个性化体验(点赞与收藏)、划词搜索以及图片与链接展示。其设计旨在简化信息获取过程,提供直观且连贯的搜索服务。适用于即时新闻获取、信息追踪、研究学习、个性化内容发现及跨语言内容访问等多个场景。

Playground v3

Playground v3是一款基于大型语言模型(LLM)的文本到图像生成工具,具备240亿参数量的潜扩散架构(LDM),能够精准理解和生成复杂的图像内容,支持RGB颜色控制和多语言文本生成。其核心功能包括文本到图像生成、图形设计、RGB颜色控制和多语言支持,广泛应用于设计、内容创作、游戏开发、广告等多个领域。

Aqua Voice

Aqua Voice 是一款AI驱动的语音转录与文档编辑工具,支持语音转文字、自然语言指令编辑、自动格式优化及多语言处理。它适用于高效写作、辅助输入及跨平台办公场景,兼容多种主流应用,提升文本创作效率与准确性。

PyVideoTrans

PyVideoTrans是一款开源的视频翻译配音工具,支持多语言处理,利用先进的语音识别和翻译技术,实现视频内容的自动翻译,并添加自然流畅的配音和同步字幕。该工具适用于影视后期、教育、企业宣传及自媒体创作等场景,帮助内容创作者跨越语言障碍,扩大受众群体。

sendsteps

SendSteps是一款结合人工智能技术的演示文稿制作工具,支持通过AI辅助生成、自定义编辑或文件导入等方式快速创建高质量演示文稿。其特色功能涵盖智能排版、多语言支持、互动元素设计及云端协作,广泛应用于商务、教育、企业培训及市场推广等领域,致力于优化用户的内容呈现体验。

RealtimeSTT

RealtimeSTT是一款开源的实时语音转文本库,具备高精度语音活动检测、GPU加速的实时转录能力以及语音唤醒功能。支持多语言识别,适用于语音助手、会议记录、实时字幕等场景,提供灵活的音频输入与预处理机制,便于开发者快速集成和扩展。

Dolphin

Dolphin是由清华大学与海天瑞声联合开发的面向东方语言的语音识别大模型,支持40种语言及22种中文方言,具备高精度语音转文字能力。采用CTC-Attention架构,结合E-Branchformer和Transformer技术,提升识别效率与准确性。模型开源,支持自定义语言与地区设置,适用于会议记录、语音输入、智能助手等多种场景。

字节跳动发布“豆包MarsCode”智能开发工具,面向国内开发者免费

豆包MarsCode是一款由字节跳动开发的免费AI编程工具,提供AI驱动的云端集成开发环境(IDE)和智能编程扩展。其主要功能包括代码补全、生成、优化、注释生成、代码解释和错误修复等。MarsCode支持云函数开发,集成API测试、存储和部署工具,并能自动生成JSON Schema。此外,MarsCode扩展支持多种编程语言和IDE,涵盖从代码编辑到单元测试生成的多个辅助功能,显著提升了编码效率和

Learn Prompting

Learn Prompting 是一个开源平台,致力于教授 AI 提示工程相关知识,涵盖从基础到高级的内容。其主要功能包括智能推荐、深度解析、模拟对话、学习进度跟踪等,同时提供体系化课程及实际应用场景案例。该工具适用于教育、语言学习、内容创作、数据分析等多个领域,助力用户提升 AI 技术的应用能力。

RepText

RepText是一款由Shakker Labs与Liblib AI联合开发的多语言视觉文本渲染框架,采用字形模仿技术实现高质量文本生成。支持多种语言及复杂排版,具备精准控制、高效兼容和自然融合等特点,广泛应用于平面设计、艺术创作和数字内容生产等领域。