转换

妙刷

妙刷是一款由美团推出的AI创作工具,支持修图、文本生图、音频生图及视频生成等功能,可将日常素材转化为艺术作品,如拟人化宠物、魔幻风景等,同时定期更新玩法和特效以保持新鲜感。

EasyControl

EasyControl是基于扩散变换器(DiT)架构的高效控制框架,采用轻量级LoRA模块实现多条件控制,支持图像生成、风格转换、动画制作等任务。其具备位置感知训练范式和因果注意力机制,优化计算效率,提升生成质量与灵活性,适用于多种图像处理场景。

TTS Online

TTS Online是一款免费的文本转语音工具,提供语音合成服务,支持多种语言,包括英语、法语、德语、西班牙语、阿拉伯语、中文、日语、韩语等,以及多种语音风格。

FastExcel

FastExcel 是一个基于 Java 的开源 Excel 处理工具,具备高性能读写、流式操作和内存优化等特点。它兼容 EasyExcel 并在此基础上扩展了功能,如读取指定行数和 Excel 转换为 PDF,适用于大规模数据处理场景。FastExcel 提供简单易用的 API 和灵活的数据映射机制,广泛应用于财务报表生成、批量数据导入导出、ERP 系统集成及在线教育等领域。

Neural4D

Neural4D是一款由DreamTech团队开发的AI驱动型3D模型生成平台,利用Direct3D-5B大模型实现从文字或图片到高精度3D模型的自动化生成。其主要功能包括文本生成3D、图片生成3D、CuteMe Q版化身转换以及高精度模型输出。平台支持多种应用场景,如游戏开发、动画制作、虚拟现实设计、产品可视化及3D打印等,推动了3D内容创作领域的快速发展。

PDF2Audio

PDF2Audio 是一款开源工具,支持将 PDF 文档转换为音频内容,适用于播客制作、教育、业务演示等多个场景。其核心功能包括 PDF 转文本、生成播客脚本、文本转语音转换、多语言支持及高级编辑功能。用户可通过自定义选项调整文本生成模型、语音风格等,支持批量处理和多种模板适配,方便用户根据需求生成高质量音频。

万相2.1

通义万相2.1是一款基于自研VAE和DiT架构的AI视频生成工具,支持高精度视频编解码与中文文字生成,具备复杂动作展现、物理规律还原、中英文特效生成及艺术风格转换等功能。同时支持图像生成,适用于影视制作、广告视频、教学辅助、文化创作等多个领域,提供高效的创作体验与高质量输出。

Ultravox

Ultravox 是一种多模态大型语言模型(LLM),能够直接处理文本和语音输入,无需额外的语音识别步骤。其核心技术包括多模态投影器,用于将音频数据转换为高维空间表示,显著提升语音理解和处理效率。该模型支持实时语音对话、多语言扩展及领域特定知识的学习,适用于智能客服、虚拟助手、语言学习、实时翻译及教育等领域。

DeepPDF

DeepPDF 是一款基于 AI 的在线 PDF 处理工具,支持文档智能问答、自动摘要生成、多语言翻译、图像与公式解析、术语解释及格式转换等功能。其特点在于保留原文排版、支持多种语言、提供高效的文档管理能力,广泛应用于教育、科研和职场场景,提升文档处理效率与信息理解能力。