人工智能

OpenAudio S1

OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于200万小时音频数据训练,支持13种语言。采用双自回归架构和RLHF技术,生成自然流畅的语音,支持50多种情感和语调标记。具备零样本和少样本语音克隆功能,仅需10到30秒音频即可生成高保真声音。适用于视频配音、播客、游戏角色语音、虚拟助手、游戏娱乐、教育培训及客服系统等场景。提供40亿参数完整版和5亿参数开源版,满足

Neural4D 2o

Neural4D 2o 是一款基于多模态数据训练的 3D 大模型,支持文本、图像、3D 和运动数据输入,实现高精度的 3D 内容生成与编辑。具备上下文一致性、角色身份保持、换装和风格迁移等功能,支持自然语言指令操作。采用 Transformer 编码器与 3D DiT 解码器架构,原生兼容 MCP 协议,提升创作效率与交互体验,适用于 3D 内容创作、游戏开发、影视动画等多个领域。

Plus AI

Plus AI for Google Slides 是最好的 AI 演示制作工具,可直接在 Google Slides 中创建和编辑演示文稿。有了 Plus AI,你可以使用与 ChatGPT 和 Duet AI 等工具相同的人工智能技术,为工作和学习制作精美的演示文稿。

Resona AI

将单张图像转换为一套专业级商品图,体验 AI 的力量,将您的产品视觉效果提升到一个新的水平。

15个AI数字人制作工具,快速生成口播和直播视频

AI数字人通过AI技术模拟真人外貌与行为,实现自然对话与情感表达。本文介绍多款数字人制作工具,支持视频创作、营销推广、教育培训等场景,功能包括3D内容生成、自定义编辑、后期包装等,适用于个人及企业用户,助力内容生产效率提升。

Murf AI

Murf AI 是一款文本转语音软件,它能够将真实声音与免版税音乐和视频相结合。

PromptBox

PromptBox是一款可以让你在不同的人工智能工具之间保存、组织、复制和粘贴你的人工智能提示的工具。

Creatie.Ai

基于AI的UI/UX 设计工具,只需几分钟即可建立您自己的设计系统!Creatie.Ai的人工智能识别现有文件中的可重用组件,并生成全面的样式库,包括字体、颜色和阴影。

Large Action Models

Large Action Models(LAMs)是微软开发的一种智能系统框架,专注于执行真实世界任务。它通过整合数据收集、模型训练、环境交互和评估等阶段,将语言理解转化为具体行动,提升了AI在自动化和增强人类能力方面的影响力。LAMs具备动态规划、自主执行和专业化训练等特点,广泛应用于办公自动化、智能家居管理、客户服务、电子商务等领域。 ---

BrainyPDF

BrainyPDF可以从PDF中获得即时信息、能够即时回答你对PDF文档中提出的的各种问题。