模型

Chichi

一个专注于AI生成图像的日本网站,只要针对动漫爱好者、数字艺术家和影像设计师群体,生成动漫风格的插图、写实照片以及日本流行的写真风格。

Texture Lab

Texture Lab 是一个可让您使用文本输入为您的游戏创建独特且无缝纹理的网站。您可以生成不同类型的纹理,例如龙鳞、岩石、木材、沙子、冰等。

TokenFlow

一个利用预训练的文本到图像扩散模型进行视频编辑的框架。它无需进一步训练或微调,即可实现一致的视频编辑效果。

Disco

一个弗兰肯斯坦式的笔记本电...

EMO2

EMO2是一种由阿里巴巴智能计算研究院开发的音频驱动头像视频生成技术,通过音频输入和静态人像照片生成高质量、富有表现力的动态视频。其核心技术包括音频与手部动作的协同建模、扩散模型生成视频帧,以及高精度音频同步。该工具支持多样化动作生成,适用于虚拟现实、动画制作和跨语言内容创作等场景,具备自然流畅的视觉效果和丰富的应用场景。

Llama Nemotron

Llama Nemotron是NVIDIA推出的推理模型系列,具备强大的复杂推理、多任务处理和高效对话能力,适用于企业级AI代理应用。模型基于Llama架构优化,采用神经架构搜索与知识蒸馏技术,提升计算效率。包含Nano、Super和Ultra三种版本,分别面向边缘设备、数据中心和高性能计算场景。广泛应用于科研、客服、医疗、物流和金融等领域。

Tavus – AI视频生成平台,支持数字人克隆和实时对话

Tavus 是一个先进的 AI 视频生成平台,提供逼真的数字人克隆和实时对话式视频。基于 Phoenix-2 模型和对话式视频接口(CVI),Tavus 支持企业快速部署 AI 视频产品,提升用户体验并确保安全合规。主要功能包括 AI 视频生成、实时对话、开发者文档和工具,适用于客户服务、个性化营销、虚拟助手、教育和产品演示等多种应用场景。

Wordware

Wordware是一个强大的AI应用开发工具,它通过自然语言编程简化了AI代理的创建过程,提供了先进的技术能力和用户友好的界面。

豆包·语音播客模型

豆包·语音播客模型是字节跳动旗下火山引擎推出的语音播客工具,基于流式模型构建,可将文本秒级转化为双人对话式播客。具有低成本、高时效、强互动特点,解决了传统AI播客内容重复、不够口语化的问题。支持低时延与可打断、深度搜索、高效创作、超长文本转播客等功能,适用于教育、娱乐、心理咨询、内容营销和有声读物制作等场景。