实时生成 - 智狐AI导航

Krea Chat

Krea ai 发布的基Deepseek R1驱动的只需要聊天就能调用Krea的功能进行生成和编辑图片。

AI写作对话 2025年06月05日 12 点赞 0 评论 637 浏览

kokoroTTS

一款开源、高性能的文本转语音（TTS）模型，Kokoro TTS拥有8200万参数，基于StyleTTS 2架构，提供高质量、自然的语音合成，适用于有声书、播客等。

Ai语音工具 2025年06月05日 80 点赞 0 评论 656 浏览

AudioGen.co

一款由AI驱动的可以生成各种音频内容的平台，包括样品、乐器、音效和纹理。用户可以生成高质量的、适合制作专业的具有无限的变化音乐的声音

Ai语音工具 2025年06月05日 96 点赞 0 评论 461 浏览

TianliGPT

一个专业的文字摘要生成工具，你可以将需要提取摘要的文本内容发送给TianliGPT，稍等一会他就可以给你发送一个基于这段文本内容的摘要，可以安装在WordPress等系统上。

Ai开源项目 2025年06月05日 72 点赞 0 评论 671 浏览

Sloyd AI

Sloyd,一个 3D 建模平台，我们的文本转 3D 模型 AI 生成器专门用于将文本提示转换为详细的 3D 模型，可简化创建 3D 模型的过程。

3D&游戏 2025年06月05日 43 点赞 0 评论 853 浏览

混元图像2.0

混元图像2.0是腾讯开发的AI图像生成工具，支持文本、语音、草图等多种输入方式，具备实时生成能力。其采用单双流DiT架构和多模态大语言模型，生成图像写实性强、细节丰富，且响应速度快，适用于创意设计、广告营销、教育、游戏等多个领域。用户可通过网页端直接操作，实现高效的图像创作体验。

AI项目与工具 2025年06月11日 41 点赞 0 评论 487 浏览

Stable Audio Open Small

Stable Audio Open Small 是由 Stability AI 与 Arm 联合开发的轻量级文本到音频生成模型，参数量降至 3.41 亿，适配移动设备和边缘计算场景。基于深度学习与模型压缩技术，支持快速生成音效、音乐片段等音频内容，适用于实时音频生成任务。具备高效运行、低功耗、多场景应用等特点，可用于音乐创作、游戏音效、视频配乐等领域。

AI项目与工具 2025年06月11日 35 点赞 0 评论 704 浏览

ARTalk

ARTalk是由东京大学与日本理化学研究所联合开发的语音驱动3D头部动画生成框架，基于自回归模型实现实时、高同步性的唇部动作和自然表情生成。它通过多尺度运动码本和滑动时间窗口技术提升动画质量，并引入风格编码器实现个性化风格适配。该工具在唇部同步、表情自然性和风格一致性方面优于现有技术，适用于虚拟现实、游戏开发、动画制作及人机交互等领域。

AI项目与工具 2025年06月12日 35 点赞 0 评论 888 浏览

Seaweed APT

Seaweed APT是字节跳动研发的对抗性后训练模型，支持图像和视频的一站式生成。其通过在真实数据上进行对抗性训练，实现单步高质量输出，包括1024px图像和1280×720、24fps视频。该模型采用先进的生成器和判别器设计，结合近似R1正则化技术，提升训练稳定性和生成质量。适用于视频广告、影视创作、社交媒体等内容生产场景。

AI项目与工具 2025年06月12日 52 点赞 0 评论 631 浏览

LTX Video

LTX Video是一款基于开源架构的AI视频生成工具，利用先进的扩散Transformer技术和2亿参数的DiT架构，能够在短时间内生成高质量视频。其功能涵盖实时生成、运动一致性保障、开源可扩展性及广泛的硬件兼容性，适用于游戏、广告、影视等多种行业，为用户提供高效的视频生成解决方案。

AI项目与工具 2025年06月12日 34 点赞 0 评论 609 浏览

实时生成

首页

实时生成

列表

默认

浏览次数

发布日期