生成 - 智狐AI导航

星辰大模型

星辰大模型是中国电信研发的AI工具集，涵盖语义、视觉、语音等多模态领域，支持长文本处理、多语种语音识别和多任务视觉处理。平台提供多种模型选择，包括星辰语义模型、星辰语音大模型及星辰多模态大模型，适用于智能客服、内容审核、智能写作、语音识别与合成、图像识别与分析等多种应用场景。

AI项目与工具 2025年06月12日 86 点赞 0 评论 417 浏览

谷歌DeepMind推出V2A技术，可为无声视频添加逼真音效

DeepMind推出的V2A（Video-to-Audio）模型能够将视频内容与文本提示相结合，生成包含对话、音效和音乐的详细音频轨道。它不仅能够与DeepMind自身的视频生成模型Veo协同工作，还能与其他视频生成模型，如Sora、可灵或Gen 3等，进行集成，从而为视频添加戏剧性的音乐、逼真的音效或与视频中角色和情绪相匹配的对话。V2A的强大之处在于其能够为每个视频输入生成无限数量的音轨。该模

AI项目与工具 2025年06月12日 21 点赞 0 评论 417 浏览

AudioBox

Audiobox 是 Meta 推出的 AI 语音和音效工具，结合语音输入和自然语言文字提示词生成语音和音效，例如输入提示词「一条流淌的河流和鸟儿在鸣叫」，Audiobox 自动生成音效。

Ai语音工具 2025年06月05日 77 点赞 0 评论 417 浏览

Fable Fiesta

一个AI故事生成器和AI小说写手，它点燃您的想象力，将您的故事变得生动。它使用先进的人工智能技术生成引人入胜的故事，并将它们编织成引人入胜的小说。

教育学习 2025年06月05日 48 点赞 0 评论 418 浏览

通义法睿

一个由阿里云提供的法律智能体AI法律助手，旨在让法律事务处理更快、更准确、更智能。

AI服务商 2025年06月05日 16 点赞 0 评论 418 浏览

绘世启动器

绘世启动器是由B站UP主@秋葉aaaki开发的电脑桌面应用，旨在简化Stable Diffusion-WebUI项目的启动和管理。它支持一键启动、修复、更新、模型下载、模型管理和模型训练等功能，特别适合低配电脑和无编程基础的用户。启动器内置疑难解答系统，能够诊断并解决常见错误，同时支持部署SD-WebUI、ComfyUI等多种WebUI界面，便于用户构建完整的环境。

AI项目与工具 2025年06月12日 66 点赞 0 评论 418 浏览

MoonCast

MoonCast 是一个零样本播客生成系统，能够从纯文本源合成自然的播客风格语音。它采用长上下文语言模型和大规模语音数据训练，支持中文和英文，生成几分钟长的高质量播客音频。MoonCast 通过特定的LLM提示生成播客脚本，并利用语音合成模块转换为最终音频，具备长音频生成、增强自然性、多语言支持和零样本语音合成等功能。其技术原理包括多阶段训练、短段级别自回归音频重建和自发性增强，适用于内容创作、教

AI项目与工具 2025年06月11日 63 点赞 0 评论 418 浏览

塔猫AI对话PPT

塔猫AI对话PPT是一款利用深度学习与自然语言处理技术的智能PPT分析工具，可解析文本、图表等内容，支持智能问答、摘要生成及逻辑优化建议等功能。它适用于信息检索、演讲准备、教育培训等多个场景，助力用户高效获取所需信息。

AI项目与工具 2025年06月12日 98 点赞 0 评论 418 浏览

PDF to Podcast

PDF to Podcast 是一款由 NVIDIA 开发的 AI 工具，能够将 PDF 文档自动转换为高质量的音频内容，如播客。该工具结合了大型语言模型、文本到语音技术以及 NVIDIA NIM 微服务架构，支持从 PDF 提取信息并生成结构化文本，再通过语音合成输出自然流畅的音频。用户可自定义生成内容的重点，并支持多种部署方式，适用于企业培训、技术简报、客户服务、医疗教育等多个领域。

AI项目与工具 2025年06月12日 32 点赞 0 评论 419 浏览

ScholarAI

一个AI驱动的帮助学生完成记笔记、时间管理、学习计划和学术论文写作等任务的平台。它从头开始生成笔记，总结复杂的信息，并将图像中的视觉信息转换为文本。

GPTs应用 2025年06月05日 48 点赞 0 评论 419 浏览

生成

首页

生成

列表

默认

浏览次数

发布日期