PodAgent是由香港中文大学、微软和小红书联合开发的一款播客生成框架。该系统基于多智能体协作机制,模拟真实脱口秀场景,通过主持人、嘉宾和编剧的协同工作,自动生成结构化且内容丰富的对话脚本。PodAgent内置多样化的声音库,能够根据角色特征进行精准匹配,提升音频的自然度与沉浸感。同时,系统结合大语言模型(LLM)驱动的语音合成技术,实现更具表现力和情感的语音输出。此外,PodAgent还提供了全面的评估体系,用于衡量生成内容的质量,包括对话多样性、声音匹配准确性及语音表现力等关键指标。该工具支持多语言生成,并可添加音效和背景音乐,构建完整的播客内容。
发表评论 取消回复