学习

加利福尼亚大学洛杉矶分校

加利福尼亚大学洛杉矶分校(University of California, Los Angeles,简称:UCLA) ,是位于美国洛杉矶的公立研究型大学 ,是环太平洋大学联盟和国际公立大学论坛成员 ,被誉为“公...

Higgsfield

Higgsfield是一款基于AI的视频生成平台,能够将文本提示转化为高质量视频内容,支持多种风格如现实主义、赛博朋克等。具备电影级相机控制、深度定制、资源管理等功能,适用于社交媒体、广告及电影制作领域,提升创作效率与质量。

TicVoice 7.0

TicVoice 7.0 是一款基于 Spark-TTS 的语音合成引擎,采用 BiCodec 技术实现音色与语义的精准控制,支持 3 秒语音克隆、多角色、多情绪表达及中英切换,语音自然流畅,接近广播级水平,适用于智能客服、有声书、影视配音等场景。

Red_Panda

Red_Panda 是一款由 Recraft AI 开发的先进 AI 图像生成工具,以其高精度的文本到图像转换能力和卓越的解剖学准确性著称。它能够生成复杂长文本对应的高质量图像,支持用户通过风格控制和图形设计工具实现个性化定制。此外,Red_Panda 还具备矢量图像生成能力,并集成 AI 图像编辑功能,广泛应用于设计、品牌营销、教育及出版等多个领域。

Takin AudioLLM

Takin AudioLLM是一套由喜马拉雅Everest团队研发的语音生成模型,包含文本转语音(Takin TTS)、音色转换(Takin VC)及声音风格变换(Takin Morphing)。它采用最新大型语言模型技术,可生成接近真人的高质量语音,并支持个性化定制与零样本学习。该工具广泛应用于有声书制作、虚拟助手、电影配音等领域,具有音色精准、风格多样等特点。

疯语咒AI

疯语咒AI是AI技术和教育的先行者,提供海量免费的AI学习材料。

硅语AI

硅基智能开发的AI数字人及视频翻译技术,支持用您自己的语调、口型同步和说话风格免费进行视频语言翻译,创建能够与人类进行互动的虚拟人物。

MOFA

MOFA-Video是由腾讯AI实验室和东京大学研究人员开发的开源图像生成视频模型。该工具通过生成运动场适配器对图像进行动画处理,能够通过稀疏控制信号(如手动轨迹、面部关键点序列或音频)实现对视频生成过程中动作的精准控制。MOFA-Video支持零样本学习,能够将多种控制信号组合使用,生成复杂的动画效果,并能生成较长的视频片段。 ---

Auxi

auxi是一款功能强大的微软PPT插件,允许你将手绘的PPT草图转换为PowerPoint幻灯片