生成

Indic Parler

Indic Parler-TTS 是一款由 Hugging Face 与 AI4Bharat 联合开发的多语言文本到语音模型,支持 20 种印度语言和英语,提供 69 种独特语音。该模型基于深度学习架构,通过描述性文本输入实现对音调、语速、情感等参数的灵活控制,适用于多种语音合成场景。在低资源语言上表现优异,具备高自然度和清晰度的语音输出能力。

文心大模型歌词生成器

文心大模型「歌词生成」器,是百度旗下的AI智能处理“文心大模型”提供的服务出品的 AI 自动生成歌词网站,

MinT

MinT是一款基于时间基位置编码技术的多事件视频生成框架,允许用户通过文本提示生成包含多个事件的连贯视频,并支持对事件顺序及持续时间的精确控制。其核心技术ReRoPE使得模型能够有效关联文本提示与视频帧,同时结合预训练的视频扩散变换器(DiT)和大型语言模型(LLM)的提示增强功能,进一步提升了视频生成的质量与丰富度。MinT适用于娱乐、广告、教育等多个领域,为视频创作带来了创新性的解决方案。

WeaveFox

WeaveFox 是一款基于 AI 技术的前端开发平台,通过百灵多模态大模型实现从设计图到前端源代码的自动化生成,支持多端适配及多种技术栈。它不仅提高了开发效率和代码质量,还提供了灵活的二次调整功能,确保设计意图的精准还原。未来,WeaveFox 将开放更多应用场景,如快速原型开发、中后台页面构建以及移动端界面生成等。

有道AIPPT

有道一款基于AI的演示PPT生成工具。有道AI PPT能够通过理解用户输入的文本内容或主题,快速生成具有专业设计的PPT幻灯片。

DeepMesh

DeepMesh是由清华大学和南洋理工大学研发的3D网格生成框架,结合强化学习与自回归变换器技术,实现高质量、高精度的3D模型生成。支持点云和图像条件输入,具备高效的预训练策略与人类偏好对齐机制,适用于虚拟环境、角色动画、医学模拟及工业设计等多个领域。

Logent AI

全球首个AI Agent Logo生成器。它根据用户输入的产品名称、功能或标语等信息,像专业设计师一样思考,自动生成设计思路并创建多样化、个性化的Logo。

Step-1V

覆盖了从个人使用到企业级应用的多个方面的多模态大模型。

吐司TusiArt

吐司TusiArt是一个由上海必有回响智能科技开发的AI绘画模型分享社区和在线生图平台。平台提供了丰富的AI绘画模型,支持用户在线运行和下载,无需额外软件或硬件支持。用户可以轻松生成、编辑和分享自己的作品,并且平台还支持用户自定义模型的训练和定制。平台具有易于使用的在线生图工具、开放的模型分享平台、海量模型库以及社区互动分享功能。