分类

Cubox

高效的AI阅读学习助手和信息收集管理工具

AIGODLIKE

AIGODLIKE 作为一个开源 AI 冒险社区,为 AI 爱好者和专业人士提供了一个分享、学习和交流的平台。通过丰富的功能和实时更新的内容,AIGODLIKE 旨在激发社区成员的创造力,推动 AI...

海绵音乐

海绵音乐,一个精选音乐的聚集地,致力于为用户提供各种风格的治愈系音乐。

八斗智能

八斗智能的语义理解模型是一个强大的工具,它通过大规模预训练和行业特定的迁移学习,能够提供高度准确的语义理解服务。

B族

Midjourney提示词(咒语)是一个免费在线生成器,可以快速生成midjourney关键词、咒语的实用工具平台,内置2000+宝典,实时翻译,利用Midjourney智能提示工具,快速生成符合您需求...

ID

ID-Animator是一款由腾讯光子工作室、中科大和中科院合肥物质科学研究院联合开发的零样本人类视频生成技术。它能够根据单张参考面部图像生成个性化视频,并根据文本提示调整视频内容。ID-Animator通过结合预训练的文本到视频扩散模型和轻量级面部适配器,实现高效的身份保真视频生成。其主要功能包括视频角色修改、年龄和性别调整、身份混合以及与ControlNet等现有条件模块的兼容性。

Liner.ai

Liner.ai 是一款面向非专业程序员和数据科学家的机器学习工具,通过简单的点击操作即可训练模型,无需编写代码。该工具提供多种项目模板,涵盖图像、文本、音频和视频分类,以及对象检测和图像分割等任务。Liner.ai 支持在 CPU 上快速训练模型,并可在本地完成训练以保护数据隐私。此外,该工具还允许用户轻松地将模型导出到多个平台,适合初学者和专业人士使用。

VoxInstruct

VoxInstruct是清华大学开源的语音合成技术,能够根据人类语言指令生成高质量的语音。该系统采用统一的多语言编解码器语言建模框架,将传统的文本到语音任务扩展到了更广泛的人类指令到语音任务。VoxInstruct通过引入语音语义标记和多种无分类器指导策略,提升了语音合成的自然度和表现力。它支持多语言和跨语言合成,适用于智能语音助手、有声读物、教育培训等多个领域。