生成

Voicebox

Voicebox 是由 Meta AI 研究团队开发的一款领先的语音生成模型。Voicebox 能够在六种语言中合成语音,消除瞬态噪声,编辑内容,在语言之间转移音频风格,并生成多样的语音样本。此...

Stable Audio Open Small

Stable Audio Open Small 是由 Stability AI 与 Arm 联合开发的轻量级文本到音频生成模型,参数量降至 3.41 亿,适配移动设备和边缘计算场景。基于深度学习与模型压缩技术,支持快速生成音效、音乐片段等音频内容,适用于实时音频生成任务。具备高效运行、低功耗、多场景应用等特点,可用于音乐创作、游戏音效、视频配乐等领域。

ImageToPromptAI

ImageToPromptAI 是一款AI驱动的图像转文本工具,可快速生成高精度的图像描述,适用于图像生成、艺术创作及内容设计等领域。其功能包括图像分析、文本提示生成和隐私保护,支持多场景应用,助力创作者提高效率与创意表现。

DanceFusion

DanceFusion是一款由清华大学开发的开源框架,专注于音频驱动的舞蹈动作生成与重建。它采用分层时空Transformer-VAE和扩散模型,能够处理不完整或嘈杂的数据,生成与音乐高度同步的逼真舞蹈动作。该工具支持多种应用场景,包括内容创作、虚拟现实、互动娱乐、舞蹈教育以及动画制作等,展现了其在多领域的应用价值。

CodeSquire.ai

CodeSquire.ai是一款针对数据科学领域的AI编程助手,基于大型语言模型开发,支持代码自动补全、注释转代码、基于库构建函数及自然语言转SQL查询等功能,旨在提升开发者效率与代码质量。它适用于数据预处理、特征工程、模型训练与评估以及数据可视化等多个场景,可无缝嵌入Google Colab、BigQuery和JupyterLab等常用平台。

RADiCAL

RADiCAL 提供了一个创新的解决方案,结合了3D设计和AI动作捕捉技术,使用户能够在一个基于浏览器的环境中轻松创建和编辑3D模型及其动作。

DiffSplat

DiffSplat是一款高效的3D生成工具,能够根据文本或图像快速生成高质量的3D高斯点云。它基于预训练的文本到图像扩散模型,结合2D先验知识和3D渲染损失机制,确保生成内容在多视角下保持一致。支持文本、图像或组合输入,具备可控生成能力,适用于3D内容创作、图像重建及多种下游应用。

Zencoder

Zencoder 是一款基于 Repo Grokking™ 技术的 AI 编程助手,支持 70 多种语言,与主流 IDE 集成,提供精准的代码建议、实时修复、文档生成和测试代码自动生成等功能。适用于开发者、团队及企业,提升开发效率与代码质量。

3DHM

3DHM是一项由加州大学伯克利分校开发的3D人体动作生成技术,能够从单张照片生成动态人体视频,具备动作生成、编辑、评估、纹理修复、人体渲染及动作模仿等功能。该技术通过学习人体先验知识和3D运动序列,结合扩散模型和4DHumans预测模型,广泛应用于电影特效、虚拟现实、游戏开发等领域,为动画制作和人体动作模拟提供了创新解决方案。

HARPA AI

HARPA AI是一款基于浏览器的扩展工具,集成了多个顶级GPT模型与网络自动化功能。它支持自动撰写邮件、生成SEO文章、总结网页内容、监控页面更新以及数据提取等功能,同时提供免费和付费版本,旨在通过AI技术和自动化流程提高用户的在线工作效率。