人工智能

琴乐大模型

琴乐大模型是一款由腾讯AI Lab与腾讯TME天琴实验室联合开发的人工智能音乐创作工具。该工具能够根据用户输入的关键词、描述性语句或音频,生成高质量的立体声音频或多轨乐谱,并支持自动编辑功能。琴乐大模型采用先进的技术框架,包括音频文本对齐、乐谱/音频表征提取、大语言模型预测以及流匹配和声码器技术,确保生成的音乐符合音乐理论和人类审美标准。

VideoRefer

VideoRefer是由浙江大学与阿里达摩院联合开发的视频对象感知与推理系统,基于增强型视频大型语言模型,实现对视频中对象的细粒度理解与分析。其核心包括大规模视频数据集、多功能空间-时间编码器和全面评估基准,支持对象识别、关系分析、推理预测及多模态交互等功能,适用于视频剪辑、教育、安防、机器人控制和电商等多个领域。

Runway Gen

Runway Gen-4 是一款由 Runway 公司推出的高保真 AI 视频生成模型,能够跨场景保持人物、物体和环境的一致性,无需额外训练。用户仅需提供一张参考图和文字指令,即可生成具有真实物理效果和高质量视觉风格的视频内容。支持多种应用场景,如影视制作、动画创作、音乐视频、游戏开发和广告营销,有效提升创作效率并降低成本。

DECO京东

Deco 是 Design 和 Code 的两个词的合并,代表 Design To Code,即从设计稿一键生成多端代码

10WEB人工智能建站

10Web是一个基于Elementor的人工智能驱动的网站建设工具,提供类似于WordPress的块状编辑器,并增加了安全功能、后端优化和AI工具。

Face Swapper Online

一款由人工智能驱动的在线换脸工具,允许用户在不降低图像质量的情况下交换图片中的面部。

九歌

九歌是清华大学研发的AI诗歌生成系统,基于深度学习技术,可生成符合古诗格律的多种体裁作品。支持关键词、文本及图片输入,操作便捷,无需登录即可使用。适用于诗词创作辅助、文化教育、艺术融合及个人娱乐等多个场景,助力中华传统文化的传承与创新。

BEHAVIOR Robot Suite

BEHAVIOR Robot Suite(BRS)是斯坦福大学李飞飞团队研发的机器人操作框架,专注于实现全身协调与复杂家务任务。它结合了低成本遥操作接口JoyLo和多模态学习算法WB-VIMA,提升机器人在真实环境中的适应性和操作精度。适用于家务自动化、垃圾处理、衣物整理等多个场景,具备高度灵活性和故障恢复能力。

Make

Make-A-Character(简称Mach)是由阿里巴巴集团智能计算研究院开发的3D数字人生成框架,通过文本描述快速生成逼真的3D角色。该系统支持灵活的定制化、高度逼真的渲染、完整的角色模型及动画支持。其工作流程包括文本解析、视觉提示生成、参考肖像图像生成、密集面部坐标检测、几何生成、纹理生成、纹理修正、头发生成、资产匹配和角色装配。Mach生成的角色模型可以无缝集成到游戏和电影行业的标准CG

DreamStudio

DreamStudio AI是由Stability.ai开发的先进生成式人工智能技术驱动的在线创意工具,允许用户生成图像。Stability.ai是全球领先的开源人工智能公司。