人工智能

Ai工具集导航 AI

Ai工具集导航(AI-Bot.cn)专注于收录和推荐国内外热门、创意、有趣、前沿的AI工具和网站,致力于为大家提供一个快速访问任意人工智能网站的门户和入口。

Perception

Perception-as-Control是由阿里巴巴通义实验室开发的图像动画框架,支持对相机和物体运动的细粒度控制。它基于3D感知运动表示,结合U-Net架构的扩散模型,实现多种运动相关的视频合成任务,如运动生成、运动克隆、转移和编辑。通过三阶段训练策略,提升运动控制精度和稳定性,适用于影视、游戏、VR/AR、广告及教育等多个领域。

Soundwave

Soundwave是由香港中文大学(深圳)开发的开源语音理解大模型,专注于语音与文本的智能对齐与处理。它采用对齐适配器和压缩适配器技术,提升语音特征压缩效率,支持语音翻译、语音问答、情绪识别及多模态交互等功能。适用于智能语音助手、语言学习、内容创作等多个领域,具有广泛的应用前景。

DGM

DGM(Darwin Gödel Machine)是一种自改进人工智能系统,通过迭代修改自身代码提升性能。它从编码代理档案中选择代理,基于基础模型生成新版本,并在基准测试中验证性能。DGM受达尔文进化论启发,采用开放性探索策略,避免局部最优解。其自改进过程在隔离沙盒中进行,确保安全性。DGM在多个基准测试中表现显著提升,如SWE-bench和Polyglot。主要功能包括自我改进、实证验证、开放性

DNA

DNA-Rendering是一个具有高多样性和高保真度的神经演员渲染库,它为广泛的研究任务提供了丰富的数据和高质量的注释。

Bgrem.AI

一款可提供包括去除视频背景、生成图像、重新设计室内装饰、AI 滤镜、生成插图、去除不需要的对象等多种服务的AI工具,用户不需具备编辑技能或技术知识,就可使用 Bgrem.ai 进行图像和视频的编辑。

Exa.ai

采用大型语言模型 (LLM) 根据含义筛选内容,超越传统的基于关键字的AI搜索引擎。Exa.ai多样化的过滤选项为用户提供量身定制的搜索结果,满足广泛的兴趣和要求。

琴乐大模型

琴乐大模型是一款由腾讯AI Lab与腾讯TME天琴实验室联合开发的人工智能音乐创作工具。该工具能够根据用户输入的关键词、描述性语句或音频,生成高质量的立体声音频或多轨乐谱,并支持自动编辑功能。琴乐大模型采用先进的技术框架,包括音频文本对齐、乐谱/音频表征提取、大语言模型预测以及流匹配和声码器技术,确保生成的音乐符合音乐理论和人类审美标准。

Rafa.Ai

一个AI驱动的投资专家团队,可以随身携带,对数百万数据点的持续分析,全天候的投资组合优化。