AI

HMA

HMA(Heterogeneous Masked Autoregression)是一种基于异构预训练和掩码自回归技术的机器人动作视频建模方法,支持离散与连续生成模式,可处理不同动作空间的异构性。该工具具备高效实时交互能力,广泛应用于视频模拟、策略评估、合成数据生成及模仿学习等领域,适用于机器人学习与控制任务,提升策略泛化与执行效率。

Agent Squad

Agent Squad 是一个轻量级、开源的多 Agents 框架,用于协调多个 AI Agents 处理复杂对话。它支持 Python 和 TypeScript 两种语言,具备智能意图分类、灵活的 Agent 响应(流式与非流式)、上下文管理等功能,并提供模块化安装和可扩展架构。适用于智能客服、旅行规划、企业助手等场景,帮助开发者快速构建高效的多 Agents 系统。

AI推理模型有哪些?13个支持深度思考的推理模型

本文介绍了13款支持深度思考的AI推理模型,涵盖数学、代码、自然语言推理等多个领域。这些模型通过强化学习和大数据分析,能够高效处理复杂问题,提供精准的决策支持。部分模型具备多模态处理能力、透明推理过程及开源特性,适用于不同应用场景,如教育、医疗和科研等。

VASA

VASA-1是一个由微软亚洲研究院开发的生成框架,能够将静态照片转化为动态的口型同步视频。该框架利用精确的唇音同步、丰富的面部表情和自然的头部运动,创造出高度逼真的虚拟人物形象。VASA-1支持在线生成高分辨率视频,具有低延迟的特点,并且能够处理多种类型的输入,如艺术照片、歌唱音频和非英语语音。此外,通过灵活的生成控制,用户可以调整输出的多样性和适应性。

绘声美音

绘声美音是一款集声音克隆、AI变声、文字转语音及多种音频处理功能于一体的在线工具,用户可通过微信公众号便捷使用。支持上传语音训练专属声纹模型,进行歌曲翻唱并生成MV,同时提供变声、音频提取、听歌识曲等功能,适用于娱乐、配音、创作等多种场景。

爱学术

一款AI文献阅读器,依托自主研发的AI学术大模型打造的智能文献管理平台,爱学术AI提供AI文献管理、AI学术对话、AI论文写作、AI文献解读、AI写作助手、AI研究、AI论文翻译等功能。

Trae 插件

Trae 插件是一款基于 AI 的编程辅助工具,支持多种编程语言和主流 IDE,提供代码补全、生成、解释、注释、单测生成及智能问答等功能,提升开发效率与代码质量。支持多模型切换,具备高度可定制性,适用于快速开发、代码优化与团队协作等场景。

稿定AI

稿定设计自研的首版文生图基础模型,在出图质量,推理性能等关键维度对齐playground-v2,Pixart-alpha等行业明星模型。

华为盘古AI大模型

华为的盘古ai大模型是华为云推出的一项人工智能技术。该大模型包含了多个领域的大型模型,包括自然语言处理(NLP)大模型、计算机视觉(CV)大模型、多模态大模型、预测大模型和科学计算大模型。