R

Trados

Trados塔多思是一款专业AI翻译工具,业界首屈一指的翻译平台,广受世界各地翻译机构和独立翻译工作者的喜爱。

DynaMem

DynaMem是一款由纽约大学与Hello Robot共同研发的动态空间语义记忆系统,旨在应对开放环境下的移动操作挑战。该系统通过构建特征点云来存储环境信息,并利用RGBD观测数据动态调整记忆库。它支持文本查询定位物体,同时具备强大的动态物体处理能力,广泛应用于家庭、工业、仓储管理以及灾难救援等多个领域。

FireRedASR

FireRedASR是小红书推出的工业级自动语音识别(ASR)模型系列,支持普通话、中文方言和英语,具备高精度和高效推理能力。其包含FireRedASR-LLM和FireRedASR-AED两个版本,分别聚焦于极致精度和计算效率。模型在多个场景如智能助手、视频字幕生成、歌词识别和语音输入中表现出色,且已开源,推动语音识别技术的发展。

AvatarGO

AvatarGO是由南洋理工大学、上海AI Lab和香港大学联合开发的AI框架,能够根据文本描述生成高质量的4D人体与物体交互场景。其核心在于利用LLM引导的接触重定位、空间感知的分数蒸馏采样和运动优化技术,实现精确的接触识别与动画生成,有效解决穿透问题。支持多种人物与物体组合,适用于虚拟导购、展厅讲解、VR/AR内容创作等多个领域。

一知智能芽势AI数字人

​一知智能芽势AI数字人,打造视频运营新模式, 定制数字人专属IP,告别拍摄难题,让创意灵感快速照进现实,创造无限商业价值。

6pen pro

整合最新AI技术,为有深度需求的用户打造更专业的内容创作体验,提供内容库、AI生成器等专业化功能,助您轻松创造令人惊叹的多媒体内容。

Bolt․new

Bolt.new 是一款基于 AI 和 WebContainers 技术的全栈 Web 编程工具,支持在浏览器中运行完整的 Node.js 环境。它具备对话式开发、代码生成与编辑、项目部署、错误修复等功能,显著提升开发效率。无论是个人开发者还是团队协作,都能从中受益。

HunyuanVideo

HunyuanVideo是一款由腾讯开源的视频生成模型,具备130亿参数量,支持物理模拟、高文本语义还原、动作一致性和电影级画质等功能。它通过时空压缩的潜在空间训练,融合Causal 3D VAE与Transformer架构,实现图像和视频的统一生成,广泛应用于电影制作、音乐视频创作、游戏开发以及教育等领域。

MinerU

MinerU是一款开源智能数据提取工具,专注于复杂PDF文档的高效解析与提取。它能够将包含多种内容类型的PDF文档转换为结构化的Markdown格式,支持图像、公式、表格和文本等多种内容处理,保留原始文档结构和格式,支持公式识别与转换成LaTeX格式,自动删除页眉、页脚、脚注和页码等非内容元素,适用于学术、财务、法律等多个领域。