AI项目与工具

xAR

xAR是由字节跳动与约翰·霍普金斯大学联合研发的自回归视觉生成框架,采用“下一个X预测”和“噪声上下文学习”技术,提升视觉生成的准确性和效率。其支持多种预测单元,具备高性能生成能力,在ImageNet数据集上表现优异,适用于艺术创作、虚拟场景生成、老照片修复、视频内容生成及数据增强等多种应用场景。

纸飞机AI

纸飞机AI是一款依托人工智能技术的虚拟陪伴应用,允许用户创建个性化AI智能体,提供情感支持、互动陪伴及社交体验。具备逼真的文本转语音功能,支持多角色选择和多样化的互动形式,包括朋友圈社交与角色对话创作。广泛应用于社交训练、情感支持、娱乐休闲及语言学习等领域。

Draft AI

Draft AI是一款基于AI技术的内容创作工具,提供文本编辑、图像生成和内容模板等功能,帮助用户高效生成高质量的文字和视觉内容。其Draft Art功能可生成免费的AI艺术作品,增强文本表现力,同时支持生成多种类型的图像。适用于内容营销、产品描述、广告创作、社交媒体管理和个人博客等多种场景。

Ovis2

Ovis2是阿里巴巴国际团队开发的多模态大语言模型,采用结构化嵌入对齐技术提升视觉与文本的融合效果。支持视频、图像和多语言处理,强化了思维链推理和复杂场景下的OCR能力。提供多个参数规模的版本,适用于研究、开发及各类应用场景,展现卓越性能。

FlagevalMM

FlagEvalMM是一个由北京智源人工智能研究院开发的开源多模态模型评测框架,专注于评估处理文本、图像、视频等多模态任务的模型性能。它支持多种任务和指标,采用解耦评测与推理的设计,提供统一的评测流程,集成丰富模型库并兼容多种后端引擎。该工具适用于学术研究、工业应用、模型开发、教育领域及内容创作等多个场景。

Ruyi

Ruyi是一款基于DiT架构的图生视频大模型,支持多分辨率和多时长的视频生成,具有首帧、首尾帧控制、运动幅度调整及镜头方向控制等功能。它通过Casual VAE模块和Diffusion Transformer实现视频数据的压缩与生成,旨在降低动漫和游戏内容的开发周期和成本。目前,Ruyi-Mini-7B版本已开源。

n8n

n8n是一款开源的自动化工作流管理系统,采用低代码平台设计,支持拖放式工作流创建,无需编程即可实现复杂业务流程的自动化。其核心功能包括工作流自动化、多应用集成、数据转换与错误处理,同时具备强大的调试和日志记录能力。n8n基于Docker容器化部署,支持事件驱动和数据流处理,广泛应用于数据集成、报告生成、客户支持自动化及社交媒体管理等多个领域。

MakeBestMusic

MakeBestMusic 是一款基于AI技术的音乐创作工具,支持通过文本生成音乐、音频分离、混音与重制等功能,覆盖多种音乐风格。提供多种付费计划,满足不同用户需求,适用于音乐制作、视频创作、游戏开发等场景,提升创作效率与质量。

Hedy AI

Hedy AI 是一款提升会议与对话效率的AI工具,支持19种语言,提供实时转录、智能总结、个性化提示及上下文敏感的见解。适用于商务会议、面试、课堂及医疗预约等场景,帮助用户更好地理解信息、提出有效问题并提升参与度。支持跨设备使用,注重隐私保护,适合多语言环境下的高效沟通。

StereoCrafter

StereoCrafter是一款由腾讯AI Lab与ARC Lab联合开发的创新性工具,可将传统2D视频转化为高质量的立体3D视频。它采用深度估计、视频变形及立体视频修复等关键技术,确保生成的3D视频具备高保真度和一致性。该工具广泛应用于影视制作、虚拟现实(VR)、增强现实(AR)、游戏开发等领域,为用户提供更加沉浸式的视觉体验。