AI

OmniHuman

OmniHuman是字节跳动推出的多模态人类视频生成框架,基于单张图像和运动信号生成高逼真视频。支持音频、姿势及组合驱动,适用于多种图像比例和风格。采用混合训练策略和扩散变换器架构,提升生成效果与稳定性,广泛应用于影视、游戏、教育、广告等领域。

PSHuman

PSHuman是一款基于跨尺度多视图扩散模型的单图像3D人像重建工具,仅需一张照片即可生成高保真度的3D人体模型,支持全身姿态和面部细节的精确重建。其核心技术包括多视角生成、SMPL-X人体模型融合及显式雕刻技术,确保模型在几何和纹理上的真实感。该工具适用于影视、游戏、VR/AR、时尚设计等多个领域,具备高效、精准和易用的特点。

Transformer Debugger

Transformer Debugger (TDB) 是一款由OpenAI的对齐团队开发的工具,用于帮助研究人员和开发者理解和分析Transformer模型的内部结构和行为。它提供了无需编程即可探索模型结构的能力,并具备前向传递干预、组件级分析、自动生成解释、可视化界面及后端支持等功能。TDB 支持多种模型和数据集,包括GPT-2模型及其自动编码器。

海螺视频

MiniMax公司推出的一款基于AI高清视频生成模型abab-video-1技术的视频生成工具,海螺AI视频支持文生视频,最高支持原生1280*720的25fps分辨率,拥有电影感镜头移动效果。

集简云

集简云是一个强大的企业自动化工具,它通过提供无代码的可视化操作界面,简化了软件集成的复杂性,使得业务流程自动化变得简单快捷。

boardmix博思白板

boardmix博思白板是一款基于云端的在线思维导图软件,内置AI助手功能,能根据输入的主题自动生成思维导图内容。它支持团队协作,无文件和节点限制,并且免费使用。

FancyVideo

FancyVideo是一款由360公司与中山大学合作开发的AI文生视频模型,采用创新的跨帧文本引导模块(CTGM)。它能够根据文本描述生成连贯且动态丰富的视频内容,支持高分辨率视频输出,并保持时间上的连贯性。作为开源项目,FancyVideo提供了详尽的文档和代码库,便于研究者和开发者深入研究和应用。主要功能包括文本到视频生成、跨帧文本引导、时间信息注入及时间亲和度细化等。

PAPERCUP

利用人工智能配音,让现有视频内容更快、更经济地走向全球。

PNGMaker

PNGMaker 是一款基于 AI 技术的在线工具,可将文本快速转换为透明背景的 PNG 图像。支持自定义字体、颜色和排版,适用于网页设计、社交媒体营销、品牌标识及广告材料等多种场景。用户可通过简单操作生成高质量图像,提升设计效率与视觉表现力。