视频

CogVideo

目前最大的通用领域文本生成视频预训练模型,含94亿参数。CogVideo将预训练文本到图像生成模型(CogView2)有效地利用到文本到视频生成模型,并使用了多帧率分层训练策略。

promptport

一个专门为ChatGPT服务而设计的创意ai工具。能让用户在平台创作、优化和分享ChatGPT提示词。

擎舵

擎舵是百度营销推出的多模态AIGC创意生产平台,专注于视频、图片、文字等内容的智能生成。平台通过百度大模型技术支持,实现一键生成视频、图片、文字,自动识别视频素材内容,生成营销图,制作数字人视频,支持图片数字人生成及数字人形象与语音定制。擎舵服务于教育、汽车、旅游等多个行业,提供全流程AI赋能,帮助用户提升营销效率。

TheoremExplainAgent

TheoremExplainAgent(TEA)是一款基于多模态技术的AI工具,可生成超过5分钟的数学与科学定理解释视频,涵盖多个STEM领域。它结合文本、动画和语音,提升抽象概念的理解效果,并具备自动错误诊断功能。通过TheoremExplainBench基准评估,TEA在准确性、逻辑性和视觉表现上均表现优异,适用于在线教育、课堂教学和学术研究等多种场景。

Oasis

Oasis是一款依托于AI技术的实时生成游戏,无需依赖传统游戏引擎即可实现每秒20帧的高质量交互式视频内容输出。它支持玩家自由探索开放世界,并通过动态调整机制提供个性化体验。凭借开源特性及硬件优化能力,Oasis展示了AI在内容创作领域的巨大潜力,适用于游戏、教育、虚拟旅游等多个领域。

Remaker

Remaker是一个在线AI工具,专注于创意内容的生成。它利用生成式AI技术,为用户提供了多种功能,包括AI换脸、批量换脸、多人换脸、视频换脸等,满足不同场景下的内容创作需求。

灵格AI英语

灵格AI英语是一款基于AI技术的英语学习工具,提供视频学习、AI导师互动、发音纠正、场景对话练习等功能,帮助用户提升听说能力。平台支持个性化学习路径,涵盖日常口语、知识学习、考试备考等多场景应用,适合不同需求的学习者使用。

GAS

GAS是一种从单张图像生成高质量、视角一致且时间连贯虚拟形象的AI工具,结合3D人体重建与扩散模型技术,支持多视角合成与动态姿态动画。其统一框架提升模型泛化能力,适用于游戏、影视、体育及时尚等领域,具备高保真度与真实感。

PicPik

APUS公司基于阿帕斯大模型推出的一款AI图片编辑工具,它可以帮助你一键生成AI大作

DragAnything

DragAnything 是一款由快手与高校联合研发的视频生成工具,通过实体表示和轨迹输入实现对视频中物体的精确运动控制。它支持多实体独立操作、相机运动调整,并采用扩散模型生成高质量视频内容。具备用户友好的交互方式,适用于视频编辑、游戏开发、教育及广告等多个场景。