视频

MultiTalk

MultiTalk是由中山大学深圳校区、美团和香港科技大学联合推出的音频驱动多人对话视频生成框架。它根据多声道音频输入、参考图像和文本提示,生成包含人物互动且口型与音频一致的视频。通过Label Rotary Position Embedding (L-RoPE) 方法解决多声道音频与人物绑定问题,并采用部分参数训练和多任务训练策略,保留基础模型的指令跟随能力。MultiTalk适用于卡通、歌唱及

Oryx

Oryx是一款由清华大学、腾讯和南洋理工大学联合开发的多模态大型语言模型,专为处理视觉数据设计。其核心技术包括预训练的OryxViT模型和动态压缩模块,支持任意分辨率的图像处理及高效的视觉数据压缩。Oryx在空间和时间理解上表现优异,广泛应用于智能监控、自动驾驶、人机交互、内容审核、视频编辑及教育等领域。

Mobvoi MCP Server

Mobvoi MCP Server是出门问问推出的一站式AI工具,集成语音生成、声音克隆、图片驱动数字人、视频配音等多模态能力。用户可通过简单输入文本调用功能,支持多客户端和多场景应用。基于标准化接口和开源生态,提供高效、灵活的数字生产力解决方案,适用于内容创作、虚拟主播、在线教育等多个领域。

码智作

一个二维码制作工具,码智作可以快速将文字、图片、视频和音频等内容制作成二维码。

AutoPod

AutoPod是一款基于人工智能技术的视频剪辑工具,专为Adobe Premiere Pro用户打造。它支持多机位编辑、社交媒体优化以及跳跃剪辑等功能,能够大幅提升视频编辑效率。该工具兼容多种摄像机配置,提供灵活的自定义选项和预设功能,广泛应用于播客制作、在线教育、企业宣传及社交媒体内容创作等领域。

微微在线二维码生成器

微微二维码是专业二维码制作服务商,提供视频音频二维码生成、图片文件二维码制作、二维码表单登记系统、二维码管理系统,广泛应用于:产品宣传、企业展示、旅游、教育培训、建筑...

快对

快对是一款基于AI技术的教育辅助工具,覆盖小学至大学全学科,提供作业检查、错题管理、英语翻译、视频讲解及学习资料等功能。通过智能识别与解析,帮助用户高效解决学习难题,优化学习体验。支持错题分类整理、资料收藏与分享,适用于自主学习、家长辅导及备考复习等多种场景。

Reachout.ai

Reachout.ai是一个人工智能驱动的视频开发平台,专为忙碌的企业家和销售团队打造,他们希望突破收件箱的噪音,大规模生成个性化视频,并获得更高的电子邮件回复率和更多与理想客户...

Hallo2

Hallo2是一款由复旦大学、百度公司和南京大学合作开发的音频驱动视频生成模型。它能够将单张图片与音频结合,并通过文本提示调节表情,生成高分辨率4K视频。Hallo2采用了补丁下降、高斯噪声等数据增强技术,提升了视频的视觉一致性和时间连贯性,同时通过语义文本标签提高了生成内容的可控性与多样性。该模型适用于电影、游戏、虚拟助手等多个领域,展现出强大的内容生成能力。

Typeframes

Typeframes是一个创新的AI在线视频创作平台,允许用户通过简单的文本输入来快速生成专业的产品介绍视频。该工具的核心优势在于它的便捷性和易用性,无需掌握复杂的视频编辑软件,...