视频

CapsWriter

CapsWriter-Offline是一款基于PC端的离线语音输入与字幕转录工具,支持实时语音转文字功能,具备高准确率和无限时长录音能力。其核心技术依托于深度学习模型,可处理中英文混合语音,并提供热词自定义功能以提升特定术语的识别效果。此工具适用于会议记录、学术讲座、视频字幕生成等多种场景,同时确保用户数据的安全与隐私。 ---

Call Annie

Call Annie是一款基于AI技术的对话工具,通过视频通话形式提供虚拟AI助手Annie,支持实时交流和多种应用场景。主要功能包括实时视频通话、自然语言处理、个性化协助和多平台访问,适用于语言学习、情感陪伴、信息查询、旅行规划、教育辅导及职业发展等场景。

BasedLabs

BasedLabs是一款基于AI技术的图像和视频创作平台,提供包括AI视频生成、图像创作、图像扩展及换脸在内的多种功能。用户可利用平台内置的AI模型生成高质量的视觉内容,适用于社交媒体、数字艺术、广告营销、影视制作、游戏开发以及教育培训等多个领域。平台操作简便,适合各类创作者使用。

summarize.tech

Summarize.tech是一款利用AI技术生成长视频文字摘要的在线工具,可自动提取视频中的关键信息并提供定制化的摘要长度和时间戳标记。它支持多种语言和跨平台链接,适用于学习、研究、职场及娱乐等多个场景,帮助用户高效获取所需信息。

Outspeed

Outspeed 是一个专注于实时语音和视频 AI 应用开发的平台,提供强大的流媒体处理、低延迟推理、即时部署等功能,支持企业级合规标准。其核心特性包括灵活的模型定制、全面的 SDK 支持以及高效的应用监控工具,广泛应用于客户服务、教育、医疗保健、娱乐、安全监控和质量控制等领域。

Movie Gen

Movie Gen是Meta开发的一款AI视频生成与编辑工具,支持根据文本提示生成高清视频并提供同步音频配制。该工具具备强大的视频生成能力,可创建长达16秒的高清视频,并支持照片定制化视频生成和精准编辑功能。此外,它还拥有先进的音频生成技术,能够生成高质量的环境音效和背景音乐。当前,Movie Gen主要服务于Meta内部团队及部分合作伙伴,未来有望推广至更广泛的用户群体。 ---

Steve AI

Steve AI 是一款基于人工智能技术的云端视频生成平台,支持文本、博客、网页或音频内容转化为高质量视频和动画。它提供文本到视频、AI语音到视频、动画AI头像视频等多种功能,拥有超过300个AI头像及庞大的媒体库,同时配备40多种视频编辑工具。用户无需专业技能即可快速制作出专业级视频内容,广泛适用于社交媒体营销、教育培训、企业培训、内容营销和个人品牌建设等领域。

JoyHallo

JoyHallo是一款由京东开源的AI数字人模型,专注于普通话语音到视频的转换,支持跨语言生成。它通过半解耦结构优化唇部同步效果,并结合特征嵌入和交叉注意力机制提升生成质量。JoyHallo适用于虚拟主播、在线教育、客户服务、娱乐产业等多个领域,能够显著提升内容创作效率并降低成本。

I2VEdit

I2VEdit是一款基于图像到视频扩散模型的先进视频编辑框架,通过首帧编辑实现全视频效果传播。它能够保持视频的时间和运动一致性,支持局部与全局编辑任务,包括更换对象、风格转换等,并广泛应用于社交媒体内容创作、视频后期制作、虚拟试穿等领域。

Oryx

Oryx是一款由清华大学、腾讯和南洋理工大学联合开发的多模态大型语言模型,专为处理视觉数据设计。其核心技术包括预训练的OryxViT模型和动态压缩模块,支持任意分辨率的图像处理及高效的视觉数据压缩。Oryx在空间和时间理解上表现优异,广泛应用于智能监控、自动驾驶、人机交互、内容审核、视频编辑及教育等领域。