AI

TalkingAvatar.ai

TalkingAvatar.ai 是一款集 AI 技术与虚拟形象创作于一体的平台,支持视频内容的重写、重配音以及多语言适配。其核心功能包括语音克隆、唇形同步、文本编辑语音等,可满足视频内容创作、广告定制、多语言电商、教育视频制作等多种应用场景。平台提供灵活的订阅方案,支持多种语言和语音模型,帮助用户轻松实现视频内容的个性化和全球化。

Chaos® Vantage高阶应用

用实时光线追踪探索您的最复杂的3D场景。 使用 Chaos® Vantage,再也无需等待。只需要拖动完整的 V-Ray 场景到 Vantage 便可开始浏览。还可以与 3ds Max,SketchUp,Rhino,Revit ...

文心大模型

文心大模型是一种知识增强的自然语言处理(NLP)模型,由百度开发。它在技术开放日上首次亮相,展示了其在AI领域的最新技术突破和产业应用实践。

讯飞译制

讯飞译制是一款基于语音识别与机器翻译技术的智能字幕制作与翻译平台,支持多语言转换与自动字幕生成,提供高精度识别、智能时间码匹配、多格式导出及配音功能,适用于短视频出海、教学视频、广告宣传等多种场景,提升内容传播效率与国际化水平。

TokenFD

TokenFD是由上海交通大学与美团联合开发的细粒度图文对齐基础模型,专为文档理解任务设计。通过图像与语言Token的统一特征空间对齐,支持Token级图文交互,提升了多模态任务性能。其基于自研的TokenIT数据集进行训练,涵盖2000万张图像和18亿高质量Token-Mask对,覆盖多种文本图像类型。TokenFD可用于文档处理、图像审查、文字检索及大模型知识增强等多个领域,具有广泛的适用性和

MiniMax Audio

MiniMax Audio是一款基于人工智能的语音合成工具,支持多语言、多情感及声音克隆功能,可将文本快速转换为自然流畅的语音。它具备降噪、超长文本合成、实时语音生成等特性,适用于视频配音、播客制作、游戏配音等多种应用场景。

逗哥配音

逗哥配音是一款基于AI技术的在线配音平台,专为短视频创作者设计。它提供多样化的语音风格选择、智能配音制作工具以及声音克隆功能,支持无损音质输出。用户可以利用该平台轻松生成个性化配音作品,广泛适用于广告宣传、教育培训、游戏开发等多个领域。

Torch

Torch-MLU 是一个开源的 PyTorch 扩展插件,支持开发者将寒武纪 MLU 系列智能加速卡作为 PyTorch 的加速后端。它实现了对 PyTorch 的原生支持,使开发者能够无缝地将基于 GPU 的深度学习模型迁移到 MLU 硬件上,显著提高模型的训练和推理效率。此外,Torch-MLU 还支持自动混合精度训练,通过优化计算图等技术,进一步提升了模型的执行效率。

VACE

VACE是由阿里巴巴通义实验室推出的视频生成与编辑框架,支持文本到视频、参考生成、视频扩展、遮罩编辑等多种任务。其核心是Video Condition Unit(VCU),可整合多模态输入,实现任务灵活组合。支持480P和720P分辨率,适用于创意视频制作、视频修复、风格转换及互动创作等场景,具备高灵活性和广泛的应用潜力。

Clapper

Clapper是一款基于AI的开源视频编辑工具,旨在通过交互式、迭代和直观的过程简化视频创作流程。其主要功能包括将剧本内容转化为视觉元素、集成多种AI技术、提供导演模式以及支持无限画布和传统界面两种编辑模式。Clapper不仅适用于个人创作,还广泛应用于教育、商业宣传、社交媒体和电影电视制作等领域。