AI

腾讯混元文生视频

腾讯混元文生视频是一款利用AI技术生成高质量视频内容的工具,可根据文本提示生成具有大片质感的视频。它支持多语言输入,涵盖高清画质、流畅镜头切换及自然场景模拟等功能,适用于电影制作、广告设计、教育培训等多种应用场景。

FilmAgent

FilmAgent是一款由哈尔滨工业大学(深圳)研发的虚拟电影制作工具,基于多智能体协作框架,实现从剧本创作到镜头拍摄的全流程自动化。支持剧本生成、多智能体协作、镜头规划、语音合成等功能,适用于创意视频制作、影视教学及虚拟场景应用。系统在Unity 3D环境中运行,提升电影制作效率与创意表达能力。

Bearly

创建摘要、大纲和;研究文章的改写

Splitter.ai

Splitter.ai是一款基于人工智能技术的音频处理平台,能够实现音乐中的人声与乐器分离、混响消除以及多音轨分离等功能。它支持云端操作、多平台兼容,并广泛应用于音乐制作、音频编辑、卡拉OK伴奏制作及音频取证等领域。凭借其强大的AI算法和灵活的操作方式,Splitter.ai成为音乐工作者和音频爱好者的理想工具。

VASA

VASA-1是一个由微软亚洲研究院开发的生成框架,能够将静态照片转化为动态的口型同步视频。该框架利用精确的唇音同步、丰富的面部表情和自然的头部运动,创造出高度逼真的虚拟人物形象。VASA-1支持在线生成高分辨率视频,具有低延迟的特点,并且能够处理多种类型的输入,如艺术照片、歌唱音频和非英语语音。此外,通过灵活的生成控制,用户可以调整输出的多样性和适应性。

DesignEdit

DesignEdit是一个由微软亚洲研究院和北京大学的研究人员共同开发的AI图像编辑框架。它采用了多层潜在分解和融合技术,能够实现对象移除、移动、调整大小、翻转、相机平移和缩放等复杂图像编辑任务。DesignEdit还支持跨图像元素的组合,特别适用于设计图像和海报的编辑。通过关键掩码自注意力机制和伪影抑制方案,DesignEdit能够在不破坏图像整体连贯性的情况下,实现高精度的空间感知图像编辑。

DeepL-translator

DeepL Pro是一款由人工智能和神经网络提供支持的专业翻译服务,可跨多种设备和应用程序(包括文档、网页、电子邮件和口头对话)提供准确、安全和可定制的翻译

Upscalepics

一个免费在线工具,允许用户提升和增加图像的分辨率。它还提供了去除JPEG伪像、向图像添加细节和压缩图像的功能。

Make

Make-A-Character(简称Mach)是由阿里巴巴集团智能计算研究院开发的3D数字人生成框架,通过文本描述快速生成逼真的3D角色。该系统支持灵活的定制化、高度逼真的渲染、完整的角色模型及动画支持。其工作流程包括文本解析、视觉提示生成、参考肖像图像生成、密集面部坐标检测、几何生成、纹理生成、纹理修正、头发生成、资产匹配和角色装配。Mach生成的角色模型可以无缝集成到游戏和电影行业的标准CG