视频

Spirit Me

SpiritMe允许用户使用数字化身制作视频,这些化身可以用自己的声音和情感表达说出他们输入的任何文本。它提供订阅、预付费计划和免费试用。它可以作为一种工具来进行交流,生成个...

WorldScore

WorldScore是由斯坦福大学推出的统一世界生成模型评估基准,支持3D、4D、图像到视频(I2V)和文本到视频(T2V)等多种模态。它从可控性、质量和动态性三个维度进行评估,涵盖3000个测试样本,包括静态与动态、室内与室外、逼真与风格化等多种场景。WorldScore具备多场景生成、长序列支持、图像条件生成、多风格适配等功能,适用于图像到视频、图像到3D生成以及自动驾驶场景模拟等应用,为研究

MacWhisper

MacWhisper是一款基于OpenAI Whisper技术的AI音频转文字工具。它能够在本地设备上将音频文件快速转录成文本,并支持多种语言。该工具具有多种音频和视频格式兼容性,提供不同的转录模型选择,支持字幕导出,且具备视频播放功能。最新版本增加了基于Apple芯片的硬件加速,提升了实时语音识别效率,并集成了OpenAI语言模型以提高转录和翻译的准确性。MacWhisper适用于记者、媒体工作

HumanOmni

HumanOmni 是一款面向人类中心场景的多模态大模型,融合视觉与听觉信息,具备情感识别、面部描述、语音理解等功能。基于大量视频与指令数据训练,采用动态权重调整机制,支持多模态交互与场景理解。适用于影视分析、教育、广告及内容创作等领域,具备良好的可扩展性和灵活性。

Neural.Love

neural.love是一个提供免费AI图像生成和AI增强工具的网站。用户可以访问数百万的公共领域图像,用于他们的创意项目,并可以使用AI技术轻松增强图像。

Genmo

Genmo是一个创造和分享交互式、沉浸式生成艺术的平台。通过创建视频、3D场景、动画、矢量设计资产等,超越Genmo上的2D图像。

浦语灵笔

浦语灵笔IXC-2.5是一款由上海人工智能实验室开发的多模态大模型,具备7B规模的大型语言模型后端,能够处理长上下文、超高分辨率图像和细粒度视频理解,支持多轮多图像对话。该模型可以自动生成网页代码和高质量图文内容,在多模态基准测试中表现出色,性能可与OpenAI的GPT-4V相媲美。

Doctronic

Doctronic是一款结合人工智能技术的在线医疗服务平台,支持用户通过文字或视频形式与医生互动,进行初步健康评估、症状诊断及个性化医疗建议。其核心功能包括AI健康咨询、视频医生访问、隐私保护以及处方开具等,同时提供专家转诊服务。Doctronic特别适合非紧急医疗需求、初步症状评估以及行动不便人群,尤其适用于远程医疗服务场景。

米壳AI

企业必备的AI剪辑工具,提供翻译和视频解说。无惧出海,米壳AI助力本地化视频营销。