AI

UniToken

UniToken 是一种面向多模态理解与生成任务的自回归模型,结合了离散与连续视觉表示,实现对图像语义与细节的全面捕捉。它支持图文理解、图像生成、多模态对话、复杂指令执行等多种任务,并具备细粒度视觉处理能力。适用于内容创作、智能客服、教育、医疗及自动驾驶等多个领域。

JoyGen

JoyGen是由京东科技与香港大学联合开发的音频驱动型3D说话人脸视频生成框架,能够实现唇部动作与音频信号的精准同步,并提供高质量的视觉效果。该工具采用单步UNet架构进行高效视频编辑,基于130小时中文视频数据集训练,在唇音同步和视觉质量方面表现优异。适用于虚拟主播、动画制作、在线教育及多语言视频生成等多个领域,为视频内容创作提供了创新解决方案。

Mnml AI

Mnml AI,建筑AI设计助手,用于建筑和室内设计的AI渲染工具。 AI 草图,在几秒钟内一键式生成渲染。

入梦AI变声器

入梦AI变声器提供了丰富的声音变化选项,从儿童的高亢声音到成年男性的低沉音调,用户可以根据自己的需求进行选择。

AutoSlide Ai

一个人工智能驱动的PPT演示文稿生成器,用于生成具有视觉吸引力和有效的演示文稿,使用机器学习来分析内容并节省您的时间和精力。

DeepEyes

DeepEyes是由小红书团队和西安交通大学联合开发的多模态深度思考模型,基于端到端强化学习实现“用图思考”能力,无需依赖监督微调。它在推理过程中动态调用图像工具,增强对细节的感知与理解,在视觉推理基准测试V* Bench上准确率高达90.1%。具备图像定位、幻觉缓解、多模态推理和动态工具调用等功能,适用于教育、医疗、交通、安防和工业等多个领域。

SkyReels Ai

一个由昆仑万维推出的AI短剧平台,集成了视频大模型与3D大模型,能够通过AI一键生成完整剧本、分镜、人物对白与背景音乐,支持角色形象、音色与分镜的自定义调整。

SceneXplain

SceneXplain 是一个强大的图像和视频理解工具,它通过提供详细的字幕和摘要,帮助用户和企业增强视觉内容的可访问性和叙事能力。

Moovly

Moovly是一个AI驱动的在线视频编辑和制作工具,专为商业和教育用途设计。它通过简化视频制作流程,使用户能够轻松创建各种类型的视频,如解释视频、促销视频、培训视频和视频教程...