模型

InternVL3

InternVL3是上海人工智能实验室推出的多模态大型语言模型,具备文本、图像、视频等多模态数据处理能力。采用原生多模态预训练方法,提升语言与视觉理解效率,并支持工具使用、3D视觉、工业图像分析等复杂任务。模型可通过API部署,适用于智能交互、图像识别、视频分析及客服系统等多种场景。

WPS AI

WPS AI是金山办公推出的一款具备大语言模型能力的生成式人工智能应用,也是中国协同办公领域的首个类ChatGPT式应用。它主要面向办公、写作和文档处理,旨在通过AI技术提升用户的工...

NEXUS

NEXUS-O是一款由多家知名机构联合开发的多模态AI模型,能够处理音频、图像、视频和文本等多种输入,并以相应形式输出结果。它在视觉理解、音频问答、语音识别和翻译等方面表现出色,具备强大的跨模态对齐与交互能力。模型基于视觉语言预训练,结合高质量音频数据提升性能,并通过多模态任务联合训练增强泛化能力。适用于智能语音助手、视频会议、教育、智能驾驶、医疗健康等多个领域。

xAI Grok-2

xAI的Grok-2代表了语言模型技术的新进展,特别是其推理能力,为处理复杂的数据分析和自然语言理解任务提供了强大的工具。

云锦天章

云锦天章是一款基于DCFormer架构的通用大模型,能够高效地进行文字扩写、缩写和风格变换,具备问答、数学、编程等基础能力。它通过动态组合多头注意力机制,大幅提升模型效率并降低能耗,适用于小说创作、教育辅导、内容生成、企业服务及娱乐等多个领域。

DeepFloyd

DeepFloyd IF是一个强大的文本到图像生成模型,能够生成高分辨率和逼真度的图像。它结合了先进的语言理解和图像生成技术,提供了多种功能,如超分辨率、风格迁移和零样本学习。

ConsistentDreamer

ConsistentDreamer 是由华为慕尼黑研究中心开发的图像到 3D 资产生成技术,能通过单张图像生成多视图一致的 3D 网格。该技术采用多视图先验图像引导和分数蒸馏采样优化,结合动态权重平衡和多种损失函数,提升 3D 表面质量和纹理精度。支持复杂场景编辑、风格转换、物体修改等功能,适用于室内场景、艺术风格转换及跨视图一致性任务。

AutoVFX

AutoVFX是一款由伊利诺伊大学香槟分校研发的先进物理特效框架,通过神经场景建模、大型语言模型(LLM)代码生成及物理模拟技术,实现自然语言指令驱动的视频特效编辑与创作。其主要功能涵盖3D场景建模、程序生成、VFX模块、物理模拟、渲染与合成等,适用于电影制作、广告营销、游戏开发、虚拟现实及教育等多个领域。

Zonos

Zonos是一款由Zyphra开发的高保真文本到语音(TTS)模型,支持零样本语音克隆和多语言生成,具备精细的情感与语音参数控制能力。其采用Transformer和SSM混合架构,基于大规模语音数据训练,适用于有声读物、虚拟助手、多媒体创作及无障碍技术等多个领域。模型开源且支持实时语音生成,具有广泛的应用潜力。

理想同学网页版

理想同学网页版是一款由理想汽车推出的AI智能助手,集成DeepSeek R1/V3 671B满血版模型,支持多模型切换、联网搜索、图像识别等功能。用户可通过文字、长文本或图片进行交互,支持360°视觉追踪,提升交互体验。适用于办公、学习、多设备协同等场景,支持网页与移动端同步,打造无缝智能服务生态。