模型

OmniHuman

OmniHuman是字节跳动推出的多模态人类视频生成框架,基于单张图像和运动信号生成高逼真视频。支持音频、姿势及组合驱动,适用于多种图像比例和风格。采用混合训练策略和扩散变换器架构,提升生成效果与稳定性,广泛应用于影视、游戏、教育、广告等领域。

MewX AI

MewX AI是一款集文生图、图生图、艺术二维码生成及室内设计于一体的生成式AI平台,支持多种风格的艺术创作与设计任务。主要功能包括MX绘画、MX Cute、MJ绘画、边缘检测和室内设计,广泛应用于艺术创作、平面设计、插画制作等领域。用户可以通过简洁的操作流程快速生成高质量图像,并灵活调整参数以满足个性化需求。

SynCamMaster

SynCamMaster是一款由多家顶尖高校与企业联合研发的多视角视频生成工具,支持从任意视点生成高质量开放世界视频。其核心技术包括结合6自由度相机姿态、多视图同步模块以及预训练文本到视频模型的增强版本。SynCamMaster不仅能在不同视角间保持动态同步,还能实现新视角下的视频合成与渲染,广泛应用于影视制作、游戏开发、虚拟现实及监控系统等领域。

EvolveDirector

EvolveDirector是一个由阿里巴巴与南洋理工大学合作开发的文本到图像生成框架,通过与高级模型API交互获取数据对,结合预训练的视觉语言模型(VLMs)动态优化训练集,大幅降低数据量和训练成本。该框架支持多模型学习、动态数据集管理及在线训练,显著提升了生成图像的质量和多样性,广泛应用于内容创作、媒体娱乐、广告营销、教育科研等多个领域。

MeteoRA

MeteoRA是一种基于LoRA和混合专家架构的多任务嵌入框架,用于大型语言模型。它支持多任务适配器集成、自主任务切换、高效推理及复合任务处理,提升模型灵活性和实用性。通过动态门控机制和前向加速策略,显著提高推理效率并降低内存占用,适用于多领域问答、多语言对话等场景。

MindSearch

MindSearch是一款开源的AI搜索框架,由上海人工智能实验室联合研发团队推出。它结合了大规模信息搜集和整理能力,利用InternLM2.5 7B对话模型,可在短时间内从众多网页中搜集有效信息。该框架采用多智能体框架模拟人类思维模式,先规划后搜索,从而提高信息的准确性和完整性。主要功能包括复杂查询处理、动态图构建、并行信息检索、分层检索策略、上下文管理和响应生成等。其应用场景广泛,包括学术研究

Photo AI

Photo AI 是一种革命性的人工智能工具,使用ai为您提供专业水准的照片拍摄,用于在各种设置中生成逼真的图像。

蓝心大模型BlueLM

蓝心大模型(BlueLM)是vivo推出的自研通用大模型矩阵,包含十亿、百亿、千亿三个参数量级共5款,主要面向端侧和云端服务,用于复杂逻辑推理等应用场景。

晓象

晓象是一款基于自研可信大模型的AI克隆工具,可创建各领域知识博主的虚拟分身。该工具能够模仿博主的声音、风格和表达方式,生成个性化的高质量内容,并支持实时互动,帮助用户获取知识分享和信息解读。应用场景广泛,包括知识传播、教育辅助、内容创作及信息解读。

面壁智能

面壁智能依托在自然语言处理方面的前沿技术,构建大规模预训练模型库及配套工具,推进大模型技术与应用的标准化。