模型

EZapi

一家专业从事全球企业级API中转服务商,EZapi囊括了OpenAI,claude,MJ等全球几乎所有主流大模型的API。

MnnLlmApp

MnnLlmApp 是阿里巴巴基于 MNN-LLM 框架开发的开源 Android 应用,支持多种大语言模型在本地运行。具备多模态交互能力,可处理文本、图像、音频等多种输入输出任务。应用经过 CPU 推理优化,运行效率高,支持离线使用,保障数据安全。内置 Qwen、Gemma、Llama 等主流模型,适用于内容创作、智能助手、语言学习及创意设计等多种场景。

SimpleAR

SimpleAR是一款由复旦大学与字节跳动联合研发的纯自回归图像生成模型,采用简洁架构实现高质量图像生成。其通过“预训练-有监督微调-强化学习”三阶段训练方法,提升文本跟随能力与生成效果。支持文本到图像及多模态融合生成,兼容加速技术,推理速度快。适用于创意设计、虚拟场景构建、多模态翻译、AR/VR等多个领域。

OWL

OWL是一款基于CAMEL-AI框架的多智能体协作系统,支持任务自动化、角色分配与动态交互。其核心功能包括任务分解、记忆模块、灵活部署及大模型驱动的智能体架构。适用于知识工作、智能交通、医疗健康、电商推荐和环境监测等多个场景,提升任务执行效率与智能化水平。

Kandinsky

Kandinsky-3是一款基于潜在扩散模型的文本到图像生成框架,支持文本到图像生成、图像修复、图像融合、文本-图像融合、图像变化生成及视频生成等多种功能。其核心优势在于简洁高效的架构设计,能够快速生成高质量图像并提升推理效率。

3DHM

3DHM是一项由加州大学伯克利分校开发的3D人体动作生成技术,能够从单张照片生成动态人体视频,具备动作生成、编辑、评估、纹理修复、人体渲染及动作模仿等功能。该技术通过学习人体先验知识和3D运动序列,结合扩散模型和4DHumans预测模型,广泛应用于电影特效、虚拟现实、游戏开发等领域,为动画制作和人体动作模拟提供了创新解决方案。

Verifier Engineering

Verifier Engineering是一种创新的后训练方法,通过搜索、验证和反馈三个阶段优化基础模型性能。它采用目标条件马尔可夫决策过程(GC-MDP),结合线性与树搜索算法,对模型输出进行动态调整。其验证器分类涵盖多种形式和粒度,并支持基于训练和推理的反馈方式。这项技术已在自然语言处理、代码生成、教育和内容安全等领域展现广泛潜力,成为提升模型鲁棒性和智能化水平的重要工具。

LongReward

LongReward是一种由清华大学、中国科学院及智谱AI联合开发的AI工具,专注于通过多维度评估(有用性、逻辑性、忠实性和完整性)来优化长文本大型语言模型的表现。它利用现成的语言模型提供奖励信号,并结合强化学习算法改善模型性能,特别擅长处理复杂长文本任务,如文档理解、摘要生成及特定领域的数据分析,如法律、金融和医疗。

MATRIX

MATRIX-Gen是一个基于多智能体模拟技术的系统,通过构建虚拟社会生成高质量训练指令数据,用于提升大型语言模型的表现。该工具支持多种应用场景,如软件开发、商业活动、医疗诊断、教育和客户服务,能够显著提高模型在不同领域的性能,并促进其自我进化。

MotionGen

MotionGen是一款由元象科技开发的3D动作生成模型,它结合了大模型、物理仿真和强化学习算法,使得用户通过简单的文本指令就能生成逼真且流畅的3D动作。该工具简化了3D动画的制作过程,提升了创作效率。其主要功能包括文本到动作的转换、高度逼真和流畅的动作生成、个性化定制、高效的制作流程和技术融合。