预训练模型

码多多AI智能论文写作系统

基于前后端分离架构以及Vue3、uni-app、ThinkPHP6.x、PHP8.0技术栈开发，包含PC端、H5自适应。

Ai编程建站 2025年06月05日 98 点赞 0 评论 562 浏览

xLAM

xLAM 是 Salesforce 开源的一款大型语言模型，专为功能调用任务设计。该模型具备多语言支持、预训练模型、迁移学习、自然语言处理等主要功能，并基于 Transformer 架构实现。它在多个基准测试中表现出色，适用于自动化任务、模板共享、插件开发和教育等多个应用场景。

AI项目与工具 2025年06月12日 55 点赞 0 评论 560 浏览

SpatialVLA

SpatialVLA是一款由多机构联合研发的空间具身通用操作模型，具备强大的3D空间理解能力与跨平台泛化控制能力。通过Ego3D位置编码和自适应动作网格技术，实现精准的环境感知与动作生成。支持零样本任务执行与快速微调，适用于工业、物流、医疗等多个领域，推动机器人技术的发展与应用。

AI项目与工具 2025年06月12日 39 点赞 0 评论 541 浏览

Show

Show-o 是一款基于统一 Transformer 架构的多模态 AI 工具，集成了自回归和离散扩散建模技术，可高效处理视觉问答、文本到图像生成、图像修复与扩展以及混合模态生成等多种任务。其创新性技术显著提高了生成效率，减少了采样步骤，适用于社交媒体内容创作、虚拟助手、教育与培训、广告营销、游戏开发及影视制作等多个领域。

AI项目与工具 2025年06月12日 86 点赞 0 评论 517 浏览

乾元BigBangTransformer

BBT-2-12B-Text基于中文700亿tokens进行预训练，经过指令微调的BBT-2基础模型可以回答百科类和日常生活的问题。BBT-2.5-13B-Text基于中文+英文 2000亿tokens进行预训练。

Ai平台模型 1970年01月01日 0 点赞 0 评论 512 浏览

深言科技

深言科技是一家由孙茂松教授和其学生一同创办的创业公司，致力于使用世界领先的人工智能和自然语言处理技术，为数亿脑力劳动深言科技（DeepLang AI）者和数千万组织的信息处理全流...

创作工具 1970年01月01日 0 点赞 0 评论 504 浏览

LaTRO

LaTRO（Latent Reasoning Optimization）是一种用于提升大型语言模型推理能力的框架，通过将推理过程视为潜在分布采样并采用变分推断方法进行优化，无需外部反馈即可增强模型生成高质量推理路径的能力。该框架支持自奖励机制、联合学习及梯度估计等技术，广泛应用于数学问题求解、科学问题解答、编程任务、逻辑推理以及自然语言理解等领域，有助于构建更智能、更自主的问题解决系统。

AI项目与工具 2025年06月12日 45 点赞 0 评论 492 浏览

GameFactory

GameFactory 是由香港大学与快手科技联合研发的AI框架，专注于解决游戏视频生成中的场景泛化问题。它基于预训练视频扩散模型，结合开放域数据与高质量游戏数据，通过多阶段训练实现动作可控的多样化场景生成。具备高精度动作控制、交互式视频生成及丰富场景支持，适用于游戏开发、自动驾驶模拟及具身智能研究等领域。

AI项目与工具 2025年06月12日 31 点赞 0 评论 490 浏览

ELLA（Efficient Large Language Model Adapter）是一种由腾讯研究人员开发的方法，旨在提升文本到图像生成模型的语义对齐能力。它通过引入时序感知语义连接器（TSC），动态提取预训练大型语言模型（LLM）中的时序依赖条件，从而提高模型对复杂文本提示的理解能力。ELLA无需重新训练，可以直接应用于预训练的LLM和U-Net模型，且能与现有模型和工具无缝集成，显著提升

AI项目与工具 2024年01月01日 74 点赞 0 评论 490 浏览

MinT

MinT是一款基于时间基位置编码技术的多事件视频生成框架，允许用户通过文本提示生成包含多个事件的连贯视频，并支持对事件顺序及持续时间的精确控制。其核心技术ReRoPE使得模型能够有效关联文本提示与视频帧，同时结合预训练的视频扩散变换器（DiT）和大型语言模型（LLM）的提示增强功能，进一步提升了视频生成的质量与丰富度。MinT适用于娱乐、广告、教育等多个领域，为视频创作带来了创新性的解决方案。

AI项目与工具 2025年06月12日 42 点赞 0 评论 457 浏览

预训练模型

首页

预训练模型

列表

默认

浏览次数

发布日期