Transformer

腾讯混元3D

全称为Hunyuan3D-1.0，是腾讯推出的一款同时支持文生和图生的3D开源模型，解决现有3D生成模型在生成速度和泛化能力的不足。

Ai开源项目 2025年06月05日 59 点赞 0 评论 667 浏览

YAYI2

中科闻歌研发的一款新一代开源大语言模型，中文名为“雅意”。该模型包含 Base 和 Chat 版本，参数规模达到 30B，基于 Transformer 架构构建。

Ai平台模型 2025年06月05日 11 点赞 0 评论 768 浏览

混元hunyuan

腾讯发布的快思考模型，混元hunyuan-TurboS响应速度较前代产品提升了一倍，首字时延降低了44%。优化后的模型使得即时生成内容流畅，适用于知识、数理和创作等多方面应用。

Ai平台模型 2025年06月05日 69 点赞 0 评论 485 浏览

UIGEN

一个基于 Qwen2.5-Coder-7B 模型微调的开源 UI 设计生成工具，能够根据用户输入的提示生成结构清晰且符合标准的 HTML 和 CSS 代码

Ai编程建站 2025年06月05日 44 点赞 0 评论 798 浏览

Etna模型

一个文字转视频的AIGC模型，Etna能够根据简短的文本描述生成相应的视频内容，支持生成时长为8-15秒的视频，且视频流畅度极高，每秒可达60帧。

Ai视频生成 2025年06月05日 28 点赞 0 评论 790 浏览

VideoPoet是一款基于大模型的AI视频生成工具，支持从文本、图像或视频输入中合成高质量的视频内容及匹配的音频。其核心优势在于多模态大模型设计，能够处理和转换不同类型的输入信号，无需特定数据集或扩散模型即可实现多种风格和动作的视频输出。主要功能包括文本到视频转换、图像到视频动画、视频风格化、视频编辑和扩展、视频到音频转换以及多模态学习等。技术原理涉及多模态输入处理、解码器架构、预训练与任务适应

AI项目与工具 2024年01月01日 98 点赞 0 评论 577 浏览

Stable Diffusion 3

Stable Diffusion 3 是一款由 Stability AI 开发的先进文本到图像生成模型，通过改进的文本渲染能力、多主题提示支持、可扩展的参数量、图像质量提升及先进的架构技术，实现了高质量和多样性的图像生成。该模型在图像生成和文本理解方面取得了显著进展，并通过 Diffusion Transformer 架构和 Flow Matching 技术提升了模型效率和图像质量。

AI项目与工具 2024年01月01日 87 点赞 0 评论 705 浏览

DUSt3R

DUSt3R是一个由芬兰阿尔托大学和Naver欧洲实验室联合研发的3D重建框架。该框架能够快速地从任意图像集合中重建出三维场景，无需事先了解相机校准或视点位置信息。DUSt3R主要功能包括快速3D重建、无需相机校准、多视图立体重建、单目和双目重建以及生成深度图、置信度图和点云图。它采用了点图表示法、Transformer网络架构和端到端训练方式，并提出了全局对齐策略来处理多视图重建任务。

AI项目与工具 2024年01月01日 53 点赞 0 评论 543 浏览

PixArt

PixArt-Σ是一款基于扩散Transformer架构（DiT）的文本生成图像模型，专为生成高达4K分辨率的高质量图像而设计。该模型通过整合高级元素并采用从弱到强的训练方法，不仅提升了生成图像的保真度，还增强了图像与文本提示之间的对齐效果。PixArt-Σ的生成图像在美学质量上可媲美当前顶级的文本到图像产品，并且在遵循文本提示方面表现出色。主要功能包括4K分辨率图像生成、高保真转换、高效率训练和

AI项目与工具 2024年01月01日 82 点赞 0 评论 803 浏览

Transformer Debugger

Transformer Debugger (TDB) 是一款由OpenAI的对齐团队开发的工具，用于帮助研究人员和开发者理解和分析Transformer模型的内部结构和行为。它提供了无需编程即可探索模型结构的能力，并具备前向传递干预、组件级分析、自动生成解释、可视化界面及后端支持等功能。TDB 支持多种模型和数据集，包括GPT-2模型及其自动编码器。

AI项目与工具 2024年01月01日 95 点赞 0 评论 569 浏览

Transformer

首页

Transformer

列表

默认

浏览次数

发布日期