Transformer

LongLLaVA

LongLLaVA是由香港中文大学（深圳）研究团队开发的多模态大型语言模型，结合Mamba和Transformer模块，利用2D池化技术压缩图像token，大幅提升处理大规模图像数据的效率。该模型在视频理解、高分辨率图像分析及多模态代理任务中表现优异，特别擅长检索、计数和排序任务。其技术亮点包括渐进式训练策略和混合架构优化，支持多种多模态输入处理，广泛应用于视频分析、医学影像诊断、环境监测等领域。

AI项目与工具 2025年06月12日 67 点赞 0 评论 438 浏览

Hunyuan3D

Hunyuan3D-1.0 是腾讯推出的一款3D生成模型，支持文本和图像输入生成高质量3D资产。该模型采用两阶段方法，包含轻量版和标准版，具有快速生成和高质量重建的特点，广泛应用于3D创作、工业设计、建筑设计等领域。

AI项目与工具 2025年06月12日 76 点赞 0 评论 443 浏览

Florence

Florence-2是微软Azure AI团队研发的多功能视觉模型，支持图像描述、目标检测、视觉定位和图像分割等功能。该模型基于Transformer架构，采用序列到序列学习方法，利用自注意力机制实现多模态信息融合。通过训练大规模数据集，Florence-2在多个应用场景中表现出色，包括图像和视频分析、内容审核、辅助驾驶、医疗影像分析以及零售和库存管理。

AI项目与工具 2025年06月12日 67 点赞 0 评论 443 浏览

GameGen

GameGen-O 是一款基于 Transformer 架构的AI工具，专注于开放世界游戏视频的生成。它具备角色生成、环境构建、动作模拟及交互式控制等功能，通过两阶段训练方法提升了生成质量和灵活性，可应用于游戏原型设计、场景生成及开发辅助等领域，有助于降低开发成本并提高创作效率。

AI项目与工具 2025年06月12日 17 点赞 0 评论 458 浏览

豆包Seaweed

豆包Seaweed是一款基于Transformer架构的AI视频生成工具，支持文生视频和图生视频模式，能够生成高逼真度、细节丰富的视频内容，广泛应用于电商、文旅、教育等领域，大幅降低视频制作门槛，提升创作效率。

AI项目与工具 2025年06月12日 59 点赞 0 评论 465 浏览

MagicArticulate

MagicArticulate是由南洋理工大学与字节跳动Seed实验室联合开发的3D模型动画化工具，支持自动骨架生成、蒙皮权重预测及高质量动画输出。其基于自回归Transformer架构，结合Articulation-XL大规模数据集，实现对多样化3D模型的高效处理。适用于3D动画、游戏开发、VR/AR、工业设计等多个领域，显著提升动画制作效率与质量。

AI项目与工具 2025年06月12日 22 点赞 0 评论 469 浏览

MAGI

MAGI-1是一款由Sand AI开发的开源视频生成大模型，采用自回归架构，支持高效、高质量的视频生成，具备高分辨率输出、无限扩展能力和可控生成特性。适用于内容创作、影视制作、游戏开发等多个领域，技术上融合了自回归去噪、Transformer VAE、扩散模型等创新方法，提升生成效率与稳定性。

AI项目与工具 2025年06月11日 37 点赞 0 评论 470 浏览

Fugatto

Fugatto是一款由英伟达开发的音频合成与转换模型，利用增强型Transformer架构实现了从文本到音频的高效转化。它支持多种音频生成任务，如音乐创作、声音效果设计及语音合成，并可通过ComposableART技术实现对声音属性的精细调控。此外，Fugatto擅长生成动态变化的声音景观，广泛应用于音乐创作、声音设计及广告音频制作等领域。

AI项目与工具 2025年06月12日 44 点赞 0 评论 472 浏览

Insert Anything

Insert Anything是由多所高校联合开发的图像插入框架，支持多种场景下的对象无缝融合，如艺术创作、虚拟试穿和影视特效等。基于大规模数据集训练，具备高分辨率输出与语义一致性保障。用户可通过掩码或文本指令实现精准控制，适用于创意设计与数字内容生成领域。

AI项目与工具 2025年06月11日 30 点赞 0 评论 473 浏览

Allegro

Allegro 是一款由 Rhymes AI 开发的文本到视频生成工具，可将描述性文本快速转化为高质量的动态视频内容。支持 720p 分辨率、15 FPS 帧率和最长 6 秒的视频输出，具有高时间一致性，适用于内容创作、广告营销、教育培训等多个领域，凭借先进的技术架构和强大的功能，成为视频生成领域的领先解决方案之一。

AI项目与工具 2025年06月12日 41 点赞 0 评论 476 浏览

Transformer

首页

Transformer

列表

默认

浏览次数

发布日期