Transformer

Oasis

Oasis是一款依托于AI技术的实时生成游戏，无需依赖传统游戏引擎即可实现每秒20帧的高质量交互式视频内容输出。它支持玩家自由探索开放世界，并通过动态调整机制提供个性化体验。凭借开源特性及硬件优化能力，Oasis展示了AI在内容创作领域的巨大潜力，适用于游戏、教育、虚拟旅游等多个领域。

AI项目与工具 2025年06月12日 83 点赞 0 评论 651 浏览

DocMind

DocMind是一款基于Transformer架构的文档智能大模型，融合了深度学习、NLP和CV技术，用于处理富文本文档的复杂结构和视觉信息。它能够精准识别文档实体、捕捉文本依赖关系并深入理解文档内容，支持知识库结合，提升专业文档理解能力。DocMind还具备自动执行文档相关任务的功能，如问题解答、文档分类整理等，广泛应用于法律、教育、金融等领域。

AI项目与工具 2025年06月12日 89 点赞 0 评论 851 浏览

Hunyuan3D

Hunyuan3D-1.0 是腾讯推出的一款3D生成模型，支持文本和图像输入生成高质量3D资产。该模型采用两阶段方法，包含轻量版和标准版，具有快速生成和高质量重建的特点，广泛应用于3D创作、工业设计、建筑设计等领域。

AI项目与工具 2025年06月12日 76 点赞 0 评论 443 浏览

Hunyuan-Large是一款由腾讯开发的大规模混合专家（MoE）模型，以其庞大的参数量成为当前参数规模最大的开源MoE模型之一。该模型基于Transformer架构，擅长处理长文本任务，同时在多语言自然语言处理、代码生成以及数学运算等领域展现出色性能。通过合成数据增强训练与创新的注意力机制，Hunyuan-Large实现了高效的推理吞吐量，并广泛应用于内容创作、教育辅助、知识问答及数据分析等多

AI项目与工具 2025年06月12日 69 点赞 0 评论 701 浏览

Ichigo

Ichigo是一款开源的多模态AI语音助手，采用混合模态模型，支持实时处理语音和文本交织序列。它通过统一的Transformer架构实现跨模态联合推理，提供低延迟的实时性能，并支持多语言、多轮对话及模糊输入处理。Ichigo适用于智能家居、个人助理、客户服务、教育和健康咨询等多种应用场景，展现了高效、灵活的技术优势。

AI项目与工具 2025年06月12日 96 点赞 0 评论 548 浏览

CogVideoX v1.5

CogVideoX v1.5是一款由智谱研发的开源AI视频生成工具，具备文本到视频生成、图像到视频转换等功能，支持高清视频输出及音效匹配。它通过三维变分自编码器（3D VAE）、Transformer架构等技术手段，提升了视频生成的质量与效率，适用于内容创作、广告营销、教育培训等多个领域。

AI项目与工具 2025年06月12日 19 点赞 0 评论 875 浏览

MiLoRA

MiLoRA是一种参数高效的大型语言模型微调方法，通过奇异值分解将权重矩阵分为主要和次要两部分，专注于次要部分的优化以降低计算成本，同时保持模型的高精度和高效性。它在自然语言处理任务中表现出色，适用于文本分类、情感分析、问答系统等多个领域，并在多租户环境和实时内容生成中展现出显著优势。 ---

AI项目与工具 2025年06月12日 47 点赞 0 评论 614 浏览

OpenCoder

OpenCoder是一个开源代码大型语言模型（LLM），具备代码生成、审查、补全、错误调试等功能，支持多种编程语言，通过预训练、指令微调及优化策略提升性能，推动代码AI研究的透明化与可重复性，广泛应用于开发效率提升、代码质量保障及编程教育等领域。

AI项目与工具 2025年06月12日 58 点赞 0 评论 542 浏览

Vidu 1.5

Vidu 1.5是一款基于多模态视频大模型的AI生成工具，支持参考生视频、图生视频和文生视频生成，通过精准的语义理解能力，在30秒内完成高质量视频创作，适用于影视、动漫、广告等多行业场景，助力创作者高效产出多样化内容。

AI项目与工具 2025年06月12日 80 点赞 0 评论 569 浏览

Florence

Florence-2是微软Azure AI团队研发的多功能视觉模型，支持图像描述、目标检测、视觉定位和图像分割等功能。该模型基于Transformer架构，采用序列到序列学习方法，利用自注意力机制实现多模态信息融合。通过训练大规模数据集，Florence-2在多个应用场景中表现出色，包括图像和视频分析、内容审核、辅助驾驶、医疗影像分析以及零售和库存管理。

AI项目与工具 2025年06月12日 67 点赞 0 评论 443 浏览

Transformer

首页

Transformer

列表

默认

浏览次数

发布日期