生成

QLIP

QLIP是一种基于二进制球形量化(BSQ)的视觉标记化方法,具备高质量图像重建和零样本图像理解能力。通过对比学习目标和两阶段训练策略,QLIP可作为视觉编码器或图像标记器,广泛应用于多模态任务,如文本到图像生成、图像到文本生成及多模态理解。其技术设计提升了模型的语义表达与训练效率,为统一多模态模型的开发提供了新思路。

SNOOPI

SNOOPI是一种基于增强单步扩散模型的文本到图像生成框架,通过PG-SB和NASA技术提高了模型的稳定性和控制力。它在多方面表现出色,包括提高生成效率、排除不期望的图像元素、支持多种模型背板以及生成高质量图像。SNOOPI广泛应用于数字艺术、游戏开发、广告、社交媒体和影视等领域。

VideoLLaMB

VideoLLaMB 是一个创新的长视频理解框架,通过引入记忆桥接层和递归记忆令牌来处理视频数据,确保在分析过程中不会丢失关键的视觉信息。该模型专为理解长时间视频内容而设计,能够保持语义上的连续性,并在多种任务中表现出色,例如视频问答、自我中心规划和流式字幕生成。VideoLLaMB 能够有效处理视频长度的增加,同时保持高性能和成本效益,适用于学术研究和实际应用。 ---

AlibabaWOOD

AlibabaWood通过融合电商视频设计与人工智能,为商家提供了一个高效、智能的视频创作解决方案。它不仅能提升商品的成交和曝光率,还能增加店铺访客数和总成交量。

Luma ai

一套三维重建技术方案,它的特点是基于现有视角的图像生成新视角的图像。

Interior AI

Interior AI是一个人工智能图像生成器平台,允许用户上传自己(或其他人)家的图像,并根据17种预选风格之一生成新的外观和布局。它是日益增长的人工智能图像生成器生态系统的一部分...

SheetGod

SheetGod是BoloForms推出的一款基于人工智能技术的Excel公式生成工具。

紫东太初大模型

紫东太初,中科院自动化所和武汉人工智能研究院推出新一代大模型,从三模态走向全模态,支持多轮问答、文本创作、图像生成、3D理解、信号分析等全面问答任务,拥有更强的认知、理解、创作能力,带来全新互动体验。

笔尖AI论文

一款专为大学生、研究生和博士生设计的智能论文辅助工具,笔尖AI目的为用户提供高效、精准的毕业论文、期刊论文范文写作服务。笔尖AI还支持论文降重和查重,帮助学生在写作过程中优化内容,提升原创性,确保论文符合学术要求。

Direct3D

Direct3D-S2是由南京大学、DreamTech、复旦大学和牛津大学联合开发的高分辨率3D生成框架,基于稀疏体积表示和空间稀疏注意力(SSA)机制,提升扩散变换器(DiT)的计算效率并降低训练成本。该框架包含全端到端的稀疏SDF变分自编码器(SS-VAE),支持多分辨率训练,在1024³分辨率下仅需8个GPU即可训练。Direct3D-S2能够从图像生成高分辨率3D形状,具有精细几何细节和高