生成

FLUX

FLUX-Controlnet-Inpainting是一款基于ControlNet和FLUX.1-dev技术的图像修复工具,能够通过用户指定的掩码区域对图像进行精准修复。其主要特点包括风格一致性、边缘和结构保持、高质量生成以及参数可调性。工具广泛应用于历史照片修复、艺术创作、媒体娱乐、广告营销、数据增强及医学成像等领域。

Enconvo

一款为macOS 设计的智能AI启动器,是所有AI功能的入口,也是一位体贴的智能助理,它支持无缝调用AI助手,提供丰富的插件和工具。

dorik

Dorik是一款基于AI技术的无代码网站构建平台,支持用户通过简单的提示快速创建美观且功能齐全的网站,无需编码或设计经验。平台提供白标CMS、博客平台、会员站点、SEO工具、Airtable集成等功能,并配备了丰富的模板和预设计UI组件。AI工具可自动生成文本和图像内容,加速网站构建过程。

TransPixar

TransPixar是由多所高校及研究机构联合开发的开源文本到视频生成工具,基于扩散变换器(DiT)架构,支持生成包含透明度信息的RGBA视频。该技术通过alpha通道生成、LoRA微调和注意力机制优化,实现高质量、多样化的视频内容生成。适用于影视特效、广告制作、教育演示及虚拟现实等多个领域,为视觉内容创作提供高效解决方案。

Xiaomi MiMo

Xiaomi MiMo 是小米推出的推理型大模型,具备强大的数学推理与代码生成能力。通过预训练与后训练相结合,利用大量高价值语料及强化学习算法,在 7B 参数规模下实现超越更大模型的表现。支持多场景应用,包括教育、科研、软件开发等,已开源至 HuggingFace,便于开发者使用与研究。

DAM

DAM-3B是英伟达开发的多模态大语言模型,专用于图像和视频中特定区域的详细描述。支持点、边界框、涂鸦或掩码等方式指定目标区域,生成精准文本描述。其核心技术包括焦点提示与局部视觉骨干网络,有效融合全局与局部特征。DAM-3B-Video版本扩展至视频处理,适用于动态场景。模型基于Transformer架构,支持多模态输入,广泛应用于内容创作、智能交互及无障碍工具等领域。

Bith AI

Bith AI 是一款AI驱动的视频创作与编辑工具,支持文本转视频、自动字幕生成、多平台尺寸适配、多媒体融合及一键发布等功能。适用于社交媒体、企业营销、教育培训和个人创作等多种场景,提升视频制作效率与专业度。

塔罗耳语AI

一个结合传统塔罗牌占卜与现代AI技术的线上平台,塔罗耳语提供用户个性化的塔罗牌解读服务。

DemoFusion

DemoFusion是一个技术框架,旨在低成本生成高分辨率图像。该框架通过扩展现有的开源生成人工智能模型(如Stable Diffusion),使得这些模型能够在不进行额外训练和不产生过高内存需求的情况下,将模糊的低分辨率图像转化为高清晰度图像。DemoFusion采用渐进式增强、跳跃残差和扩张采样机制,确保高分辨率图像生成的同时,保持图像的全局语义一致性和细节质量。适用于艺术创作、游戏开发、电影

Neural4D

Neural4D是一款由DreamTech团队开发的AI驱动型3D模型生成平台,利用Direct3D-5B大模型实现从文字或图片到高精度3D模型的自动化生成。其主要功能包括文本生成3D、图片生成3D、CuteMe Q版化身转换以及高精度模型输出。平台支持多种应用场景,如游戏开发、动画制作、虚拟现实设计、产品可视化及3D打印等,推动了3D内容创作领域的快速发展。