微调

Luzia

Luzia是由西班牙初创公司Amperity开发的一款人工智能聊天机器人,主要服务于西语和葡语市场。它具备个性化设计和人性化交流的特点,能够模拟不同角色以适应各种对话场景。此外,Luzia还集成了数学问题解答、PDF阅读器和图像识别等多种实用工具,增强了其实用性和用户体验。

VFusion3D

VFusion3D 是一个由Meta和牛津大学研究团队共同开发的AI生成3D模型工具,可以从单张图片或文本描述生成高质量的3D对象。它通过微调预训练的视频AI模型生成合成的3D数据,解决了3D训练数据稀缺的问题。该工具具备快速生成3D模型、多视角渲染、高质量输出等功能,并广泛应用于虚拟现实、游戏开发、电影制作和3D打印等领域。

CogView

CogView-3-Plus是智谱AI研发的AI文生图模型,采用Transformer架构替代传统的UNet,优化了扩散模型中的噪声规划。它能够根据用户指令生成高质量、高美学评分的图像,支持多种分辨率,并具有实时生成图像的能力。该模型已被集成到“智谱清言”APP中,并提供API服务,适用于艺术创作、游戏设计、广告制作等多个图像生成领域。

AgentGen

AgentGen是一款由香港大学与微软联合研发的AI项目框架,旨在通过自动生成多样化环境和任务,显著提升大语言模型(LLM)的规划能力。其核心技术包括环境生成、任务生成和动态难度调节,支持零样本生成和指令微调,适用于机器人控制、智能家居等多个领域。

Freepik Mystic

Freepik Mystic是一款由Magnific AI和Freepik合作开发的AI图像生成工具,它能够生成高分辨率(1,664 x 2,432)的全高清图像,涵盖写实肖像、动物、风景、奇幻场景、室内设计、建筑概念、像素艺术、游戏元素和表情包等多种类型。图像由顶尖艺术家策划并经过微调优化,确保高质量输出。用户可以通过Freepik Premium订阅使用该工具,并期待其未来集成到Magnifi

GLM

GLM-4-Flash是一款由智谱AI开发的免费大模型API,具备强大的多轮对话、多语言处理能力以及网页检索和代码执行等功能。它利用深度学习技术,尤其是Transformer架构,来实现高效的语言处理和生成。该工具广泛应用于客户服务、内容创作、语言翻译、教育辅助和编程辅助等多个领域,为用户提供了一个全面而高效的AI解决方案。

LongWriter

LongWriter是一款由清华大学与智谱AI合作开发的长文本生成模型,能够生成超过10,000字的连贯文本。该模型基于增强的长上下文大型语言模型,采用了直接偏好优化(DPO)技术和AgentWrite方法,能够处理超过100,000个token的历史记录。LongWriter适用于多种应用场景,包括学术研究、内容创作、出版行业、教育领域和新闻媒体等。

xGen

xGen-MM是一款由Salesforce开发的开源多模态AI模型,具备处理文本和图像等数据类型的能力。该模型通过学习大量图像和文字信息,在视觉语言任务中表现出色,并通过开源模型、数据集和微调代码库促进模型性能的提升。xGen-MM具有多模态理解、大规模数据学习、高性能生成、开源可访问和微调能力等特点。其应用场景广泛,包括图像描述生成、视觉问答、文档理解、内容创作和信息检索等。

CogVideoX

CogVideoX是由智谱AI开发的开源AI视频生成模型,支持英文提示词生成6秒长、每秒8帧、分辨率为720x480的视频。它具备低显存需求、视频参数定制、3D Causal VAE技术和推理与微调功能。该模型采用基于Transformer的架构和3D Causal Variational Autoencoder技术,支持多阶段训练和自动及人工评估,适用于创意视频制作、教育材料、广告、游戏、电影编