零样本学习

LinFusion

LinFusion 是一种创新的图像生成模型，基于线性注意力机制高效处理高分辨率图像生成任务。它在处理大量像素时保持计算复杂度线性增长，显著提高生成效率。LinFusion 支持零样本跨分辨率生成，并与预训练模型组件如 ControlNet 和 IP-Adapter 兼容。在单个 GPU 上，LinFusion 能够生成高达 16K 分辨率的图像，广泛应用于艺术创作、游戏设计、虚拟现实等领域。

AI项目与工具 2025年06月12日 96 点赞 0 评论 757 浏览

Agent Q是一种自监督代理推理和搜索框架，结合了引导式蒙特卡洛树搜索（MCTS）、AI自我批评及直接偏好优化（DPO）等技术。该框架通过迭代微调和基于人类反馈的强化学习进行自我改进，在网页导航和多步任务执行中表现优异。Agent Q的主要功能包括引导式搜索、自我批评、迭代微调、多步推理任务和零样本学习。它在电子商务、在线预订服务、软件开发、客户服务、数据分析和个性化推荐等领域具有广泛应用前景。

AI项目与工具 2025年06月12日 77 点赞 0 评论 612 浏览

MOFA

MOFA-Video是由腾讯AI实验室和东京大学研究人员开发的开源图像生成视频模型。该工具通过生成运动场适配器对图像进行动画处理，能够通过稀疏控制信号（如手动轨迹、面部关键点序列或音频）实现对视频生成过程中动作的精准控制。MOFA-Video支持零样本学习，能够将多种控制信号组合使用，生成复杂的动画效果，并能生成较长的视频片段。 ---

AI项目与工具 2025年06月12日 22 点赞 0 评论 533 浏览

OpenVoice

OpenVoice是一款由MyShell开发的免费开源AI语音克隆工具，其主要功能包括精准的音色和音调克隆及灵活的语音风格控制。该工具能够捕捉并复制不同语言或口音的音色，生成自然流畅的语音，并支持零样本跨语言语音克隆。开发者可以通过GitHub项目地址进行本地安装和运行，也可以通过Lepton AI、MyShell或HuggingFace提供的在线演示体验该工具。

AI项目与工具 2025年06月12日 49 点赞 0 评论 633 浏览

零样本学习

首页

零样本学习

列表

默认

浏览次数

发布日期

LinFusion

Agent Q

MOFA

OpenVoice

零样本学习 首页 零样本学习

列表 默认 浏览次数 发布日期

LinFusion

Agent Q

MOFA

OpenVoice

零样本学习

首页

零样本学习

列表

默认

浏览次数

发布日期