零样本 - 智狐AI导航

Agent Q

Agent Q是一种自监督代理推理和搜索框架，结合了引导式蒙特卡洛树搜索（MCTS）、AI自我批评及直接偏好优化（DPO）等技术。该框架通过迭代微调和基于人类反馈的强化学习进行自我改进，在网页导航和多步任务执行中表现优异。Agent Q的主要功能包括引导式搜索、自我批评、迭代微调、多步推理任务和零样本学习。它在电子商务、在线预订服务、软件开发、客户服务、数据分析和个性化推荐等领域具有广泛应用前景。

AI项目与工具 2025年06月12日 77 点赞 0 评论 505 浏览

StochSync

StochSync是一种基于扩散同步（DS）和分数蒸馏采样（SDS）的图像生成技术，适用于360°全景图和3D纹理生成。它通过引入最大随机性与多步去噪方法，兼顾图像细节与连贯性，无需额外训练即可生成高质量图像。支持高分辨率输出，适用于复杂几何纹理化任务。

AI项目与工具 2025年06月12日 65 点赞 0 评论 506 浏览

Sa2VA

Sa2VA是由字节跳动联合多所高校开发的多模态大语言模型，结合SAM2与LLaVA技术，实现对图像和视频的密集、细粒度理解。它支持指代分割、视觉对话、视觉提示理解等多种任务，具备零样本推理能力和复杂场景下的高精度分割效果。适用于视频编辑、智能监控、机器人交互、内容创作及自动驾驶等多个领域。

AI项目与工具 2025年06月12日 66 点赞 0 评论 506 浏览

Seed Music

一个强大的音乐生成工具，它通过先进的技术手段，如自回归模型和扩散模型，为用户提供了从音乐创作到编辑再到声音转换的全方位服务。这套系统不仅能够生成高质量的音乐作品，还能...

创作工具 1970年01月01日 0 点赞 0 评论 512 浏览

OpenCity

OpenCity是一个由香港大学联合华南理工大学和百度共同研发的交通预测模型。该模型采用了Transformer架构和图神经网络，通过大规模预训练学习交通数据中的时空依赖关系，具有卓越的零样本预测能力和快速情境适应能力。OpenCity能够有效处理不同空间区域和时间的城市交通模式，并具备良好的可扩展性。其应用场景包括交通流量预测、交通拥堵分析、公共交通优化以及智能交通信号控制等。

AI项目与工具 2025年06月12日 32 点赞 0 评论 516 浏览

OpenVoice

OpenVoice是一款由MyShell开发的免费开源AI语音克隆工具，其主要功能包括精准的音色和音调克隆及灵活的语音风格控制。该工具能够捕捉并复制不同语言或口音的音色，生成自然流畅的语音，并支持零样本跨语言语音克隆。开发者可以通过GitHub项目地址进行本地安装和运行，也可以通过Lepton AI、MyShell或HuggingFace提供的在线演示体验该工具。

AI项目与工具 2025年06月12日 49 点赞 0 评论 523 浏览

AIMv2

AIMv2是苹果公司开发的开源多模态自回归预训练视觉模型，通过图像与文本的深度融合提升视觉理解能力。其采用图像块与子词标记拼接的方式进行自回归预训练，支持多种参数规模，适用于不同设备。具备视觉问答、指代表达理解、图像字幕生成、多媒体检索等功能，并可无缝集成到大型语言模型中。模型在多个视觉任务中表现优异，具备良好的可扩展性和零样本适应能力。

AI项目与工具 2025年06月12日 48 点赞 0 评论 525 浏览

Gen2Act

Gen2Act是一种基于预测网络生成人类视频的机器人操作策略，由谷歌、卡内基梅隆大学和斯坦福大学联合开发。它通过零样本视频生成、闭环策略执行和视觉特征提取等技术，实现了对未见过物体和动作的高效操作，支持复杂任务的长时执行，同时减少了对机器人数据采集的需求，广泛应用于家庭、工业、医疗和灾难救援等领域。

AI项目与工具 2025年06月12日 38 点赞 0 评论 531 浏览

MegaTTS 3

MegaTTS 3是由字节跳动与浙江大学合作开发的零样本文本到语音合成系统，采用轻量级扩散模型，支持中英文及混合语音合成，具备语音克隆、音色控制、韵律调节等功能。系统通过分解语音属性实现精准建模，可快速生成高质量语音，适用于教育、内容制作、语音交互等多个领域。

AI项目与工具 2025年06月12日 29 点赞 0 评论 552 浏览

DiTCtrl

DiTCtrl是一种基于多模态扩散变换器架构的视频生成工具，能够利用多个文本提示生成连贯且高质量的视频内容，无需额外训练即可实现零样本多提示视频生成。它通过KV共享和潜在混合策略优化不同提示间的平滑过渡，同时在MPVBench基准上表现出色，适用于电影、游戏、广告及新闻等多个领域。

AI项目与工具 2025年06月12日 18 点赞 0 评论 555 浏览

零样本

首页

零样本

列表

默认

浏览次数

发布日期