学习

HUGWBC

HUGWBC是由上海交通大学与上海AI Lab联合开发的人形机器人全身控制器,支持多种自然步态和精细参数调整,具备高鲁棒性和实时外部干预能力。基于强化学习和不对称训练框架,实现从模拟到现实的高效迁移,适用于复杂地形导航、动态任务执行及人机协作等多种场景。

SigLIP 2

SigLIP 2 是 Google DeepMind 开发的多语言视觉-语言模型,具有强大的图像与文本对齐能力。它支持多种语言输入,具备零样本分类、图像-文本检索等功能,并通过 Sigmoid 损失函数和自监督学习技术提升训练效率与模型性能。其支持多种分辨率的变体,适用于文档理解、视觉问答及开放词汇任务。该模型基于 Vision Transformer 架构,具备良好的兼容性。

MLE

MLE-Agent是一款面向机器学习工程师和研究人员的智能助手,具备自动化基线创建、智能调试、文件系统集成、工具集成和交互式命令行界面等功能。它通过集成大型语言模型(LLM)、自动化机器学习(AutoML)、代码生成和检索(Code Generation and Retrieval)以及智能调试(Smart Debugging)等技术,提供无缝的AI工程和研究体验。MLE-Agent支持与多个AI

360AI办公

一款集成了多种办公工具和海量内容模板的办公效率平台。360AI办公提供方便的PDF工具集,支持PDF转换和编辑,以及强大的图片编辑和压缩功能。

RDT

RDT是清华大学AI研究院推出的一款双臂机器人操作任务扩散基础模型,拥有十亿参数量,可自主完成复杂任务,如调酒和遛狗。该模型基于模仿学习,具备强大的泛化能力和操作精度,支持多种模态输入和少样本学习。RDT已在餐饮、家庭、医疗、工业及救援等领域展现广泛应用前景,推动机器人技术发展。

SCoRe

SCoRe是一种由谷歌DeepMind提出的基于强化学习的多轮训练方法,旨在提高大型语言模型的自我纠错能力。它通过模型自动生成的数据进行训练,并采用正则化约束与奖励机制,有效提升了模型在数学、编程等任务中的准确性。此外,SCoRe能够适应训练与推理过程中的数据分布差异,展现出较强的灵活性与实用性。

Lingo

Lingo是一款由西湖心辰开发的国内首个端到端语音大模型,具备实时交互、语音理解、多风格语音表达、情绪价值等功能。Lingo在人机对话的自然流畅度和情绪感知方面表现出色,适用于智能家居、客户服务、教育、医疗等多个领域。其核心技术包括端到端设计、深度学习算法和自然语言处理,旨在提供高质量的语音交互体验。

Dewatermark.AI

一款免费在线去水印工具。通过AI快速消除图片水印。Dewatermark不仅能处理简单的文字和标志水印,对于复杂的多层水印,甚至是与图片颜色融合、不易察觉的水印也可以处理。

Learn Prompting

Learn Prompting 是一个开源平台,致力于教授 AI 提示工程相关知识,涵盖从基础到高级的内容。其主要功能包括智能推荐、深度解析、模拟对话、学习进度跟踪等,同时提供体系化课程及实际应用场景案例。该工具适用于教育、语言学习、内容创作、数据分析等多个领域,助力用户提升 AI 技术的应用能力。