学习

MagicArticulate

MagicArticulate是由南洋理工大学与字节跳动Seed实验室联合开发的3D模型动画化工具,支持自动骨架生成、蒙皮权重预测及高质量动画输出。其基于自回归Transformer架构,结合Articulation-XL大规模数据集,实现对多样化3D模型的高效处理。适用于3D动画、游戏开发、VR/AR、工业设计等多个领域,显著提升动画制作效率与质量。

VideoRAG

VideoRAG是一种基于检索增强生成(RAG)技术的工具,旨在提升长视频的理解能力。它通过提取视频中的多模态信息(如OCR、ASR和对象检测),并将其与视频帧和用户查询结合,增强大型视频语言模型的处理效果。该技术轻量高效,易于集成,适用于视频问答、内容分析、教育、媒体创作及企业知识管理等多个领域。

BioEmu

BioEmu是由微软研究院开发的生成式深度学习系统,用于高效模拟蛋白质的动态结构和平衡态构象。它能在单个GPU上每小时生成数千种蛋白质结构样本,误差控制在1 kcal/mol以内,支持功能构象变化模拟和热力学性质预测。该工具适用于科学研究、药物开发、个性化医疗等多个领域,显著提升蛋白质结构模拟的效率和精度,为生物医学研究提供强大计算支持。

AI建筑设计-Stable Diffusion

15课时以案例实操的方式,结合实际工作场景需求讲解包括室内设计、建筑鸟瞰、人视角,规划,景观等相关操作流程。

DeepSeek R1

DeepSeek R1-Zero 是一款基于纯强化学习训练的推理模型,无需监督微调即可实现高效推理。在 AIME 2024 竞赛中 Pass@1 分数达到 71.0%,展现强大逻辑与数学推理能力。支持长上下文处理,具备自我进化、多任务泛化等特性,并通过开源和蒸馏技术推动模型应用与优化。

DynamicCity

DynamicCity是由上海AI Lab开发的大规模动态场景生成框架,支持高质量4D LiDAR场景的生成与重建,适用于自动驾驶、机器人导航、虚拟现实等多个领域。该框架基于VAE和DiT模型,实现高效的场景编码与生成,支持轨迹引导、指令驱动生成和动态修复等多种应用,展现出优异的性能和广泛的应用潜力。

Deep Research

Deep Research是由OpenAI开发的一款AI深度搜索与研究工具,支持多步骤自主研究,适用于金融、科学、政策等领域。基于o3模型,结合强化学习技术,能高效整合网络信息并生成结构化研究报告。用户可通过提示词触发研究流程,系统自动生成引用清晰、逻辑严谨的成果,适用于学术研究、市场分析、投资决策等场景。

FLUX Tools

FLUX Tools是一套由黑森林实验室开发的增强型文本到图像模型工具,包含FLUX.1 Fill、FLUX.1 Depth、FLUX.1 Canny和FLUX.1 Redux四个模块,能够通过文本描述和掩码对图像进行精确编辑和扩展,支持图像修复、扩展、结构化引导、混合与再创作等功能。工具基于深度学习和神经网络技术,结合结构引导和文本到图像转换功能,适用于多种应用场景,包括数字艺术创作、游戏开发、

Aoyo.ai

一个AI搜索工具网站,专门设计用于满足在互联网上搜索信息时遇到语言障碍的用户,有效地消除了语言差异带来的障碍。

V-JEPA

创新的自监督学习模型,它通过预测视频帧的特征表示来学习视频的视觉表示。这种方法不仅能够处理视频内容,还能在图像任务上表现出色,具有广泛的应用潜力。