学习 - 智狐AI导航

HumanDiT

HumanDiT是一种由浙江大学与字节跳动联合开发的高保真人体视频生成框架，基于扩散变换器（DiT）实现姿态引导的视频生成。它支持长序列、多分辨率视频生成，并通过关键点扩散变换器（Keypoint-DiT）确保动作的连贯性与自然性。引入前缀潜在参考策略以保持个性化特征，结合姿态适配器和细化模块提升细节质量。适用于虚拟人、动画制作、沉浸式体验及视频续写等多种场景。

AI项目与工具 2025年06月12日 41 点赞 0 评论 629 浏览

OmniThink

OmniThink是由浙江大学与阿里巴巴通义实验室联合开发的机器写作框架，通过模拟人类学习和反思机制，提升文章的知识密度与深度。支持多种语言模型，具备信息树与概念池结构化管理功能，适用于学术写作、新闻报道、教育内容创作等多个领域，有效提高生成内容的质量与多样性。

AI项目与工具 2025年06月12日 10 点赞 0 评论 629 浏览

Video2PPT

一个开源、免费的可以将任意视频智能转换为精美PPT的工具，它支持多种视频来源，包括本地视频文件、在线视频链接（如 YouTube、Bilibili 等），还支持实时录屏。

PPT资源 2025年06月05日 94 点赞 0 评论 628 浏览

RF

RF-DETR是一款由Roboflow推出的实时目标检测模型，支持多分辨率训练，具备高精度和低延迟特性，在COCO数据集上达到60+ mAP。结合Transformer架构和预训练DINOv2主干，提升领域适应性和检测效果。适用于安防、自动驾驶、工业检测等多个场景，提供预训练检查点以支持快速微调和部署。

AI项目与工具 2025年06月12日 35 点赞 0 评论 628 浏览

SmolVLA

SmolVLA是Hugging Face开源的轻量级视觉-语言-行动（VLA）模型，专为经济高效的机器人设计。拥有4.5亿参数，可在CPU上运行，单个消费级GPU即可训练，适合在MacBook上部署。它能够处理多模态输入，生成动作序列，并通过异步推理提高控制效率。适用于物体抓取、家务劳动、货物搬运和机器人教育等场景。

AI项目与工具 2025年06月11日 34 点赞 0 评论 628 浏览

Knowee AI

一个AI驱动的学习助手，前身为StudyGPT。Knowee AI提供即时AI响应、测验生成、写作任务支持和YouTube内容总结等功能。

教育学习 2025年06月05日 92 点赞 0 评论 628 浏览

HiFiVFS

HiFiVFS是一款基于Stable Video Diffusion框架的高保真视频换脸工具，结合多帧输入与时间注意力机制保障视频稳定性。其核心技术包括细粒度属性学习（FAL）和详细身份学习（DIL），分别用于属性解耦和身份相似性提升。HiFiVFS适用于电影制作、游戏开发、虚拟现实及社交媒体等多个领域，支持高质量的视频换脸操作。

AI项目与工具 2025年06月12日 60 点赞 0 评论 627 浏览

Recall

Recall是一款AI知识管理工具，支持将分散的内容转化为自我组织的知识库，具备即时总结、聊天互动功能，可处理YouTube视频、PDF、文章等多种格式内容。它提供增强浏览体验，自动链接相关内容到知识图谱中，帮助用户发现关联信息。Recall支持离线使用，跨平台访问，并注重数据安全与隐私保护，用户可随时导出数据，确保数据所有权。

AI项目与工具 2025年06月11日 50 点赞 0 评论 627 浏览

Titans

Titans是谷歌推出的新型神经网络架构，突破了传统Transformer在处理长序列数据时的限制。其核心是神经长期记忆模块，可模拟人脑记忆机制，提升对关键信息的存储与提取能力。Titans支持多种任务，包括语言建模、常识推理和时间序列预测，尤其在处理超长上下文时表现优异。该架构具备并行计算能力，提高了训练效率，适用于文本生成、生物信息学、视频音乐处理等多个领域。

AI项目与工具 2025年06月12日 27 点赞 0 评论 627 浏览

边界Aichat

一款具备AI能力的智能办公和学习工具，旨在为办公人群和学习人士提供全方位的智能化服务。

AI写作对话 2025年06月05日 83 点赞 0 评论 626 浏览

学习

首页

学习

列表

默认

浏览次数

发布日期