HumanDiT HumanDiT是一种由浙江大学与字节跳动联合开发的高保真人体视频生成框架,基于扩散变换器(DiT)实现姿态引导的视频生成。它支持长序列、多分辨率视频生成,并通过关键点扩散变换器(Keypoint-DiT)确保动作的连贯性与自然性。引入前缀潜在参考策略以保持个性化特征,结合姿态适配器和细化模块提升细节质量。适用于虚拟人、动画制作、沉浸式体验及视频续写等多种场景。 AI项目与工具 2025年06月12日 41 点赞 0 评论 629 浏览
OmniThink OmniThink是由浙江大学与阿里巴巴通义实验室联合开发的机器写作框架,通过模拟人类学习和反思机制,提升文章的知识密度与深度。支持多种语言模型,具备信息树与概念池结构化管理功能,适用于学术写作、新闻报道、教育内容创作等多个领域,有效提高生成内容的质量与多样性。 AI项目与工具 2025年06月12日 10 点赞 0 评论 629 浏览
Video2PPT 一个开源、免费的可以将任意视频智能转换为精美PPT的工具,它支持多种视频来源,包括本地视频文件、在线视频链接(如 YouTube、Bilibili 等),还支持实时录屏。 PPT资源 2025年06月05日 94 点赞 0 评论 628 浏览
RF RF-DETR是一款由Roboflow推出的实时目标检测模型,支持多分辨率训练,具备高精度和低延迟特性,在COCO数据集上达到60+ mAP。结合Transformer架构和预训练DINOv2主干,提升领域适应性和检测效果。适用于安防、自动驾驶、工业检测等多个场景,提供预训练检查点以支持快速微调和部署。 AI项目与工具 2025年06月12日 35 点赞 0 评论 628 浏览
SmolVLA SmolVLA是Hugging Face开源的轻量级视觉-语言-行动(VLA)模型,专为经济高效的机器人设计。拥有4.5亿参数,可在CPU上运行,单个消费级GPU即可训练,适合在MacBook上部署。它能够处理多模态输入,生成动作序列,并通过异步推理提高控制效率。适用于物体抓取、家务劳动、货物搬运和机器人教育等场景。 AI项目与工具 2025年06月11日 34 点赞 0 评论 628 浏览
Knowee AI 一个AI驱动的学习助手,前身为StudyGPT。Knowee AI提供即时AI响应、测验生成、写作任务支持和YouTube内容总结等功能。 教育学习 2025年06月05日 92 点赞 0 评论 628 浏览
HiFiVFS HiFiVFS是一款基于Stable Video Diffusion框架的高保真视频换脸工具,结合多帧输入与时间注意力机制保障视频稳定性。其核心技术包括细粒度属性学习(FAL)和详细身份学习(DIL),分别用于属性解耦和身份相似性提升。HiFiVFS适用于电影制作、游戏开发、虚拟现实及社交媒体等多个领域,支持高质量的视频换脸操作。 AI项目与工具 2025年06月12日 60 点赞 0 评论 627 浏览
Recall Recall是一款AI知识管理工具,支持将分散的内容转化为自我组织的知识库,具备即时总结、聊天互动功能,可处理YouTube视频、PDF、文章等多种格式内容。它提供增强浏览体验,自动链接相关内容到知识图谱中,帮助用户发现关联信息。Recall支持离线使用,跨平台访问,并注重数据安全与隐私保护,用户可随时导出数据,确保数据所有权。 AI项目与工具 2025年06月11日 50 点赞 0 评论 627 浏览
Titans Titans是谷歌推出的新型神经网络架构,突破了传统Transformer在处理长序列数据时的限制。其核心是神经长期记忆模块,可模拟人脑记忆机制,提升对关键信息的存储与提取能力。Titans支持多种任务,包括语言建模、常识推理和时间序列预测,尤其在处理超长上下文时表现优异。该架构具备并行计算能力,提高了训练效率,适用于文本生成、生物信息学、视频音乐处理等多个领域。 AI项目与工具 2025年06月12日 27 点赞 0 评论 627 浏览