DuoAttention DuoAttention是由MIT韩松团队提出的新型框架,通过区分“检索头”和“流式头”两种注意力机制,显著提升了大型语言模型在处理长上下文时的推理效率。该框架有效减少了内存占用,加速了解码和预填充过程,并保持了模型的准确性。它适用于多轮对话、长文档处理、学术研究以及内容推荐等多个领域。 AI项目与工具 2025年06月12日 58 点赞 0 评论 578 浏览
Gradio Gradio 是一款开源 Python 工具,用于快速构建和共享机器学习模型的交互式网页界面。支持多类型输入输出组件,具备实时交互能力,并通过服务器端渲染优化性能。Gradio 5 引入性能提升、界面更新及安全性改进,支持实验性 AI Playground,广泛应用于模型演示、教育、原型开发及远程协作等领域。 AI项目与工具 2025年06月12日 43 点赞 0 评论 578 浏览
PromptBench 一个基于 Pytorch 的 Python 包,用于评估和理解大型语言模型的统一库。它为研究人员提供了用户友好的 API,以便对 LLM 进行评估。 Ai提示指令 2025年06月05日 72 点赞 0 评论 578 浏览
LIGER LIGER是一种由Meta AI等机构研发的混合检索模型,结合生成式检索与密集检索技术,提升推荐系统的效率与准确性。其核心功能包括高效生成候选项目、优化排序、处理冷启动问题及融合语义信息。LIGER通过多目标优化和语义融合机制,显著提高了推荐的精准度与适应性,广泛应用于电商、内容、社交及教育等领域。 AI项目与工具 2025年06月12日 11 点赞 0 评论 578 浏览
Fox Fox-1是一系列由TensorOpera开发的小型语言模型,基于大规模预训练和微调数据,具备强大的文本生成、指令遵循、多轮对话和长上下文处理能力。该模型在多个基准测试中表现出色,适用于聊天机器人、内容创作、语言翻译、教育辅助和信息检索等多种应用场景。 AI项目与工具 2025年06月12日 60 点赞 0 评论 578 浏览
MMBench MMBench-Video是一个由多家高校和机构联合开发的长视频多题问答基准测试平台,旨在全面评估大型视觉语言模型(LVLMs)在视频理解方面的能力。平台包含约600个YouTube视频片段,覆盖16个类别,并配备高质量的人工标注问答对。通过自动化评估机制,MMBench-Video能够有效提升评估的精度和效率,为模型优化和学术研究提供重要支持。 AI项目与工具 2025年06月12日 52 点赞 0 评论 579 浏览
RoboBrain RoboBrain是由智源研究院开发的开源具身大脑模型,支持任务规划、可操作区域感知和轨迹预测等功能。其基于LLaVA框架,采用多阶段训练策略,具备高分辨率图像处理和长历史帧记忆能力。适用于多机器人协作、复杂任务执行及实时优化场景,依托ShareRobot数据集提升模型性能,广泛应用于机器人操作领域。 AI项目与工具 2025年06月12日 78 点赞 0 评论 579 浏览
DiffBrush DiffBrush是由多所高校与研究机构联合开发的图像生成与编辑工具,支持用户通过手绘草图直接控制图像生成过程。其核心技术包括颜色引导、实例与语义控制、潜在空间再生等,兼容多种主流T2I模型,如Stable Diffusion、SDXL等,并支持LoRA风格调整。该工具简化了AI绘画流程,提升了图像生成的精度与灵活性,适用于创意绘画、图像编辑、教育、游戏设计等多个领域。 AI项目与工具 2025年06月12日 97 点赞 0 评论 579 浏览
FancyVideo FancyVideo是一款由360公司与中山大学合作开发的AI文生视频模型,采用创新的跨帧文本引导模块(CTGM)。它能够根据文本描述生成连贯且动态丰富的视频内容,支持高分辨率视频输出,并保持时间上的连贯性。作为开源项目,FancyVideo提供了详尽的文档和代码库,便于研究者和开发者深入研究和应用。主要功能包括文本到视频生成、跨帧文本引导、时间信息注入及时间亲和度细化等。 AI项目与工具 2025年06月12日 28 点赞 0 评论 580 浏览