SPRIGHT SPRIGHT是由多所高校和机构联合开发的视觉-语言数据集,旨在提升文本到图像生成模型的空间一致性。通过重新描述约600万张图像,强化空间关系表达,如“左/右”、“上/下”等,显著提高图像生成的准确性。该数据集支持复杂场景的图像生成,并经过多维度评估验证其可靠性。SPRIGHT为视觉-语言模型的研究和应用提供了重要资源,广泛应用于图像生成、VR/AR、教育及科研等领域。 AI项目与工具 2025年06月12日 77 点赞 0 评论 466 浏览
MiniPerplx MiniPerplx 是一款基于 Grok 2.0 模型的开源 AI 搜索工具,支持网页、视频、学术论文等内容的检索。它提供代码解释、天气查询、URL 摘要、位置搜索等多功能服务,采用 Next.js 和 Vercel AI SDK 构建,具备良好的用户体验。用户可访问 GitHub 自行部署,适用于学术研究、编程开发、新闻获取等多个场景。 AI项目与工具 2025年06月12日 45 点赞 0 评论 461 浏览
Kittl Kittl是一个直观、易于使用的设计平台,允许用户发挥他们的创意能力。它提供了许多功能,包括基于人工智能的设计工具、文字转换、背景移除器、模型生成器、高级字体、插图等等。 图片处理 2025年06月05日 74 点赞 0 评论 460 浏览
PandasAI 一个基于Python的库,PandasAI将将该库依赖到自己项目中,只需几行代码,轻松实现数据读取,并能通过对话方式向数据进行提问 AI搜索问答 2025年06月05日 47 点赞 0 评论 459 浏览
Spirit LM Spirit LM 是一种由 Meta AI 开发的多模态语言模型,能够处理文本和语音数据,支持跨模态学习。其基础版(BASE)和表达版(EXPRESSIVE)分别侧重于语义理解和情感表达。Spirit LM 可用于自动语音识别(ASR)、文本到语音(TTS)、语音分类及情感分析等任务,在语音助手、语音转写、有声读物等领域具有广泛应用前景。 AI项目与工具 2025年06月12日 40 点赞 0 评论 458 浏览
LocAgent LocAgent是一款由多所高校联合开发的代码定位工具,通过构建代码库的图结构并结合大语言模型进行多跳推理,帮助开发者快速找到需修改的代码片段。支持多种开发任务,如错误修复、功能添加和性能优化,具备高效的搜索与定位能力,适用于大规模代码维护场景。 AI项目与工具 2025年06月12日 39 点赞 0 评论 457 浏览
DeepGEMM DeepGEMM是DeepSeek开发的高效FP8矩阵乘法库,专为NVIDIA Hopper架构优化,支持普通与分组GEMM操作。采用即时编译技术,实现运行时动态优化,提升计算性能与精度。通过细粒度缩放和双级累加技术解决FP8精度问题,结合TMA特性提升数据传输效率。代码简洁,仅约300行,适用于大规模AI推理、MoE模型优化及高性能计算场景。 AI项目与工具 2025年06月12日 61 点赞 0 评论 456 浏览
OmniEdit OmniEdit是一款基于多专家模型监督训练的先进图像编辑工具,支持七种核心图像编辑任务,包括对象替换、移除、添加、属性修改、背景替换、环境变化和风格转换。它能够处理不同宽高比和分辨率的图像,采用EditNet架构,提升了编辑的成功率和图像保真度。OmniEdit在自动与人工评估中表现优异,适用于专业设计、社交媒体内容创作、电子商务、新闻媒体等多个领域。 AI项目与工具 2025年06月12日 26 点赞 0 评论 453 浏览
马里兰大学帕克分校 马里兰大学,全称马里兰大学帕克分校(University of Maryland,College Park),简称UMD或UMCP,始建于1856年,坐落于美国马里兰州,马里兰大学系统下的一所公立研究型大学,被誉... 教育学习 1970年01月01日 0 点赞 0 评论 450 浏览