AI项目与工具

FlexRAG

FlexRAG 是一个高效的检索增强生成(RAG)框架,通过压缩编码器和选择性压缩机制优化长上下文处理,提升计算效率与生成质量。支持多模态数据、多种检索器和多数据类型,适用于开放域问答、对话系统、文档摘要等知识密集型任务,具备灵活配置和可扩展性。

潮际主设

潮际主设是一款基于AI技术的时尚设计工具,专为服装设计师提供支持。它涵盖款式生成、局部优化、图案设计和颜色替换等功能,通过智能化操作提升设计效率,并支持个性化定制与快速原型制作,适用于服装设计、趋势预测及颜色搭配等多个领域。

LongLLaVA

LongLLaVA是由香港中文大学(深圳)研究团队开发的多模态大型语言模型,结合Mamba和Transformer模块,利用2D池化技术压缩图像token,大幅提升处理大规模图像数据的效率。该模型在视频理解、高分辨率图像分析及多模态代理任务中表现优异,特别擅长检索、计数和排序任务。其技术亮点包括渐进式训练策略和混合架构优化,支持多种多模态输入处理,广泛应用于视频分析、医学影像诊断、环境监测等领域。

逻辑智能

逻辑智能(InsiderX)是一款企业级AI工具平台,支持构建智能化工作流,具备多模态感知和自主决策能力,可处理文本、图像和语音数据,实现业务流程自动化。平台支持私有知识库构建、数据安全保障及内容审查,广泛应用于金融、法律、生物医药等行业,助力企业提升效率和降低成本。

图怪兽

图怪兽是一个集在线图片编辑与设计于一体的多功能平台,提供多样化的模板资源,涵盖多种应用场景。通过AI技术支持的颜色搜索和一键抠图等功能,大幅提高设计效率。该平台支持多终端同步使用,模板版权合规,适合各类用户群体,让设计工作更加高效和简便。

LOKI

LOKI是一个由中山大学与上海AI实验室联合推出的合成数据检测基准,用于评估大型多模态模型在识别视频、图像、3D模型、文本及音频等多模态合成数据方面的性能。它包含超过18,000个问题,涵盖26个子类别,支持多层次标注和细粒度异常注释,并通过自然语言解释增强模型的可解释性。LOKI还通过对比多种开源和闭源模型的表现,揭示了这些模型在合成数据检测任务中的优势与不足。

Mage

Mage是一款利用先进AI技术将文本转换为高质量数字艺术作品的创意平台。它支持多种艺术风格和自定义参数,操作简便高效,适用于插画、设计及内容创作等多个领域。平台具备用户友好的界面设计,提供免费基础服务,鼓励社区互动与灵感交流。

Connected Papers

Connected Papers 是一个学术研究工具,通过构建可视化图表帮助用户探索和发现相关学术文献。用户可以输入论文标题、DOI 或关键词,工具会生成一个展示相似论文的网络图,其中论文按相似度排列,颜色深浅表示发表时间的远近,圆圈大小代表被引用次数。该工具主要功能包括视觉概览、重要论文追踪、参考书目构建、先前和衍生作品发现以及跨学科支持。应用场景涵盖学术研究、文献综述、课程学习和项目研究等。

BizGen

BizGen是由清华大学与微软研究院联合开发的AI信息图生成工具,能将长篇文章自动转化为专业级的信息图和幻灯片。其核心技术包括高质量数据集Infographics-650K和“布局引导的交叉注意力机制”,可精准控制图像中各区域的文本与视觉元素。支持多语言和多种风格,适用于商业汇报、产品展示、学术研究等多个场景,具备高准确性与排版质量。

TrendPublish

TrendPublish 是一款基于 AI 的趋势发现与内容发布工具,支持多源数据采集、智能处理与自动发布功能。通过集成 AI 服务,实现内容总结、标题生成和发布管理,适用于科技媒体、企业推广、学术研究等多种场景,提升内容生产效率与质量。