R

SciDraw.io

一个专为科研人员设计的高质量矢量图素材库,它提供了丰富的生命科学相关图像资源,包括动物模型、细胞、器官、科学设备等,特别适合需要制作科研论文、学术报告或海报的用户。

MagicTryOn

MagicTryOn是由浙江大学和vivo等机构开发的视频虚拟试穿框架,采用扩散Transformer(DiT)架构替代传统U-Net,结合全自注意力机制实现视频时空一致性建模。通过粗到细的服装保持策略,整合服装标记与多条件引导,有效保留服装细节。该工具在图像和视频试穿任务中表现优异,适用于在线购物、时尚设计、虚拟试衣间等多种场景。

Kimi

Kimi-VL是月之暗面推出的轻量级多模态视觉语言模型,支持图像、视频、文档等多种输入形式。其基于轻量级MoE架构和原生分辨率视觉编码器,具备强大的图像感知、数学推理和OCR能力。在长上下文(128K)和复杂任务中表现优异,尤其在多模态推理和长视频理解方面超越同类模型。适用于智能客服、教育、医疗、内容创作等多个领域。

Laminar

Laminar是一款面向大型语言模型(LLM)的开源可观测性和分析平台,具备自动追踪LLM调用与数据库交互、事件驱动分析及数据标注等功能,同时支持高效的数据存储与可视化展示。其目标是提升LLM应用的透明度和效率,适用于开发调试、性能监控、用户体验优化及业务决策支持等多个场景。

Firesearch

Firesearch 是 Mendable AI 团队推出的 AI 驱动的深度研究工具,基于 Firecrawl 多源网络内容提取技术和 OpenAI GPT-4o 的搜索规划与内容生成能力,能够将复杂查询分解为子问题进行搜索和内容提取。它支持答案验证、自动重试、实时进度更新、完整引用和上下文记忆等功能,帮助用户高效获取准确、全面的研究结果。工具基于 Next.js 15 构建,提供现代化的开发体

BrainyAI

你的智能网页助手,聚合多种AI模型的浏览器插件,可以在网页侧边栏实现AI聊天、搜索、阅读辅助。

Cloudflare Agents

Cloudflare Agents 是一个支持构建智能代理的平台,具备自主性、目标导向和自适应决策能力。平台覆盖用户输入获取、LLM连接、任务执行、工具调用等全流程,支持WebSocket休眠以降低成本。适用于办公助手、客服机器人、推荐系统、任务自动化和决策支持等多种场景,提升效率与智能化水平。

FitDiT

FitDiT是一种基于Diffusion Transformers架构的高保真虚拟试穿技术,通过服装纹理提取器和先验演化技术精确捕捉服装细节,同时采用扩张-松弛掩码策略优化尺寸适配。它能在短时间内生成高质量的试穿图像,适用于电子商务、时尚设计、个性化定制以及增强现实等领域,为用户提供逼真的虚拟试穿体验。

mPLUG

mPLUG-Owl3是一款由阿里巴巴开发的多模态AI模型,专注于理解和处理多图及长视频内容。该模型具备高推理效率和准确性,采用创新的Hyper Attention模块优化视觉与语言信息的融合。它已在多个基准测试中展现出卓越性能,并且其源代码和资源已公开,可供研究和应用。

DoraCycle

DoraCycle是由新加坡国立大学Show Lab开发的一种多模态生成模型,通过文本与图像间的双向循环一致性学习,实现跨模态信息转换与对齐。其核心优势在于无需大量标注数据即可完成领域适应,支持风格化设计、虚拟角色生成等多样化任务。模型采用自监督学习和梯度裁剪等技术提升训练稳定性,适用于广告、教育等多个应用场景。