R

Omni Reference

Omni Reference 是 Midjourney V7 提供的一项图像生成辅助功能,允许用户将特定人物、物体或场景嵌入生成图像中。通过 `--oref` 和 `--ow` 参数,用户可灵活控制参考图像的权重与风格融合程度,提升创作精度与多样性。支持 Web 和 Discord 两种平台操作,适用于角色嵌入、产品展示、场景构建等多种应用场景。

FireRedASR

FireRedASR是小红书推出的工业级自动语音识别(ASR)模型系列,支持普通话、中文方言和英语,具备高精度和高效推理能力。其包含FireRedASR-LLM和FireRedASR-AED两个版本,分别聚焦于极致精度和计算效率。模型在多个场景如智能助手、视频字幕生成、歌词识别和语音输入中表现出色,且已开源,推动语音识别技术的发展。

Microsoft Designer

Microsoft Designer 是一种使用人工智能来帮助您设计文档、图像和社交媒体帖子的工具。

PickPik

PickPik是一个由AI智能分类的无版权图片分享网站。PickPik网站上的所有图片几乎都可以用于任何商业设计项目。

Cradle

一个通用计算机控制的多模态AI框架,它可以使AI Agent能够像人类一样,能够直接控制键盘和鼠标,实现与任意开源代码或闭源代码软件的交互。

FlexRAG

FlexRAG 是一个高效的检索增强生成(RAG)框架,通过压缩编码器和选择性压缩机制优化长上下文处理,提升计算效率与生成质量。支持多模态数据、多种检索器和多数据类型,适用于开放域问答、对话系统、文档摘要等知识密集型任务,具备灵活配置和可扩展性。

Dpdf

好用的在线 PDF工具网站,提供免费的在线PDF工具,包括合并、拆分、转换PDF等功能。

AllSeek

AI和传统搜索结果的聚合器,只需输入一次即可帮你查看多个网站搜索结果的插件,AllSeek支持AI搜索(CHATGPT、Kimi、智谱、秘塔等)以及传统搜索引擎的结果对比。

AndroidLab

AndroidLab 是一款面向 Android 自主代理的训练与评估框架,集成了文本和图像模态操作环境,提供标准化的基准测试任务。它通过支持多种模型类型(LLMs 和 LMMs),覆盖九个应用场景的 138 项任务,有效提升了开源模型的性能。此外,AndroidLab 提供了丰富的评估指标和操作模式,助力研究者优化模型表现并推动开源解决方案的发展。

Anda

一个以Rust为基础构建的AI智能体框架,整合了ICP区块链并且支持TEE环境,Anda的目标在于构建一个能够高度组合、自主运行且拥有持续记忆能力的AI智能体网络。