R

Shandu

Shandu 是一款基于 LangChain 和 LangGraph 技术的开源 AI 研究自动化工具,支持多引擎搜索、递归探索和智能网页爬取,能自动生成结构化研究报告。用户可通过命令行输入主题并设置参数,快速输出包含引用的 Markdown 格式文档。适用于学术研究、市场分析、技术探索及教育等多个领域,具备高度灵活性和信息处理能力。

CatVTON

CatVTON是一款基于先进AI算法的虚拟试衣工具,能够将服装从一个人无缝转移到另一个人身上,同时保留服装细节的一致性。该工具采用轻量级网络架构,减少了计算资源的需求,无需复杂的预处理步骤,即可实现高效的服装试穿效果。CatVTON适用于电子商务、时尚设计、个性化推荐等多个领域,为用户提供了便捷且真实感强的虚拟试衣体验。

据意查句

据意查句Wantquotes可以根据你输入描述的意思来查找相应的名言名句、古诗文类名句、现代名句等。

potion

Potion是一款专注于AI视频生成的专业平台,通过深度学习技术实现用户面部表情、声音的精准模拟,支持文本到视频的自动化转换。其主要功能涵盖个性化视频创作、唇形同步、动态视频生成及多场景应用(如销售、营销、教育和客户服务)。产品设计注重效率与灵活性,适合各类企业提升品牌影响力与客户互动效果。

PDF to Podcast

PDF to Podcast 是一款由 NVIDIA 开发的 AI 工具,能够将 PDF 文档自动转换为高质量的音频内容,如播客。该工具结合了大型语言模型、文本到语音技术以及 NVIDIA NIM 微服务架构,支持从 PDF 提取信息并生成结构化文本,再通过语音合成输出自然流畅的音频。用户可自定义生成内容的重点,并支持多种部署方式,适用于企业培训、技术简报、客户服务、医疗教育等多个领域。

LlamaV

LlamaV-o1是由阿联酋穆罕默德·本·扎耶德人工智能大学等机构开发的多模态视觉推理模型,具备结构化推理和透明性,支持文本、图像和视频等多种模态的信息处理。该模型引入了VRC-Bench基准测试,涵盖4000多个推理步骤,用于全面评估推理能力。其性能优于多个开源模型,适用于医疗影像分析、金融数据解读、教育辅助和工业检测等场景,具有高准确性和可解释性。

HART

HART是一种由麻省理工学院研究团队开发的自回归视觉生成模型,能够生成1024×1024像素的高分辨率图像,质量媲美扩散模型。通过混合Tokenizer技术和轻量级残差扩散模块,HART实现了高效的图像生成,并在多个指标上表现出色,包括重构FID、生成FID以及计算效率。

豆包MarsCode

豆包MarsCode是字节跳动旗下的公司推出的一个免费AI编程工具,既提供一个AI驱动的云端集成开发环境(IDE),也支持作为VS Code和JetBrains的智能编程扩展(Extension)使用。基于...

超级助理

超级助理是百度智能云发布的AI浏览器插件,可以随时感知用户的需求,在解析复杂问题、辅助文案创作、智能文档处理、对话式搜索和全文翻译等场景中提供帮助。