分类 - 智狐AI导航

CLaMP 3

CLaMP 3是由清华大学朱文武教授团队开发的多模态、多语言音乐信息检索框架，支持文本、图像、音频和乐谱等多种模态之间的跨模态检索。其基于对比学习技术，将不同模态数据与多语言文本对齐至统一语义空间，适用于文本到音乐、图像到音乐检索、零样本分类及音乐推荐等任务。支持27种语言，可扩展至100种，广泛应用于音乐创作、教育、分析及多媒体内容制作。

AI项目与工具 2025年06月12日 86 点赞 0 评论 493 浏览

SigLIP 2

SigLIP 2 是 Google DeepMind 开发的多语言视觉-语言模型，具有强大的图像与文本对齐能力。它支持多种语言输入，具备零样本分类、图像-文本检索等功能，并通过 Sigmoid 损失函数和自监督学习技术提升训练效率与模型性能。其支持多种分辨率的变体，适用于文档理解、视觉问答及开放词汇任务。该模型基于 Vision Transformer 架构，具备良好的兼容性。

AI项目与工具 2025年06月12日 94 点赞 0 评论 780 浏览

SpeciesNet

SpeciesNet 是 Google 开发的 AI 模型，用于识别相机陷阱图像中的动物物种，支持超过 2000 种标签分类，涵盖动物、分类群及非生物对象。基于 6500 万张图像训练，具备高效数据处理和跨场景识别能力，适用于野生动物监测、生物多样性研究及生态保护。模型开源，可在 GitHub 获取，支持开发人员部署与优化。

AI项目与工具 2025年06月12日 39 点赞 0 评论 443 浏览

Mesh

Mesh是一款专为初创企业设计的AI财务管理工具，具备实时账目对账、智能分类、财务分析、预测、预算管理等功能。它支持与主流会计软件和银行账户的无缝集成，提升财务处理效率，并提供即时的财务洞察，助力企业优化资金规划与成本控制。同时，Mesh也适用于个人和家庭财务管理场景。

AI项目与工具 2025年06月12日 82 点赞 0 评论 440 浏览

Gemini Embedding

Gemini Embedding 是 Google 推出的文本嵌入模型，能将文本转化为高维向量以捕捉语义和上下文信息。支持超过 100 种语言，具备高效的检索、分类、聚类和相似性检测能力。其支持长文本输入和灵活的维度调整，适用于多场景应用，如智能搜索、数据分析和自然语言处理。模型基于 Gemini 训练，具有优秀的语言理解能力。

AI项目与工具 2025年06月12日 17 点赞 0 评论 492 浏览

Insightly

Insightly 是一款基于 AI 的用户评论分析工具，可自动提炼评论核心观点、识别情感倾向并进行分类，如 Bug 反馈、功能请求等。它支持优先级排序，提升团队工作效率，并提供数据可视化功能，便于理解用户反馈趋势。此外，Insightly 还提供 Chrome 扩展，方便用户在应用商店中实时获取分析结果。适用于产品经理、开发者及客服团队，助力产品优化与市场洞察。

AI项目与工具 2025年06月12日 90 点赞 0 评论 423 浏览

Gemma 3

Gemma 3 是谷歌推出的开源人工智能模型，支持多语言、多模态处理，具备文本、图像及短视频分析能力。提供多种模型尺寸，适配不同硬件环境，优化了单 GPU/TPU 性能，推理速度提升显著。内置图像安全分类器，增强内容安全性。支持多种开发工具和部署方式，适用于人脸识别、物体检测、智能助手、文本分析等场景。

AI项目与工具 2025年06月12日 20 点赞 0 评论 559 浏览

PaddleSpeech

PaddleSpeech是百度飞桨团队开发的开源语音处理工具，涵盖语音识别、语音合成、声纹识别、语音翻译等功能。支持多种接口形式，适用于智能语音助手、语音播报、身份验证等场景。基于PaddlePaddle框架，提供高效的深度学习模型和丰富的音频处理能力，适用于多种实际应用需求。

AI项目与工具 2025年06月12日 87 点赞 0 评论 496 浏览

Recall

Recall是一款AI知识管理工具，支持将分散的内容转化为自我组织的知识库，具备即时总结、聊天互动功能，可处理YouTube视频、PDF、文章等多种格式内容。它提供增强浏览体验，自动链接相关内容到知识图谱中，帮助用户发现关联信息。Recall支持离线使用，跨平台访问，并注重数据安全与隐私保护，用户可随时导出数据，确保数据所有权。

AI项目与工具 2025年06月11日 50 点赞 0 评论 582 浏览

百姓AI

国内首批围绕大语言模型构建消费级和企业级服务的品牌

AI服务商 2025年06月05日 47 点赞 0 评论 466 浏览

分类

首页

分类

列表

默认

浏览次数

发布日期