视觉识别 - 智狐AI导航

Hysli AI

AI艺术二维码生成，可生成最不像二维码的二维码

Ai绘画生成 2026年06月27日 0 点赞 0 评论 816 浏览

知存科技

专注研发基于存算一体先进技术的人工智能芯片

创作工具 2026年06月27日 0 点赞 0 评论 780 浏览

小爱同学 AI 助手

小爱同学 AI 助手是一款功能全面、智能化程度高的多模态AI助手。它不仅能够提供丰富的信息查询和知识问答服务，还能通过智能分析和建议，帮助用户更高效地规划生活和工作。

创作工具 2026年06月27日 0 点赞 0 评论 497 浏览

Screenshot to Code

无论是在线使用还是本地部署，它都为用户提供了灵活、高效的代码生成解决方案。此外，通过提供编辑功能和代码导出，它满足了用户对代码调整和个性化的需求。

Ai平台模型 2026年06月27日 0 点赞 0 评论 349 浏览

Lobe Chat

Lobe Chat 是一个免费开源的高性能 AI 聊天机器人框架，具备多种功能，如 GPT-4 视觉识别、文字语音转换、灵活的插件系统及个性化主题模式。用户能够轻松部署和扩展功能，适用于各种场景。该框架已在 GitHub 上获得近 14K 星标，展示了其受欢迎程度和实用性。

AI项目与工具 2025年06月12日 82 点赞 0 评论 927 浏览

豆包视觉理解模型

豆包视觉理解模型是一款集视觉识别、理解推理和复杂逻辑计算于一体的先进AI工具。它具备强大的视觉定位能力，支持多目标、小目标和3D定位，并能识别物体的类别、形状、纹理等属性，理解物体间的关系和场景含义。此外，模型在视频理解方面表现出色，能够进行记忆、总结、速度感知和长视频分析。凭借其高效性和成本优势，该模型广泛应用于图片问答、医疗影像分析、教育科研、电商零售及内容审核等领域。

AI项目与工具 2025年06月12日 86 点赞 0 评论 639 浏览

理想同学

理想同学是一款基于AI技术打造的智能助手，集成了知识问答、视觉识别、绘画创作和播客等多种功能。它支持多领域的信息查询、语言翻译、文本生成及视觉分析，通过跨平台协作实现数据同步与连续对话。此外，用户可根据需求选择不同模型以优化推理能力，广泛适用于日常生活、学习和工作场景。

AI项目与工具 2025年06月12日 96 点赞 0 评论 810 浏览

ConceptMaster

ConceptMaster是一款基于扩散Transformer模型的多概念视频生成框架，可在无需测试调优的情况下生成高质量、概念一致的视频。通过解耦多概念嵌入并独立注入模型，有效解决身份解耦问题，尤其擅长处理高度相似的视觉概念。该工具支持多概念视频定制、高质量数据收集和全面的基准测试，适用于视频创作、动画制作、游戏开发及产品展示等领域。

AI项目与工具 2025年06月12日 99 点赞 0 评论 645 浏览

Finedefics

Finedefics是由北京大学彭宇新教授团队开发的细粒度多模态大模型，专注于提升多模态大语言模型在细粒度视觉识别任务中的表现。该模型通过引入对象的细粒度属性描述，结合对比学习方法，实现视觉对象与类别名称的精准对齐。在多个权威数据集上表现出色，准确率达76.84%。其应用场景涵盖生物多样性监测、智能交通、零售管理及工业检测等领域。

AI项目与工具 2025年06月12日 10 点赞 0 评论 822 浏览

MoshiVis

MoshiVis是一款由Kyutai开发的开源多模态语音模型，支持图像与语音的自然交互。它基于Moshi 7B架构，集成了视觉编码器和跨注意力机制，实现低延迟、自然流畅的对话体验。支持多种后端部署，适用于无障碍应用、智能家居、教育及工业场景，提升人机交互的智能化水平。

AI项目与工具 2025年06月12日 72 点赞 0 评论 757 浏览

视觉识别

首页

视觉识别

列表

默认

浏览次数

发布日期