图像识别 - 智狐AI导航

Mathos AI

Mathos AI是一款先进的AI数学工具，覆盖从基础到高级数学领域的多种问题，提供逐步解析、个性化辅导、PDF作业分析及多设备同步等功能。它支持图像识别、语音输入和高级图形计算，旨在优化用户的学习体验，提升解题效率。

AI项目与工具 2025年06月12日 83 点赞 0 评论 639 浏览

WebLI

WebLI-100B是由Google DeepMind推出的超大规模视觉语言数据集，包含1000亿个图像与文本配对数据，是目前最大的视觉语言数据集之一。其设计旨在提升模型对长尾概念、文化多样性和多语言内容的理解能力。数据集通过网络爬取构建，保留了丰富的语言和文化多样性，支持多模态任务如图像分类、图像描述生成和视觉问答，广泛应用于人工智能研究、工程开发及教育领域。

AI项目与工具 2025年06月12日 51 点赞 0 评论 637 浏览

Explorer

Explorer是一款由Odyssey公司研发的生成性世界模型，主要功能包括将图像转换为高质量的3D场景，并支持动态效果生成。它利用高斯溅射技术和先进的图像识别算法，实现逼真的视觉效果。Explorer生成的场景可无缝集成到主流创作软件中，广泛应用于电影、游戏开发、虚拟现实等领域，显著提升内容创作效率。

AI项目与工具 2025年06月12日 39 点赞 0 评论 629 浏览

MiniMax

MiniMax-01是由MiniMax推出的高性能AI模型系列，包含语言模型MiniMax-Text-01和视觉多模态模型MiniMax-VL-01。该系列采用线性注意力机制，支持处理长达400万token的上下文，性能接近国际领先模型。具备强大的语言理解、多模态处理及长文本分析能力，适用于企业、教育、科研及开发等多个领域。API定价合理，提供高效的长文本处理与多模态交互解决方案。

AI项目与工具 2025年06月12日 30 点赞 0 评论 626 浏览

Aitoolhunt ai工具

Aitoolhunt,发现最新的人工智能工具、服务、资源，来帮助你完成工作

Ai学习资源 2025年06月05日 72 点赞 0 评论 624 浏览

AI Interview Copilot

AI Interview Copilot是一款专为求职者设计的AI辅助工具，通过实时语音转录和先进的语言模型（如GPT-4）来提升远程面试的表现。主要功能包括实时转录、问题解答、算法问题解决和图像识别等。该工具支持多语言，帮助求职者在技术或编程面试中快速生成答案和代码，从而更加自信地展示专业技能，提高面试成功率。

AI项目与工具 2025年06月12日 58 点赞 0 评论 613 浏览

阶跃星辰推出移动端AI智能问答助手跃问APP

跃问是一款基于阶跃星辰Step系列通用大模型开发的移动应用，具备强大的文本和图像处理能力，能够高效完成内容创作、逻辑推理、数据分析等任务。该应用支持联网搜索、文档解析、推理速度优化，并具备拍照识图和语音输入功能。跃问还提供了高效阅读、智能问答、写作翻译和多端同步等功能，为用户提供便捷的信息获取和处理体验。

AI项目与工具 2024年01月01日 61 点赞 0 评论 601 浏览

PaliGemma 2 mix

PaliGemma 2 Mix 是谷歌 DeepMind 推出的多任务视觉语言模型，支持图像描述、目标检测、OCR、文档理解等功能。模型提供多种参数规模和分辨率选项，适用于不同场景。其基于开源框架开发，易于扩展，可通过简单提示切换任务。适用于科学问题解答、文档分析、电商内容生成等多个领域。

AI项目与工具 2025年06月12日 23 点赞 0 评论 599 浏览

Kimi

Kimi-VL是月之暗面推出的轻量级多模态视觉语言模型，支持图像、视频、文档等多种输入形式。其基于轻量级MoE架构和原生分辨率视觉编码器，具备强大的图像感知、数学推理和OCR能力。在长上下文（128K）和复杂任务中表现优异，尤其在多模态推理和长视频理解方面超越同类模型。适用于智能客服、教育、医疗、内容创作等多个领域。

AI项目与工具 2025年06月11日 30 点赞 0 评论 587 浏览

iThinkScene

灵境之城旗下的产品，iThinkAi平台的产品涵盖多个领域，包括iThinkAi工具集、iThinkChat和iThinkScene

Ai学习资源 2025年06月05日 42 点赞 0 评论 577 浏览

图像识别

首页

图像识别

列表

默认

浏览次数

发布日期