AI项目与工具

PicHero

PicHero是一款基于人工智能技术的修图工具,主要功能包括人脸高清化、日常肖像美化、旧照修复及画质提升。它能够轻松解决低分辨率、模糊或损坏照片的问题,同时支持多语言操作,适用于摄影爱好者、社交媒体用户、专业摄影师以及设计师等不同人群。

Claude 4

Claude 4 是 Anthropic 公司推出的新一代 AI 模型,包括 Claude Opus 4 和 Claude Sonnet 4。Claude Opus 4 擅长复杂任务和长时间运行的工作流,如代码生成、优化和调试,具有强大的推理能力。Claude Sonnet 4 在编程和推理上表现优异,适合日常使用。两者均支持工具使用、记忆管理、多模态处理等功能,提升 AI Agent 的效率与实

MVoT

MVoT是一种多模态推理框架,通过生成图像形式的推理痕迹,增强多模态大语言模型在复杂空间推理任务中的表现。其核心技术包括多模态推理范式、token discrepancy loss以及递归生成机制,有效提升推理准确性和可解释性。该工具适用于机器人导航、自动驾驶、智能教育、医疗影像分析及VR/AR交互等多个领域,具有广泛的应用潜力。

OOMOL

OOMOL(悟墨)是一款基于 VSCode 的现代化 IDE,专为工作流自动化设计。通过拖拽式界面,用户可快速构建复杂流程,无需编程基础。内置 Python 和 Node.js 环境,结合容器化技术实现跨平台一致性和数据安全。原生支持 AI 功能,涵盖数据科学、多媒体处理和模型开发等场景,适合开发者高效构建和共享工作流。

Find3D

Find3D是一款由加州理工学院开发的3D部件分割模型,通过自动化数据生成技术和对比学习方法,实现了高效且精准的3D对象分割。它能够在多个数据集上达到三倍于次优方法的性能提升,支持开放世界下的任意文本查询分割,广泛应用于机器人、虚拟现实、建筑设计等领域。

Pixlr

Pixlr是一款免费的在线AI图像编辑工具,支持多种图像格式并提供从基础到高级的各种编辑功能。它集成了AI功能,如自动背景移除和图像生成,适合摄影师、设计师和普通用户使用。Pixlr拥有专业的图像处理工具,如图层、遮罩、调整颜色和光线等,并提供创意模板和动画制作工具,增强图像视觉效果。此外,它还支持批量照片编辑和跨平台使用。

MarDini

MarDini是一款融合掩码自回归(MAR)和扩散模型(DM)的先进视频生成工具,支持视频插值、图像到视频生成、视频扩展等多种任务。它通过优化计算资源分配,提高了视频生成的效率与灵活性,并具备从无标签数据中进行端到端训练的能力,展现出强大的可扩展性与效率。

LEOPARD

LEOPARD是一款由腾讯AI Lab开发的视觉语言模型,专为处理包含大量文本的多图像任务而设计。它通过自适应高分辨率多图像编码模块和大规模多模态指令调优数据集,实现对复杂视觉语言任务的高效处理,包括跨图像推理、高分辨率图像处理及动态视觉序列长度优化。LEOPARD在自动化文档理解、教育、商业智能等领域具有广泛应用潜力。

InternVL

InternVL是由上海人工智能实验室开发的多模态大模型,融合视觉与语言处理能力,支持图像、视频、文本等多种输入。其基于ViT-MLP-LLM架构,具备多模态理解、多语言处理、文档解析、科学推理等能力,广泛应用于视觉问答、智能客服、图像分析等领域。模型采用动态高分辨率与渐进式训练策略,提升处理效率与准确性。

Hero Stuff

Hero Stuff是一款基于AI的二手物品销售辅助工具,支持拍照识别物品并自动生成商品描述、定价建议及发布信息。用户可一键将商品发布至多个平台,简化销售流程。工具具备多品类支持、历史记录管理和智能优化建议等功能,适用于学生、搬家人群及日常清理者,提高闲置物品的销售效率与成交率。