AI项目与工具

Sapiens

Sapiens是由Meta实验室开发的AI视觉模型,主要用于解析图片和视频中的人类动作。它支持2D姿态估计、身体部位分割、深度估计和表面法线预测等功能,采用视觉变换器架构。Sapiens具有强大的泛化能力,适用于虚拟现实、增强现实、3D人体数字化、人机交互、视频监控分析、运动捕捉及医学成像与康复等多个领域。

TextHarmony

TextHarmony是一款由华东师范大学与字节跳动联合开发的多模态生成模型,擅长视觉与文本信息的生成与理解。该模型基于Slide-LoRA技术,支持视觉文本生成、编辑、理解及感知等功能,广泛应用于文档分析、场景文本识别、视觉问题回答、图像编辑与增强以及信息检索等领域。通过高质量数据集的构建与多模态预训练,TextHarmony在视觉与语言生成任务中表现出色。

Reply

Reply是一款结合人工智能技术的销售外展与潜在客户开发平台,主要功能涵盖AI销售助理、AI聊天、多渠道通信、LinkedIn自动化及CRM集成等。它帮助企业优化销售流程,提高销售效率,并支持潜在客户开发、邮件营销、社交媒体推广、销售外展及会议安排等应用场景。

氢刻

氢刻是一款结合AI技术的卡片式学习工具,支持个性化知识库构建与智能复习功能,适用于语言学习、概念记忆及专业考试等多个场景。其核心功能包括卡片笔记创建、智能复习推荐、AI辅助记忆及跨平台数据导入导出,助力用户高效管理和巩固知识。

LEGALNOW

LEGALNOW是一款基于AI技术的法律文件起草与审查平台,提供定制模板、一键审查、实时AI咨询、条款解析及数据加密等功能,旨在提升合同处理效率与安全性。其全球化律师网络覆盖60多个国家,支持多语言和多法域业务,适用于初创企业、中小企业、个人用户以及法律专业人士。

VLM

VLM-R1 是由 Om AI Lab 开发的视觉语言模型,基于 Qwen2.5-VL 架构,结合强化学习优化技术,具备精准的指代表达理解和多模态处理能力。该模型适用于复杂场景下的视觉分析,支持自然语言指令定位图像目标,并在跨域数据中表现出良好的泛化能力。其应用场景涵盖智能交互、无障碍辅助、自动驾驶、医疗影像分析等多个领域。

MVoT

MVoT是一种多模态推理框架,通过生成图像形式的推理痕迹,增强多模态大语言模型在复杂空间推理任务中的表现。其核心技术包括多模态推理范式、token discrepancy loss以及递归生成机制,有效提升推理准确性和可解释性。该工具适用于机器人导航、自动驾驶、智能教育、医疗影像分析及VR/AR交互等多个领域,具有广泛的应用潜力。

designtools.ai

DesignTools.ai 是一个集成了多种 AI 技术的专业设计平台,专为 UI 和 UX 设计师量身打造。它提供了包括 UI/UX 工具、配色方案生成、图像处理、排版设计、市场营销工具以及生产力提升工具在内的全面服务。通过这些功能,设计师可以更高效地完成各种设计任务,包括生成高质量的产品图像、创建 3D 模型、制定营销内容以及优化日常工作流程。

Bolt․new

Bolt.new 是一款基于 AI 和 WebContainers 技术的全栈 Web 编程工具,支持在浏览器中运行完整的 Node.js 环境。它具备对话式开发、代码生成与编辑、项目部署、错误修复等功能,显著提升开发效率。无论是个人开发者还是团队协作,都能从中受益。

Move AI

Move AI 是一款基于AI和计算机视觉的无标记动作捕捉工具,可将普通摄像头拍摄的2D视频转换为高精度3D运动数据。支持实时追踪、多摄像头配置及多种格式导出,适用于影视、游戏、体育分析、VR/AR等领域,提供高效、低成本的解决方案。