AR

NVLM

NVLM是NVIDIA研发的多模态大型语言模型,涵盖图像理解、语言理解、跨模态融合、图像描述生成、视觉推理及多模态翻译等功能。它具备多种架构(NVLM-D、NVLM-X、NVLM-H),并采用动态高分辨率输入、1-D平铺标签设计及多模态预训练与微调技术,广泛应用于图像描述、视觉问答、文档理解、多模态搜索及辅助驾驶等领域。

灵伴科技Rokid

也和称Rokid,2014年成立,总部在杭州,创始人是前阿里巴巴M工作室负责人祝铭明,是一家专注于AI与AR技术的杭州高科技公司。

Avat3r

Avat3r 是由慕尼黑工业大学与 Meta Reality Labs 联合开发的高保真三维头部头像生成模型,基于高斯重建技术,仅需少量输入图像即可生成高质量且可动画化的 3D 头像。其核心优势在于使用交叉注意力机制实现表情动态化,支持多源输入,具备良好的鲁棒性和泛化能力。适用于 VR/AR、影视制作、游戏开发及数字人等领域。

PearOCR

PearOCR,一个完全免费的在线OCR图像转文字网站。支持简体中文、繁体中文、英文、日文、韩文五种语言。

Notebook Copilot

有了 Notebook CoPilot,开发笔记本的过程变得更加容易。这个简单的工具可以毫不费力地根据您的输入生成代码和 Markdown 单元格,从而显着简化您的工作流程。

Rath By Kanarie

​Kanaries是一家开发人工智能增强型数据研究工具的公司。他们的产品可以帮助您轻松高效地分析和可视化数据,是提升数据分析效率,数据分析师必备的AI工具。

Bearly.AI

Bearly,AI阅读总结、写作和内容生成助手。

WorldMem

WorldMem是由多所高校与研究机构联合开发的AI世界生成模型,通过引入记忆机制解决传统模型在长时间序列生成中的一致性问题。它支持动态环境模拟、多场景交互及长期一致性保持,适用于虚拟游戏、VR/AR、自动驾驶等多个领域,具备高度真实性和可扩展性。

MeshifAI

MeshifAI 是一款 AI 驱动的文本转 3D 模型生成工具,支持创建基础模型和 PBR 纹理模型,输出格式为 .glb,兼容多种 3D 软件和应用。用户可通过参数调整模型的创意性与质量,适合游戏开发、应用设计及网站展示等场景。

Charley.Ai

Charley.ai 是一个AI论文作家,可以帮助您轻松快速地编写原创的内容。Charley.ai可以了解您的要求,从可靠来源找到相关信息,并根据您的需求创建原创和高质量的论文。