语言处理

AutoVFX

AutoVFX是一款由伊利诺伊大学香槟分校研发的先进物理特效框架,通过神经场景建模、大型语言模型(LLM)代码生成及物理模拟技术,实现自然语言指令驱动的视频特效编辑与创作。其主要功能涵盖3D场景建模、程序生成、VFX模块、物理模拟、渲染与合成等,适用于电影制作、广告营销、游戏开发、虚拟现实及教育等多个领域。

Mistral OCR

Mistral OCR 是 Mistral AI 推出的高效 OCR 工具,支持多语言、多格式文档处理,准确率高达 99.02%。具备结构化输出、高速处理、多模态识别及 Doc-as-prompt 功能,适用于科研、文化遗产保护及企业文档管理等场景。

AI Now

AI Now是一款由联想推出的个人AI助手,内置Meta Llama 3等本地大型语言模型,支持自然语言交互、内容生成、设备管理和跨设备数据传输等功能。它注重数据安全与隐私保护,通过本地加密和个人知识库实现全面的数据控制。AI Now适用于个人助理、教育辅导、办公自动化、内容创作以及客户服务等多种应用场景,旨在提高用户的工作效率和生活质量。

MemoryScope

MemoryScope 是一款面向大型语言模型的长期记忆系统,通过向量数据库存储记忆片段,支持记忆检索、巩固及反思等核心功能。它具备时间感知能力,能提供个性化的交互体验,广泛应用于个人助理、情感陪伴、客户服务、教育辅导和健康咨询等领域。

通义仁心

通义仁心是一款由阿里巴巴集团开发的医疗健康领域人工智能服务平台,利用自然语言处理和深度学习技术,提供疾病、症状、药品及医疗报告解读等多方面的信息服务。它致力于为用户提供权威、专业的医学知识科普,并强调不替代专业医疗建议。主要功能包括问报告、问症状、问用药和问疾病等,同时适用于个人健康咨询和医疗机构资源管理。

mPLUG

mPLUG-Owl3是一款由阿里巴巴开发的多模态AI模型,专注于理解和处理多图及长视频内容。该模型具备高推理效率和准确性,采用创新的Hyper Attention模块优化视觉与语言信息的融合。它已在多个基准测试中展现出卓越性能,并且其源代码和资源已公开,可供研究和应用。

我在AI

我在AI是一款集自然语言处理、个性化定制和情感支持于一体的智能交互平台。它提供多样化的功能,如AI智能体定制、剧情体验、工作辅助及信息查询,适用于个人、企业及政府部门。凭借强大的知识库和持续优化的学习算法,我在AI能够快速响应用户需求,提供精准的信息反馈和高效的解决方案。

语鲸大模型

语鲸大模型是一个多功能的AI语言处理工具,它通过先进的算法和持续的学习,为用户提供高效、准确的语言服务。

PaliGemma 2 mix

PaliGemma 2 Mix 是谷歌 DeepMind 推出的多任务视觉语言模型,支持图像描述、目标检测、OCR、文档理解等功能。模型提供多种参数规模和分辨率选项,适用于不同场景。其基于开源框架开发,易于扩展,可通过简单提示切换任务。适用于科学问题解答、文档分析、电商内容生成等多个领域。

LegoGPT

LegoGPT是一款由卡内基梅隆大学开发的AI工具,可根据文本描述生成稳定、可组装的乐高积木模型。它结合自回归语言模型与大规模数据集,支持自动纹理上色、物理稳定性验证及手动或机器人组装。该工具能有效提升创意设计效率,适用于教育、玩具开发及自动化生产等多个场景。