自然语言处理

MinusX

MinusX是一款先进的AI工具,专为数据分析应用程序如Jupyter和Metabase设计。它通过自然语言处理技术,支持用户以聊天形式提出问题和假设,并自动执行数据分析任务,提供直观的见解。MinusX简化了数据探索过程,提高了工作效率,使数据分析师、研究人员和商业决策者能够快速获得深入的数据洞察。主要功能包括自然语言查询、假设生成与验证、内容修改、选择与提问以及无缝集成。

Magma

Magma是微软研究院开发的多模态AI基础模型,具备理解与执行多模态任务的能力,覆盖数字与物理环境。它融合语言、空间与时间智能,支持从UI导航到机器人操作的复杂任务。基于大规模视觉-语言和动作数据预训练,Magma在零样本和微调设置下表现优异,适用于网页操作、机器人控制、视频理解及智能助手等多个领域。

InternVL3

InternVL3是上海人工智能实验室推出的多模态大型语言模型,具备文本、图像、视频等多模态数据处理能力。采用原生多模态预训练方法,提升语言与视觉理解效率,并支持工具使用、3D视觉、工业图像分析等复杂任务。模型可通过API部署,适用于智能交互、图像识别、视频分析及客服系统等多种场景。

闪令

闪令是一款基于AI技术的互动内容社交平台,专为年轻用户打造。它提供高自由度的角色扮演和多种剧情体验,涵盖古风、同人、穿越等类型。平台特色在于其有声互动功能,拥有43种音色及丰富组合方式,并支持语音输入,增强用户体验的真实感。此外,闪令通过AI模型适配各类剧情场景,为用户提供无限结局与故事线,同时支持社交互动、创意写作等功能。

Qwen3 Reranker

Qwen3 Reranker是阿里巴巴通义千问团队推出的文本重排序模型,属于Qwen3模型家族。它采用单塔交叉编码器架构,能够对文本对进行相关性评估并输出得分,支持超过100种语言。通过多阶段训练范式和高质量数据训练,模型在MTEB排行榜上表现优异。Qwen3 Reranker可用于语义检索、文本分类、情感分析和代码搜索等场景,提升信息检索效率和准确性。

WorldSense

WorldSense是由小红书与上海交通大学联合开发的多模态基准测试工具,用于评估大型语言模型在现实场景中对视频、音频和文本的综合理解能力。该平台包含1662个同步视频、3172个问答对,覆盖8大领域及26类认知任务,强调音频与视频信息的紧密耦合。所有数据经专家标注并多重验证,确保准确性。适用于自动驾驶、智能教育、监控、客服及内容创作等多个领域,推动AI模型在多模态场景下的性能提升。

商汤日日新大模型

商汤日日新大模型体现了商汤科技在人工智能领域的深入研究和创新能力。通过结合大模型和大算力,商汤科技致力于提供全面的AI解决方案,推动通用人工智能技术的发展,并在多个应用...

SurveyX

SurveyX 是一款基于大型语言模型的学术综述生成工具,由多所高校联合开发。它通过用户输入的标题和关键词,自动生成高质量、结构化的学术综述,适用于多个研究领域。系统具备高效的文献检索与整合能力,结合智能大纲生成和内容优化技术,提升综述的准确性和逻辑性。同时支持动态更新和多模态展示,广泛应用于科研、教学及行业分析场景。

LayerSkip

LayerSkip 是一种针对大型语言模型推理优化的技术,通过层 dropout 和早期退出损失机制,实现从早期层的精准退出,降低计算成本并提高解码效率。该方法结合自我推测解码技术,支持模型在早期层生成预测并通过后续层验证修正,广泛适用于文档摘要、编程任务、语义解析等自然语言处理任务,同时确保高精度与低延迟。

Multimodal Live API

Multimodal Live API是谷歌推出的一种支持文本、音频和视频交互的AI接口,具备低延迟、实时双向通信和自然语言处理能力。它允许用户通过多种输入方式与AI互动,并支持会话记忆和外部功能调用,广泛应用于客户服务、在线教育、远程医疗、视频会议和娱乐等领域。