大型语言模型

Whispo

Whispo是一款AI驱动的语音转录工具，支持用户通过快捷键快速录制语音并将其转写为文本，同时具备本地数据处理、隐私保护及基于大型语言模型的文本后处理功能。它适用于会议记录、教育、自动字幕生成等多个场景，旨在提升工作效率和用户体验。

AI项目与工具 2025年06月12日 47 点赞 0 评论 526 浏览

DuoAttention

DuoAttention是由MIT韩松团队提出的新型框架，通过区分“检索头”和“流式头”两种注意力机制，显著提升了大型语言模型在处理长上下文时的推理效率。该框架有效减少了内存占用，加速了解码和预填充过程，并保持了模型的准确性。它适用于多轮对话、长文档处理、学术研究以及内容推荐等多个领域。

AI项目与工具 2025年06月12日 58 点赞 0 评论 576 浏览

OmniParser

OmniParser是一款由微软研究院开发的屏幕解析工具，能够将UI截图转换为结构化数据，通过识别可交互图标和提取功能语义，提升基于大型语言模型的UI代理系统的性能。它支持跨平台应用，无需依赖额外信息，适用于自动化软件测试、虚拟助手、辅助技术等多个领域。

AI项目与工具 2025年06月12日 29 点赞 0 评论 546 浏览

Ditto

Ditto是一款基于Flask框架的Web应用程序生成工具，通过自然语言输入和大型语言模型（LLM）实现自动化代码生成，支持模块化结构和无代码操作，适合快速原型开发、教育学习及非技术人员使用。其核心功能包括自然语言解析、代码自动生成、模块化管理以及环境变量配置等。

AI项目与工具 2025年06月12日 99 点赞 0 评论 784 浏览

SynthID Text

SynthID Text 是一种由谷歌DeepMind开发的文本水印技术，主要用于识别和验证大型语言模型生成的文本。它通过在生成过程中嵌入几乎不可见的水印，保持文本质量的同时实现高效检测。SynthID Text 支持多种模式，适用于新闻、教育、法律及社交媒体等多个领域，为内容验证和AI应用提供了技术支持。

AI项目与工具 2025年06月12日 50 点赞 0 评论 644 浏览

MobileLLM

MobileLLM是一款针对移动设备优化的大型语言模型，具有语言理解与生成、零样本常识推理、聊天交互、API调用、文本重写与摘要生成以及数学问题解决等功能。它通过深度薄型架构、SwiGLU激活函数、嵌入共享和分组查询注意力机制等技术，在低参数环境下实现高效性能，适用于移动聊天、语音助手、内容推荐、教育辅助和移动搜索等多种应用场景。

AI项目与工具 2025年06月12日 52 点赞 0 评论 490 浏览

Skyvern

Skyvern是一款基于开源的浏览器自动化工具，集成了大型语言模型和计算机视觉技术，用于实现网页内容解析、交互计划生成及执行。其主要功能涵盖CAPTCHA解决、双因素认证支持、代理网络配置、可解释AI操作以及数据提取等，适用于网站数据抓取、表单填写、网页测试等多种应用场景。

AI项目与工具 2025年06月12日 90 点赞 0 评论 533 浏览

GTA

GTA是一项由上海交通大学与上海AI实验室合作研发的基准测试，专注于评估大型语言模型在真实世界环境中的工具调用能力。它包含229个精心设计的问题，涉及多个领域，并通过多模态输入输出和细粒度评估指标，全面衡量模型的工具使用效率与准确性。GTA可应用于智能助理开发、多模态交互、自动化客户服务、教育及科研等多个领域，助力提升人工智能系统的综合性能。

AI项目与工具 2025年06月12日 20 点赞 0 评论 764 浏览

AgentReview

AgentReview是一款基于大型语言模型构建的学术同行评审模拟工具，通过模拟评审者、作者和领域主席的角色，研究评审偏见和决策机制对评审结果的影响。它支持隐私保护，无需真实敏感数据，同时验证了多种社会学理论在评审中的应用，为优化学术评审流程提供了重要参考。

AI项目与工具 2025年06月12日 17 点赞 0 评论 448 浏览

MATRIX

MATRIX-Gen是一个基于多智能体模拟技术的系统，通过构建虚拟社会生成高质量训练指令数据，用于提升大型语言模型的表现。该工具支持多种应用场景，如软件开发、商业活动、医疗诊断、教育和客户服务，能够显著提高模型在不同领域的性能，并促进其自我进化。

AI项目与工具 2025年06月12日 73 点赞 0 评论 692 浏览

大型语言模型

首页

大型语言模型

列表

默认

浏览次数

发布日期