大型语言模型

Micro LLAMA

Micro LLAMA 是一款基于简化版 Llama 3 模型的教学工具，通过约 180 行代码实现 8B 参数的最小化模型，支持自注意力机制和前馈神经网络。它提供 Jupyter 笔记本和 Conda 环境配置指南，帮助用户轻松学习和实验，特别适用于学术教学、研究开发和个人学习。

AI项目与工具 2025年06月12日 77 点赞 0 评论 611 浏览

Grok

Grok-1是由xAI公司开发的大型语言模型，具备3140亿参数，是目前参数量最大的开源大语言模型之一。该模型基于Transformer架构，专用于自然语言处理任务，如问答、信息检索、创意写作和编码辅助等。尽管在信息处理方面表现出色，但需要人工审核以确保准确性。此外，Grok-1还提供了8bit量化版本，以降低存储和计算需求。

AI项目与工具 2024年01月01日 10 点赞 0 评论 609 浏览

ChatTTS

ChatTTS是一个开源的专为对话场景设计的语音生成模型，特别适用于大语言模型(LLM)助手的对话任务，以及诸如对话式音频和视频介绍等应用。ChatTTS 不仅能说中文，英文也能 hold 住...

创作工具 1970年01月01日 0 点赞 0 评论 600 浏览

MeteoRA

MeteoRA是一种基于LoRA和混合专家架构的多任务嵌入框架，用于大型语言模型。它支持多任务适配器集成、自主任务切换、高效推理及复合任务处理，提升模型灵活性和实用性。通过动态门控机制和前向加速策略，显著提高推理效率并降低内存占用，适用于多领域问答、多语言对话等场景。

AI项目与工具 2025年06月12日 72 点赞 0 评论 599 浏览

Delta

Delta-CoMe是一种由清华大学NLP实验室牵头研发的增量压缩算法，它通过低秩分解与混合精度量化技术，显著减少了大型语言模型的存储和内存需求，同时保持了模型性能几乎无损。该工具支持多任务处理、推理加速，并广泛适用于云计算、边缘计算及学术研究等领域，特别擅长应对数学、代码和多模态任务。

AI项目与工具 2025年06月12日 58 点赞 0 评论 590 浏览

NVLM

NVLM是NVIDIA研发的多模态大型语言模型，涵盖图像理解、语言理解、跨模态融合、图像描述生成、视觉推理及多模态翻译等功能。它具备多种架构（NVLM-D、NVLM-X、NVLM-H），并采用动态高分辨率输入、1-D平铺标签设计及多模态预训练与微调技术，广泛应用于图像描述、视觉问答、文档理解、多模态搜索及辅助驾驶等领域。

AI项目与工具 2025年06月12日 57 点赞 0 评论 590 浏览

VSI

VSI-Bench是一种用于评估多模态大型语言模型（MLLMs）视觉空间智能的基准测试工具，包含超过5000个问题-答案对，覆盖多种真实室内场景视频。其任务类型包括配置型任务、测量估计和时空任务，可全面评估模型的空间认知、理解和记忆能力，并提供标准化的测试集用于模型性能对比。 ---

AI项目与工具 2025年06月12日 10 点赞 0 评论 587 浏览

FACTS Grounding

FACTS Grounding是一款由谷歌DeepMind研发的基准测试工具，专门用于评估大型语言模型在生成事实准确文本方面的能力。它通过设置包含多个领域的复杂任务，要求模型基于长文档生成响应，并采用两阶段评估流程验证事实准确性及避免“幻觉”。FACTS Grounding不仅支持信息检索与问答，还能应用于内容摘要生成、文档改写以及客户服务等领域，为模型提供全面而可靠的性能评估。

AI项目与工具 2025年06月12日 38 点赞 0 评论 584 浏览

Large Action Models

Large Action Models（LAMs）是微软开发的一种智能系统框架，专注于执行真实世界任务。它通过整合数据收集、模型训练、环境交互和评估等阶段，将语言理解转化为具体行动，提升了AI在自动化和增强人类能力方面的影响力。LAMs具备动态规划、自主执行和专业化训练等特点，广泛应用于办公自动化、智能家居管理、客户服务、电子商务等领域。 ---

AI项目与工具 2025年06月12日 59 点赞 0 评论 583 浏览

Ai2 PaperFinder

Ai2 PaperFinder 是由艾伦人工智能研究所开发的基于大型语言模型的学术文献检索工具，支持多领域精准搜索，具备语义驱动、多Agent协同、引用网络分析等功能，能自动规划关键词、挖掘小众文献，助力研究人员快速获取高质量学术成果。

AI项目与工具 2025年06月12日 16 点赞 0 评论 582 浏览

大型语言模型

首页

大型语言模型

列表

默认

浏览次数

发布日期