大型语言模型

Mistral Large

Mistral Large是Mistral AI开发的一款先进的大型语言模型，具备出色的多语言推理能力和强大的上下文理解能力。它在多个基准测试中表现出色，尤其是在多语言处理、推理和知识、数学与编程方面。Mistral Large支持多语言处理，并且能精确遵循指令，还支持函数调用，便于与开发者工具集集成。此外，该模型可通过Azure AI Studio和Azure Machine Learning平

AI项目与工具 2024年01月01日 86 点赞 0 评论 759 浏览

ELLA

ELLA（Efficient Large Language Model Adapter）是一种由腾讯研究人员开发的方法，旨在提升文本到图像生成模型的语义对齐能力。它通过引入时序感知语义连接器（TSC），动态提取预训练大型语言模型（LLM）中的时序依赖条件，从而提高模型对复杂文本提示的理解能力。ELLA无需重新训练，可以直接应用于预训练的LLM和U-Net模型，且能与现有模型和工具无缝集成，显著提升

AI项目与工具 2024年01月01日 74 点赞 0 评论 490 浏览

Grok

Grok-1是由xAI公司开发的大型语言模型，具备3140亿参数，是目前参数量最大的开源大语言模型之一。该模型基于Transformer架构，专用于自然语言处理任务，如问答、信息检索、创意写作和编码辅助等。尽管在信息处理方面表现出色，但需要人工审核以确保准确性。此外，Grok-1还提供了8bit量化版本，以降低存储和计算需求。

AI项目与工具 2024年01月01日 10 点赞 0 评论 609 浏览

Llama 3

Llama 3是Meta公司开发的一款最新大型语言模型，提供了8B和70B两种参数规模的模型。它通过增加参数规模、扩大训练数据集、优化模型架构和增强安全性等功能，显著提升了自然语言处理能力，适用于编程、问题解决、翻译和对话生成等多种应用场景。Llama 3在多个基准测试中表现出色，并且通过指令微调进一步增强了特定任务的表现。

AI项目与工具 2025年06月12日 40 点赞 0 评论 581 浏览

Arctic

Arctic是一款由云计算公司Snowflake的AI研究团队开发的高效且开源的企业级大型语言模型，拥有480亿参数。该模型采用混合专家模型（MoE）架构，结合了密集变换器（Dense Transformer）和128个专家的特点。Arctic在成本效益、训练效率和推理效率方面具有显著优势，特别适用于企业任务，例如SQL生成、编程和指令遵循。模型基于Apache 2.0许可发布，用户可以自由使用和

AI项目与工具 2024年01月01日 90 点赞 0 评论 757 浏览

Qwen2

Qwen2是由阿里云通义千问团队开发的大型语言模型系列，涵盖从0.5B到72B的不同规模版本。该系列模型在自然语言理解、代码编写、数学解题及多语言处理方面表现出色，尤其在Qwen2-72B模型上，其性能已超过Meta的Llama-3-70B。Qwen2支持最长128K tokens的上下文长度，并已在Hugging Face和ModelScope平台上开源。 ---

AI项目与工具 2024年01月01日 48 点赞 0 评论 526 浏览

LongWriter

LongWriter是一款由清华大学与智谱AI合作开发的长文本生成模型，能够生成超过10,000字的连贯文本。该模型基于增强的长上下文大型语言模型，采用了直接偏好优化（DPO）技术和AgentWrite方法，能够处理超过100,000个token的历史记录。LongWriter适用于多种应用场景，包括学术研究、内容创作、出版行业、教育领域和新闻媒体等。

AI项目与工具 2025年06月12日 67 点赞 0 评论 625 浏览

HMoE

HMoE（混合异构专家模型）是腾讯混元团队提出的一种新型神经网络架构，旨在提升大型语言模型的性能和计算效率。通过引入不同规模的专家来处理不同复杂度的输入数据，HMoE增强了模型的专业化程度，并采用了新的训练目标和策略，如P-Penalty Loss，以提高参数利用率和计算效率。HMoE在多个预训练评估基准上表现出色，适用于自然语言处理、内容推荐、语音识别、图像和视频分析以及多模态学习等领域。

AI项目与工具 2025年06月12日 90 点赞 0 评论 724 浏览

Reflection AI

Reflection AI是一个零代码AI Agent开发平台，用户可以创建个性化的AI聊天机器人，模仿真人的沟通风格。该平台基于生成式AI技术，尤其是大型语言模型（LLMs），允许用户通过个人数据训练AI，使其能够以独特方式进行交流。主要功能包括个性化AI Agent创建、快速部署、学习和适应、自定义和微调以及多渠道集成。应用场景广泛，涵盖客户服务、个人助理、社交媒体管理、教育和医疗咨询等领域。

AI项目与工具 2025年06月12日 97 点赞 0 评论 774 浏览

Reflection 70B

Reflection 70B是一款基于Meta的Llama 3.1 70B Instruct构建的开源AI大模型，采用“Reflection-Tuning”技术，能够在生成最终回答前检测并纠正错误，显著提高输出的准确性。该模型特别适用于需要高精度推理的任务，并具备出色的零样本推理能力。用户可以通过引入特殊token，以更结构化的方式与模型交互。此外，Reflection 70B支持通过Huggin

AI项目与工具 2025年06月12日 98 点赞 0 评论 733 浏览

大型语言模型

首页

大型语言模型

列表

默认

浏览次数

发布日期