大型语言模型

SEMIKONG

SEMIKONG是一款针对半导体行业的大型语言模型，专注于解决制造与设计中的复杂问题。它通过整合专家知识、优化预训练流程及微调，实现了对刻蚀等领域的深刻理解，显著提升了半导体制造过程的效率和质量。此外，它还辅助IC设计、提供异常检测与预测性维护支持，并通过专家反馈循环持续改进模型性能，为行业带来了高效的解决方案。

AI项目与工具 2025年06月12日 21 点赞 0 评论 699 浏览

书生·万象InternVL 2.5

书生·万象InternVL 2.5是一款开源多模态大型语言模型，基于InternVL 2.0升级而来。它涵盖了从1B到78B不同规模的模型，支持多种应用场景，包括图像和视频分析、视觉问答、文档理解和信息检索等。InternVL 2.5在多模态理解基准上表现优异，性能超越部分商业模型，并通过链式思考技术提升多模态推理能力。

AI项目与工具 2025年06月12日 100 点赞 0 评论 718 浏览

HMoE

HMoE（混合异构专家模型）是腾讯混元团队提出的一种新型神经网络架构，旨在提升大型语言模型的性能和计算效率。通过引入不同规模的专家来处理不同复杂度的输入数据，HMoE增强了模型的专业化程度，并采用了新的训练目标和策略，如P-Penalty Loss，以提高参数利用率和计算效率。HMoE在多个预训练评估基准上表现出色，适用于自然语言处理、内容推荐、语音识别、图像和视频分析以及多模态学习等领域。

AI项目与工具 2025年06月12日 90 点赞 0 评论 724 浏览

Reflection 70B是一款基于Meta的Llama 3.1 70B Instruct构建的开源AI大模型，采用“Reflection-Tuning”技术，能够在生成最终回答前检测并纠正错误，显著提高输出的准确性。该模型特别适用于需要高精度推理的任务，并具备出色的零样本推理能力。用户可以通过引入特殊token，以更结构化的方式与模型交互。此外，Reflection 70B支持通过Huggin

AI项目与工具 2025年06月12日 98 点赞 0 评论 733 浏览

CleanS2S

CleanS2S是一款流式语音到语音交互智能体原型，通过集成自动语音识别（ASR）、大型语言模型（LLM）、文本到语音（TTS）以及WebSockets等技术，提供高质量、实时的语音交互体验。它支持全双工交互和打断功能，可整合网络搜索和RAG模型以增强回答能力，适用于客户服务、智能家居控制、教育辅助、健康咨询及车载系统等多个领域。

AI项目与工具 2025年06月12日 99 点赞 0 评论 738 浏览

ComfyGen

ComfyGen是一款基于大型语言模型（LLM）的文本到图像生成系统，能够根据用户提供的文本提示自动生成高质量图像。它通过结合多种专业组件如微调基础模型、LoRAs、嵌入技术和超分辨率处理等构建复杂工作流，并采用两种基于LLM的方法优化图像生成质量，适用于艺术创作、游戏开发、广告设计、电影制作等多个领域。

AI项目与工具 2025年06月12日 54 点赞 0 评论 748 浏览

DeepCoder

DeepCoder-14B-Preview 是一款基于 Deepseek-R1-Distilled-Qwen-14B 微调的开源代码生成模型，采用分布式强化学习技术，在 LiveCodeBench 基准上达到 60.6% 准确率。支持多语言代码生成、问题解决、补全优化、测试生成等功能，适用于开发、教育、竞赛等多个场景。项目提供完整训练数据与优化方案，推动 RL 在 LLM 中的应用。

AI项目与工具 2025年06月12日 39 点赞 0 评论 750 浏览

Perplexica

Perplexica是一款开源的AI驱动搜索引擎，支持多模式搜索（如全网、学术、视频等），兼容本地大型语言模型，具备强大的自然语言理解和实时信息更新能力。适用于个人、学术、企业和教育场景，帮助用户高效获取所需信息。

AI项目与工具 2025年06月12日 65 点赞 0 评论 750 浏览

HelloBench

HelloBench 是一款开源基准测试工具，专注于评估大型语言模型在长文本生成任务中的表现。它基于布鲁姆分类法设计了五个子任务，并采用 HelloEval 方法实现高效自动化评估。该工具支持多领域应用，包括模型开发、学术研究、产品测试等，同时揭示了现有模型在长文本生成中的局限性。

AI项目与工具 2025年06月12日 93 点赞 0 评论 757 浏览

Arctic

Arctic是一款由云计算公司Snowflake的AI研究团队开发的高效且开源的企业级大型语言模型，拥有480亿参数。该模型采用混合专家模型（MoE）架构，结合了密集变换器（Dense Transformer）和128个专家的特点。Arctic在成本效益、训练效率和推理效率方面具有显著优势，特别适用于企业任务，例如SQL生成、编程和指令遵循。模型基于Apache 2.0许可发布，用户可以自由使用和

AI项目与工具 2024年01月01日 90 点赞 0 评论 757 浏览

大型语言模型

首页

大型语言模型

列表

默认

浏览次数

发布日期