APB APB是一种由清华大学等机构开发的分布式长上下文推理框架,通过稀疏注意力机制和序列并行推理提升大模型处理长文本的效率。采用更小的Anchor Block和Passing Block,结合查询感知的上下文压缩技术,减少计算开销并精准传递关键信息。在128K长度文本上,APB推理速度比Flash Attention快10倍,比Star Attention快1.6倍,适用于多种分布式环境和模型规模,广泛 AI项目与工具 2025年06月12日 64 点赞 0 评论 504 浏览
AgentSociety AgentSociety是由清华大学开发的基于大语言模型的社会模拟平台,通过构建具有“类人心智”的智能体,模拟复杂的社会行为与现象。平台支持城市环境建模、大规模社会模拟和科研工具集成,适用于社会舆论传播、政策评估、社会极化分析及灾害响应研究。其技术特点包括异步模拟架构、分布式计算和MQTT通信,具备高度可扩展性和实时交互能力。 AI项目与工具 2025年06月12日 21 点赞 0 评论 491 浏览
Long Long-VITA是一款由腾讯优图实验室、南京大学和厦门大学联合开发的多模态AI模型,支持处理超长文本(超过100万tokens)及多模态输入(图像、视频、文本)。通过分阶段训练提升上下文理解能力,结合动态分块编码器与并行推理技术,实现高效处理长文本和高分辨率图像。模型基于开源数据训练,适用于视频分析、图像识别、长文本生成等场景,性能在多个基准测试中表现突出。 AI项目与工具 2025年06月12日 65 点赞 0 评论 488 浏览
DeepEP DeepEP 是 DeepSeek 开发的开源 EP 通信库,专为混合专家模型(MoE)的训练和推理设计。它提供高吞吐、低延迟的 GPU 内核,支持 NVLink 和 RDMA 通信,优化了组限制门控算法,兼容 FP8 等低精度数据格式。适用于大规模模型训练、推理解码及高性能计算场景,具有良好的系统兼容性和网络优化能力。 AI项目与工具 2025年06月12日 43 点赞 0 评论 473 浏览
端脑Cephalon Cephalon Cloud端脑云,分布式AIGC算力网络,全网最高性价比,海量专业AIGC工具,无需部署,在线使用。一键部署Al绘图SD环境全面支持抱脸和C站。 Ai绘画生成 2025年06月05日 90 点赞 0 评论 455 浏览
基石智算 基石智算是青云科技推出的AI算力云服务平台,支持多种异构算力资源的统一调度与管理,具备弹性扩容、分布式任务调度、一站式AI开发及模型部署等功能。平台适用于AI模型训练、高性能计算、数据科学分析及模型推理等多种场景,提供灵活的服务模式和全面的资源监控与管理能力,助力用户高效开展人工智能相关工作。 AI项目与工具 2025年06月11日 49 点赞 0 评论 449 浏览
COMET COMET是字节跳动开发的Mixture-of-Experts(MoE)模型优化系统,通过细粒度计算-通信重叠技术和自适应负载分配机制,显著提升分布式训练效率。它在大规模模型中实现单层1.96倍、端到端1.71倍的加速,具备强鲁棒性与泛化能力,支持多种硬件环境和并行策略,核心代码已开源并可无缝集成至主流训练框架。 AI项目与工具 2025年06月12日 12 点赞 0 评论 435 浏览
无阶未来 一个致力于为广大热爱AI应用开发、寻求AI工具、炼丹的小伙伴儿们提供便利的AI应用与算网平台, 无阶未来提供了丰富的镜像资源及云端部署环境。 Ai平台模型 2025年06月05日 49 点赞 0 评论 426 浏览
揽睿星舟 揽睿星舟是一款由翼方健数自主研发的云端AI训推一体化算力平台,提供高性能GPU计算资源、开箱即用的训练与推理环境、丰富的AI工具链及预训练模型,支持多机多卡分布式训练和隐私安全计算,旨在解决AI协作中的安全信任问题并加速AI价值的释放。它包含推理服务、工作空间、星舟API、镜像社区、应用版与专业版等多种功能和服务,适用于模型训练、推理、大模型API服务、隐私安全计算及数据集共享等多个应用场景。 AI项目与工具 2025年06月12日 76 点赞 0 评论 408 浏览