模型

DeepCoder

DeepCoder-14B-Preview 是一款基于 Deepseek-R1-Distilled-Qwen-14B 微调的开源代码生成模型,采用分布式强化学习技术,在 LiveCodeBench 基准上达到 60.6% 准确率。支持多语言代码生成、问题解决、补全优化、测试生成等功能,适用于开发、教育、竞赛等多个场景。项目提供完整训练数据与优化方案,推动 RL 在 LLM 中的应用。

DeepGEMM

DeepGEMM是DeepSeek开发的高效FP8矩阵乘法库,专为NVIDIA Hopper架构优化,支持普通与分组GEMM操作。采用即时编译技术,实现运行时动态优化,提升计算性能与精度。通过细粒度缩放和双级累加技术解决FP8精度问题,结合TMA特性提升数据传输效率。代码简洁,仅约300行,适用于大规模AI推理、MoE模型优化及高性能计算场景。

Spirit LM

Spirit LM 是一种由 Meta AI 开发的多模态语言模型,能够处理文本和语音数据,支持跨模态学习。其基础版(BASE)和表达版(EXPRESSIVE)分别侧重于语义理解和情感表达。Spirit LM 可用于自动语音识别(ASR)、文本到语音(TTS)、语音分类及情感分析等任务,在语音助手、语音转写、有声读物等领域具有广泛应用前景。

Shining Yourself

Shining Yourself是商汤科技推出的高保真饰品虚拟试戴技术,基于扩散模型实现逼真试戴效果。支持多饰品、个性化调整、多场景模拟及动态展示,适用于电商、设计、社交及品牌推广等场景,提升用户体验与决策效率。

MiniMax 大语言模型

它基于海量中文数据训练而成,拥有超过1000亿个参数,能够处理上百TB的文本数据。

Consensus

Consensus 是一款基于人工智能技术的学术搜索引擎,整合了大型语言模型和向量搜索技术,能够高效检索和理解超过两亿篇同行评审的科学文献。它具备快速搜索、AI 生成摘要、Consensus Meter 和证据支持答案等功能,有效减少误导信息传播,增强信息可信度。适用于学术研究、文献综述、医学研究、教育等领域,助力用户高效获取科学知识并做出数据驱动型决策。

SimpleQA

SimpleQA是OpenAI开发的一个基准测试工具,用于评估大型语言模型在回答简短、事实性问题时的表现。它包含4326个问题,每个问题都有唯一的正确答案,并通过严格的验证流程确保质量。SimpleQA不仅能够测试模型的事实性回答能力,还能衡量其自我认知水平和校准能力,广泛应用于模型开发、学术研究及教育工具等领域。

Bestprompts

一个中文行业prompt收录网站。 一个全行业AI会话辅助工具,为各行业的内容创作者提供全面准确的提示语。

WeClone

WeClone是一款基于聊天记录创建数字分身的AI工具,通过微调大语言模型生成个性化风格的数字分身,并支持绑定到微信、QQ、Telegram等平台。它提供聊天记录预处理、语音克隆、隐私保护和本地化部署等功能,确保数据安全。用户可灵活配置模型,应用于个人助理、内容创作、情感陪伴等多个场景。