模型

EyeDiff

EyeDiff是一款基于扩散模型的文本到图像生成工具,专为多模态眼科图像生成设计。通过自然语言提示,EyeDiff能够捕捉常见及罕见眼病的关键特征,显著提升诊断准确性。该工具采用CLIP文本编码器与交叉注意力机制,结合潜在扩散模型(LDM),生成高质量、与文本高度一致的图像,适用于数据增强、疾病筛查、数据共享及医学教育等场景。

GR00T N1

GR00T N1 是英伟达推出的开源人形机器人基础模型,支持多模态输入并具备复杂任务执行能力。采用双系统架构,结合视觉-语言模型与扩散变换器,实现精准动作控制。基于大规模数据训练,适应多种机器人形态和任务场景,广泛应用于物流、制造、医疗等领域,提升自动化水平与操作效率。

MeteoRA

MeteoRA是一种基于LoRA和混合专家架构的多任务嵌入框架,用于大型语言模型。它支持多任务适配器集成、自主任务切换、高效推理及复合任务处理,提升模型灵活性和实用性。通过动态门控机制和前向加速策略,显著提高推理效率并降低内存占用,适用于多领域问答、多语言对话等场景。

PromptWizard

PromptWizard是一款由微软研发的自动化提示优化框架,专注于提升大型语言模型在特定任务中的表现。其核心技术包括自我演变、自我适应以及反馈驱动的批评与合成,通过迭代优化提示指令和上下文示例,显著增强模型的准确性和效率。PromptWizard适用于多种应用场景,如情感分析、智能教育助手、医疗诊断支持、法律文档分析及客户服务自动化等,助力各行业实现更高效的智能化操作。

Stability AI

Stability AI提供了一套完整的生成式AI模型,覆盖图像、视频和音频等多个领域,旨在推动AI技术的普及和应用。

HiveChat

HiveChat 是一款面向中小团队的 AI 聊天工具,支持多款主流 AI 模型,具备文本交互、图像理解、LaTeX/Markdown 渲染等功能。系统基于 React 构建,支持多种部署方式,适用于企业沟通、学术研究、内容创作等场景,提供高效、便捷的智能协作体验。

Seed1.5

Seed1.5-Embedding 是由字节跳动推出的高性能向量模型,基于 Seed1.5 训练优化,具有强大的语义编码和检索能力。模型采用 Siamese 双塔结构,支持多种向量维度,并通过两阶段训练提升表征能力。它适用于信息检索、文本分类、推荐系统、聚类分析等多种任务,尤其在复杂查询和推理任务中表现突出,具备良好的灵活性和可扩展性。

OLMo 2 32B

OLMo 2 32B 是由 Allen Institute for AI 推出的开源语言模型,拥有 320 亿参数,性能接近更大规模模型。它采用三阶段训练策略,结合预训练、中期训练和后训练,提升模型稳定性与任务适应性。模型支持多任务处理,涵盖自然语言处理、数学推理、编程辅助和内容创作等领域,并具备高效训练能力与低能耗优势。所有数据、代码和权重均开源,便于研究与开发。

KuaiMod

KuaiMod 是快手开发的多模态大模型内容审核系统,能高效识别和过滤有害及低质量视频。它结合视觉语言模型(VLM)和链式推理(CoT)技术,支持动态策略更新和强化学习,提升审核准确性。系统在离线测试中准确率达92.4%,有效降低用户举报率,优化推荐体验,助力平台内容生态健康发展。

libcom

libcom是一款由上海交通大学BCMI实验室开发的图像合成工具箱,支持图像融合、和谐化、阴影生成、对象放置及生成式合成等功能,采用传统图像处理与深度学习技术相结合的方式,提供高质量的合成图像解决方案。适用于增强现实、艺术创作、电子商务、影视制作及游戏开发等多个领域。