StoryBee StoryBee是一款基于AI技术的儿童故事生成平台,能够根据用户提供的主题或关键词自动生成个性化故事,并支持互动式选择以提升参与感。平台提供多样化的故事情节,涵盖多种类型,并针对不同年龄段的孩子调整故事复杂度。StoryBee融合教育元素,同时具备家长控制功能,确保内容的安全与健康。此外,平台还提供多媒体支持及故事创作工具,助力家庭和学校教育。 AI项目与工具 2025年06月12日 89 点赞 0 评论 745 浏览
RDT RDT是清华大学AI研究院推出的一款双臂机器人操作任务扩散基础模型,拥有十亿参数量,可自主完成复杂任务,如调酒和遛狗。该模型基于模仿学习,具备强大的泛化能力和操作精度,支持多种模态输入和少样本学习。RDT已在餐饮、家庭、医疗、工业及救援等领域展现广泛应用前景,推动机器人技术发展。 AI项目与工具 2025年06月12日 83 点赞 0 评论 742 浏览
TITAN TITAN是一款由哈佛医学院研究团队开发的多模态全切片病理基础模型,通过视觉自监督学习和视觉-语言对齐预训练,能够在无需微调或临床标签的情况下提取通用切片表示并生成病理报告。它在多种临床任务中表现出色,包括线性探测、少样本和零样本分类、罕见癌症检索、跨模态检索和病理报告生成,尤其适用于资源有限的临床场景。 AI项目与工具 2025年06月12日 93 点赞 0 评论 742 浏览
Dippy Dippy 是一款基于 AI 技术的个性化伴侣平台,通过虚拟角色实现与用户的互动交流。其特色包括思维链技术,使用户能洞察 AI 回答的逻辑过程;同时支持用户自定义角色外观、情感陪伴、语言学习及任务管理等功能。Dippy 目前专注于 iOS 用户群体,致力于打造高度个性化且透明的 AI 交互体验。 AI项目与工具 2025年06月12日 11 点赞 0 评论 740 浏览
Llama 4 Llama 4 是 Meta 推出的多模态 AI 模型系列,采用混合专家(MoE)架构,提升计算效率。包含 Scout 和 Maverick 两个版本,分别适用于不同场景。Scout 支持 1000 万 token 上下文,Maverick 在图像理解和创意写作方面表现优异。Llama 4 支持 200 种语言,具备强大的语言生成与多模态处理能力,适用于对话系统、文本生成、代码辅助、图像分析等多个 AI项目与工具 2025年06月12日 46 点赞 0 评论 740 浏览
APB APB是一种由清华大学等机构开发的分布式长上下文推理框架,通过稀疏注意力机制和序列并行推理提升大模型处理长文本的效率。采用更小的Anchor Block和Passing Block,结合查询感知的上下文压缩技术,减少计算开销并精准传递关键信息。在128K长度文本上,APB推理速度比Flash Attention快10倍,比Star Attention快1.6倍,适用于多种分布式环境和模型规模,广泛 AI项目与工具 2025年06月12日 64 点赞 0 评论 739 浏览
SPRIGHT SPRIGHT是由多所高校和机构联合开发的视觉-语言数据集,旨在提升文本到图像生成模型的空间一致性。通过重新描述约600万张图像,强化空间关系表达,如“左/右”、“上/下”等,显著提高图像生成的准确性。该数据集支持复杂场景的图像生成,并经过多维度评估验证其可靠性。SPRIGHT为视觉-语言模型的研究和应用提供了重要资源,广泛应用于图像生成、VR/AR、教育及科研等领域。 AI项目与工具 2025年06月12日 77 点赞 0 评论 739 浏览
Xiaomi MiMo Xiaomi MiMo 是小米推出的推理型大模型,具备强大的数学推理与代码生成能力。通过预训练与后训练相结合,利用大量高价值语料及强化学习算法,在 7B 参数规模下实现超越更大模型的表现。支持多场景应用,包括教育、科研、软件开发等,已开源至 HuggingFace,便于开发者使用与研究。 AI项目与工具 2025年06月11日 95 点赞 0 评论 738 浏览
VRAG VRAG-RL是阿里巴巴通义大模型团队推出的视觉感知驱动的多模态RAG推理框架,旨在提升视觉语言模型在处理视觉丰富信息时的检索、推理和理解能力。通过定义视觉感知动作空间,实现从粗粒度到细粒度的信息获取,并结合强化学习和综合奖励机制优化模型性能。该框架支持多轮交互推理,具备良好的可扩展性,适用于智能文档问答、视觉信息检索、多模态内容生成等多种场景。 AI项目与工具 2025年06月11日 84 点赞 0 评论 737 浏览