学习

华知大模型5.0

华知大模型5.0是一款由同方知网与华为云联合开发的多模态人工智能平台,支持文本、图像等多种数据类型的处理与生成。其核心功能包括AIGC检测、学术搜问、图表解读、论文选题、文献理解以及知识推荐等,广泛应用于科技创新、学术研究、科学决策及数据分析等领域,致力于提升工作效率并促进智能化发展。

R1

R1-Onevision 是一款基于 Qwen2.5-VL 微调的开源多模态大语言模型,擅长处理图像与文本信息,具备强大的视觉推理能力。它在数学、科学、图像理解等领域表现优异,支持多模态融合与复杂逻辑推理。模型采用形式化语言和强化学习技术,提升推理准确性与可解释性,适用于科研、教育、医疗及自动驾驶等场景。

HybridRAG

HybridRAG是一种结合了检索增强生成模型的混合架构,通过检索系统和生成模型的协同工作,生成更准确和丰富的输出。其主要功能包括信息检索、上下文理解、知识融合和生成能力。HybridRAG适用于多种自然语言处理任务,如问答系统、文本摘要和对话生成,能够利用大量外部知识提高生成内容的质量和相关性。

ERA

ERA-42是一款由北京星动纪元开发的端到端原生机器人大模型,结合五指灵巧手星动XHAND1,可执行超过100种复杂灵巧操作任务。ERA-42无需预编程,具有快速学习能力,能在短时间内掌握新技能。该模型融合多模态信息,具备强大的跨模态能力和泛化能力,适用于工业自动化、医疗辅助、家庭服务、灾难救援和物流配送等多种场景。

MagicAI

MagicAi魔法棒,是中文AI指令交流网站,专为职场人士和AIGC操作者提供AI指令学习和交流平台。

ToddlerBot

ToddlerBot是由斯坦福大学开发的开源人形机器人平台,具备30个主动自由度,采用Dynamixel电机,总成本低于6000美元。它支持模拟到现实的零样本迁移,可通过远程操作采集高质量数据,适用于运动控制、强化学习及多机器人协作等研究场景。其高保真数字孪生技术与易维护设计,使其成为科研和教育领域的理想工具。

AnyStory

AnyStory是阿里巴巴通义实验室开发的文本到图像生成工具,支持单个或多个主体的高保真图像生成。其核心在于“编码-路由”架构,结合ReferenceNet和CLIP视觉编码器实现主体特征的精准建模与定位。通过解耦路由机制,有效避免多主体混淆,确保图像与文本描述高度一致。适用于创意设计、角色生成、广告制作等多个场景,提供高质量、个性化的图像生成能力。

SignGemma

SignGemma是由谷歌DeepMind团队开发的全球最强大的手语翻译AI模型,专注于将美国手语(ASL)实时翻译成英语文本。通过多模态训练方法,结合视觉和文本数据,实现高准确率和低延迟的翻译,响应时间低于0.5秒。支持端侧部署,保护用户隐私,适用于教育、医疗和公共服务等场景。