AI项目与工具

PaliGemma 2

PaliGemma 2是一款由Google DeepMind研发的视觉语言模型(VLM),结合了SigLIP-So400m视觉编码器与Gemma 2语言模型,支持多种分辨率的图像处理。该模型具备强大的知识迁移能力和出色的学术任务表现,在OCR、音乐乐谱识别以及医学图像报告生成等方面实现了技术突破。它能够处理多模态任务,包括图像字幕生成、视觉推理等,并支持量化和CPU推理以提高计算效率。

The Matrix

The Matrix是一款基于AI的世界模拟器,能够生成高保真度、无限时长的视频流,支持实时交互控制。它融合了3A游戏数据与真实世界视频,具备零样本泛化能力。核心技术包括交互模块、移窗去噪过程模型和流一致性模型,适用于游戏开发、影视制作、虚拟现实、教育模拟及城市规划等多个领域。

云图AI网

云图AI网是一款专为室内外建筑设计师打造的AI绘图工具,支持上传多种设计图纸并快速生成效果图。主要功能包括AI创作、彩平图生成、局部重绘,同时覆盖室内设计、建筑规划、园林景观及展厅展览等领域,帮助设计师节省时间、降低成本并提升工作效率。

FP Video

FP Video是一款基于人工智能技术的图像编辑工具,提供包括AI绘画、照片修复、发型变换、卡通化在内的多项创意功能。它能够帮助用户修复旧照片、调整照片风格、尝试虚拟发型,并通过智能算法实现背景替换和物体消除等操作,适用于个人美化、艺术创作及社交媒体内容制作等多个场景。

Qwen2.5

Qwen2.5-Coder是一款开源代码生成模型,覆盖多种规模参数,支持超过40种编程语言,擅长代码生成、推理、修复及多语言支持。其旗舰模型在多项基准测试中表现优异,具备强大的长上下文处理能力和人类偏好对齐特性。适用于日常编程、代码学习、教育、代码审查及自动化测试等场景。

源2.0

源2.0-M32是由浪潮信息开发的一种混合专家模型(MoE),包含32个专家,采用“注意力路由器”技术,显著提升了模型的效率和准确性。该模型在代码生成、数学问题解决、科学推理等多个领域表现出色,尤其在ARC-C和MATH基准测试中超越了其他模型。源2.0-M32具有高效的计算能力和广泛的适用性,适用于多种复杂任务。

麦琪的花园

《麦琪的花园》是一款融合AI技术与沙盒玩法的冒险游戏,玩家可创建个性化AI伙伴并与之互动,同时建设营地、探索魔法大陆。游戏支持多语言对话和语音合成,提供沉浸式社交体验,适合沙盒、二次元及AI技术爱好者。

braintrust

Braintrust 是一个端到端的 AI 工具平台,专注于通过迭代式的工作流帮助公司快速构建高效的 AI 应用。它提供了强大的提示调整、评分器配置及数据集管理功能,支持从模型评估到质量控制的全流程优化。此外,Braintrust 的直观界面和代码库集成特性使其适用于各类用户群体,广泛应用于 AI 产品开发、模型评估、质量控制及数据集构建等领域。

悬河

悬河是一款基于AI技术的虚拟角色社交平台,支持用户通过文字或语音与定制化的AI角色进行深度交流。其核心功能包括情感陪伴、IP互动、个性化角色定制、智能推荐和沉浸式聊天体验,广泛应用于情感支持、社交训练、心理辅导、生活助手及学习辅助等领域。

DINO

DINO-X是一款由IDEA研究院开发的通用视觉大模型,具备开放世界对象检测与理解的能力。它支持多种提示类型,无需用户额外输入即可识别图像中的任意对象,并在多个基准测试中刷新了性能记录。DINO-X拥有Pro和Edge两个版本,分别针对高性能需求和边缘设备优化。其应用范围涵盖自动驾驶、智能安防、工业检测及机器人视觉等领域,助力行业创新与发展。