学习

O1

O1-CODER是一款由北京交通大学研究团队开发的开源编码工具,专精于编程任务。它通过结合强化学习和蒙特卡洛树搜索技术,实现了从伪代码到完整代码的生成,并通过测试用例生成器和过程奖励模型优化代码质量。该工具支持自动化代码生成、代码质量提升、教育辅助以及软件测试等多种应用场景。

Globe Explorer

一款新型的旨在提供个性化和视觉化搜索结果的AI搜索工具。简而言之,它是谷歌搜索引擎、Perplexity AI 和维基百科之间的综合体。

晓象AI

通过与博主合作,复制博主的AI分身,通过模拟知识博主的声音、风格和表达方式,为每个粉丝提供量身定制的回答。

Ciallo TTS

Ciallo TTS是一款开源的文本转语音工具,支持300多种语言和口音,提供语速、语调调节功能,并具备即时试听和长文本处理能力。适用于学习、工作、创作等场景,提升信息获取与内容制作的效率。

MnnLlmApp

MnnLlmApp 是阿里巴巴基于 MNN-LLM 框架开发的开源 Android 应用,支持多种大语言模型在本地运行。具备多模态交互能力,可处理文本、图像、音频等多种输入输出任务。应用经过 CPU 推理优化,运行效率高,支持离线使用,保障数据安全。内置 Qwen、Gemma、Llama 等主流模型,适用于内容创作、智能助手、语言学习及创意设计等多种场景。

Tutor AI

Tutor AI 是一款基于人工智能技术的个性化学习平台,通过智能算法为用户提供定制化学习路径、实时反馈及互动式教学,覆盖多学科领域,旨在提升用户的学习效果和自主学习能力,适用于学术、职业、语言学习及兴趣探索等多种场景。 ---

WorldCraft

WorldCraft是一款基于大型语言模型的3D世界创建系统,支持用户通过自然语言交互快速生成和调整虚拟场景。其核心模块包括物体定制、场景布局优化和轨迹控制,具备高精度的几何与纹理控制能力。系统兼容多种3D生成工具,适用于建筑设计、影视娱乐、教育等多个领域,为非专业人士提供高效、直观的创意设计解决方案。

OmniCam

OmniCam 是一种基于多模态输入的高级视频生成框架,结合大型语言模型与视频扩散模型,实现高质量、时空一致的视频内容生成。支持文本、视频或图像作为输入,精确控制摄像机运动轨迹,具备帧级操作、复合运动、速度调节等功能。采用三阶段训练策略提升生成效果,并引入 OmniTr 数据集增强模型性能。适用于影视、广告、教育及安防等多个领域,提高视频创作效率与质量。

Matrix3D

Matrix3D 是一种由多所高校与科技企业联合开发的统一摄影测量模型,集姿态估计、深度预测、新视图合成与3D重建于一体。其核心技术为多模态扩散变换器,支持跨模态数据融合与灵活任务处理。通过掩码学习策略,提高数据利用效率并增强模型泛化能力。适用于VR/AR、游戏开发、影视制作等领域,具有高度交互性和灵活性。

Enhance

Enhance-A-Video是一款由多所顶尖高校联合研发的视频生成增强算法,专注于提升AI生成视频的质量,特别是在对比度、清晰度及细节真实性方面具有显著优势。其核心技术基于时间注意力机制优化,无需额外训练即可高效提升视频效果,适用于视频创作、学术研究、在线平台等多个领域。