教育

DiffSensei

DiffSensei是一款由北京大学、上海AI实验室及南洋理工大学联合开发的漫画生成框架,它结合了基于扩散的图像生成技术和多模态大型语言模型(MLLM)。该工具能够根据用户提供的文本提示和角色图像,生成具有高精度和视觉吸引力的黑白漫画面板,支持多角色场景下的互动与布局调整。其核心技术包括掩码交叉注意力机制、对话布局编码以及MLLM作为特征适配器等,广泛应用于漫画创作、个性化内容生成、教育和培训等领

FantasyTalking

FantasyTalking是一种由阿里巴巴AMAP团队与北京邮电大学联合开发的AI工具,能够从静态肖像生成高质量、可动画化的虚拟形象。该工具采用双阶段视听对齐策略,结合面部专注的交叉注意力模块和运动强度调制模块,实现精准口型同步、丰富表情生成及全身动作控制。支持多种风格和姿态,适用于游戏、影视、VR/AR、虚拟主播及教育等领域。

Gizmo

帮助你记住你学过的所有东西

National Gallery Mixtape

National Gallery Mixtape 是伦敦国家美术馆与 Google Arts & Culture 合作推出的 AI 音乐实验工具。用户可从 200 幅精选名画中选择最多 6 幅,AI 会分析画作的色彩、主题、情感和历史背景,生成匹配的音乐片段。用户可调整音量、顺序和叠加方式,并通过风格、乐器和心情标签定制音乐氛围。该工具基于谷歌 Gemini 模型,提供实时互动体验,适用于教育、艺

Instance AI

Instance AI是一款通过角色扮演、模拟人生来沉浸式学英语的App,这款App采用剧本学习法,为用户提供沉浸式英语学习体验。涵盖职场、社交、恋爱等丰富场景,让用户在实际应用中无痛...

ScribbleDiff

ScribbleDiff是一种创新的文本到图像生成技术,通过涂鸦分析和传播算法,将用户简单的涂鸦转换为高质量的图像。其核心技术包括矩对齐和涂鸦传播,确保生成图像的方向一致性与细节完整性。ScribbleDiff支持多种应用场景,如艺术创作、游戏开发、教育、广告设计和UI/UX设计,为用户提供直观、高效且无须额外训练的图像生成体验。

k1.5

k1.5 是月之暗面推出的多模态思考模型,具备强大的数学、代码、视觉推理能力。在 short-CoT 模式下,性能超越主流模型 550%,在 long-CoT 模式下达到 OpenAI o1 水平。支持文本与图像的联合处理,适用于复杂推理、跨模态分析、教育、科研等领域。通过长上下文扩展和策略优化,提升推理效率与准确性。

Scribe

Scribe 是由 ElevenLabs 推出的高精度语音转文本模型,支持 99 种语言,具备多说话者区分、非语言事件检测和单词级时间戳功能。输出结构化的 JSON 数据,适用于会议记录、字幕生成、内容创作等多种场景,广泛应用于教育、客服及媒体领域。

DrawingSpinUp

DrawingSpinUp 是一种基于深度学习的3D动画生成技术,可将平面绘画转化为动态三维动画,同时保持原画风格。其核心技术包括轮廓线去除、几何细化、纹理合成及3D模型重建,适用于数字艺术、游戏开发、影视特效以及教育领域,大幅提升了创作效率和视觉表现力。

Pi智能演示文档

Pi是一款利用AI技术提升演示文档创作效率的互动内容平台,支持多种内容生成模式(一句话生成、文件导入、URL导入),并配备智能编辑器与多终端适配功能。它提供了丰富的主题配色与组件素材,可帮助用户快速创建高质量的专业演示文档,广泛应用于商务、教育和个人场景中。